小主,
也就是所谓的蛋白质折叠问题。
这下听起来就容易了不少,因为人类的蛋白质氨基酸排列我们已经全部知晓了,那就开推呗!
但进入三维结构,百来个氨基酸至少能有10的三百次方可能,这个问题比围棋的可能性稍微好点,但也够要命的。
因为围棋你只要赢了对面的臭棋篓子就行,穷不穷举不是目的。
但现在,你可是要找出那个唯一结构的,这个可必须找对了才有意义。
这个问题从安芬森法则提出以来,四十年都没什么大的突破,因而从1994年开始,就有人在举办一个名叫CASP的蛋白质结构预测比赛,两年一届。
今年14年是第十一届了。
比赛开始前,主办方会收集百个左右最新实验测定成功的新蛋白质,这些内容外界基本上绝无可能知晓分毫。
把这些新内容作为比赛的内容,交给参赛者们去预测。
最后,根据预测的结果和实验测得的相似度,看谁的预测更加贴近真实实验观测到的。
这个相似分数要到达90以上,这种预测才称得上是像样的答案。
可目前,这个赛事的最好结果普遍还在60左右。
而阿尔法fold和阿尔法fold2的结果则高达70多与恐怖的92左右。
相似度超过92,意味着与原本实验室测定的误差可能也就只有一两个原子的区别了。
属于是测定误差的范围之内,这种情况下,究竟谁才是正确的,都没有人可以确定。
这样伟大的研究前世被开源,孟繁岐也仔细研读过。主要结构没有那么复杂,做出来问题不大。
如今他唯一的担忧只是自己的复现结果距离92会有多少的差距,毕竟现在的数据差了六七年,这是个不小的劣势。