“已经有几周了,杰夫抓大型工程,安德烈抓方法突破。谷歌那么大个公司,干活的全是在读的学生。”贾扬清这句玩笑话倒也没说错,谷歌很擅长薅名校在读实习生的羊毛。
“我可等不及TF出来了,我需要你的帮助,为Caffe添加并优化几种新的算子。”孟繁岐直截了当,阿尔法fold和fold2中,有一些算子是目前Caffe没有的,孟繁岐需要首先解决这个问题,才能够开始后续的任务。
这对孟繁岐本身来说,可能需要好几天的时间,但对贾扬清来说,只要孟繁岐描述清楚,那也就是半天的事情。
解析蛋白质的结构,这一件事情对普通人来说,就是一句每一个字都认识,但合起来就看不懂了的话。
但对施一公,应该有所耳闻。施一公,就是国际着名的结构生物学家。
他有许多在自然和科学杂志上的研究,主要内容和贡献就是解析了一些复合物的结构。
2021年,施一公院士就公开表态,人工智能对蛋白质结构的预测是本世纪最重要的科学突破之一。
先不提原理,这个重要性一下子就出来了。
蛋白质是一切生命活动的基础,人体中许多重要的生物学功能都基于蛋白质,比如血红蛋白在血液中运输氧气,抗体在免疫系统里消灭细菌,激素调节身体活动等。
为了想要了解这些行为的原理,分析到底如何能够改善各种身体的机能,就需要了解这些对应的蛋白质到底是什么结构,它到底长什么样。
作为非常基本非常基础的身体单元,蛋白质的结构不同,自然就会使得它的功能不同。
而这种解析,可从来都不是什么容易的事情。
什么非常高大上的X射线晶体衍射,冷冻电镜一起上,需要海量的时间和金钱不说,解析的效率也不高。
几十年过去了,目前解析出来的比例大约也只在三分之一左右。
想要这样把人类的蛋白质全解析完,那可要了老命了。
到底为什么这个难题如此困难如此棘手,主要是因为,人们需要去预测的是蛋白质的空间结构。
这东西它是3D的。
让人工智能协助分析成为可能的,是蛋白质的一种特性,那就是六十年前的一个发现,也就是安芬森法则:蛋白质的一级结构会决定他的三维空间结构。
这让蛋白质结构的分析问题成为了一个人工智能非常擅长的任务,就是从一种蛋白质的氨基酸序列去猜测这种蛋白质的空间结构长什么样子。