第二百零八章 AI和计算生物学

作者:乌鸦一号 加入书签推荐本书

据维度和采集率的快速增长对传统分析策略提出了挑战。现代机器学习方法,如深度学习,承诺利用非常大的数据集来寻找其中的隐藏结构,并做出准确的预测。”

“比如我们有一个小组是专门做预测癌细胞在药物作用下的活力问题。”

“输入特征值将捕获细胞系的体细胞序列变体、药物的化学组成及其浓度汇总,它们将与测量的活力一起可用于训练支持向量机、随机森林分类器或相关的方法。”

“给定未来一个新的细胞系,学习函数通过计算函数来预测其可能的活力。”

“即便函数在我们看来更像是一個黑盒子,它的内部工作原理、为什么特定的突变组合会影响细胞生长并不容易找到背后的具体原因。”

“两个回归和分类以通过这种方式查看。”

“作为对应物,无监督机器学习方法旨在从数据样本x本身中发现模式,而不需要输出标签y。”

“类似的聚类、主成分分析和异常值检测等方法都更接近黑盒,我们目前主要应用于生物数据的无监督模型。”

郑理鼓掌道:“很好。”

其实计算生物学的进化路线,和现代法师的研究有很多相似之处。

法师们通过生物云的高频计算能力,对基因、蛋白质等构成生命的基本要素进行定性定量分析。

法师们的优势不仅在碳基计算机的运算能力和上限比硅基更高,而且来源于他们可以直接通过意志干涉物质世界。

能有更多的特殊样本和针对性诱导样本进行研究。

郑理继续问道:“其实你们目前主要使用的还是神经网络对吧?”

“卷积神经网络、循环神经网络、自动编码机这些。”

研发主管深知郑理的科研能力和所涉及领域之广泛,因此对于郑理一语把他们的关键点透丝毫不意外:

“是的,主要还是神经网络在计算生物领域的应用。”

涉及到研发层面,郑理从来都是有话直说:

“深度学习在计算生物层面的应用很早之前就开始了。”

“bengio早在2012年就开始用神经网络研究基因组学和生物图像分析,将序列变异和分子特征联系到一起了。”

“也就是说我们使用的技术,如果是外行来听,会觉得很先进,深度学习、人工智能,但是实际上这已经是十年前别人就在玩的东西。”

“我们自己有什么突破?别告诉我只是把别人的方法拿来用。”

“如果只是做到这个程度”

郑理没说完,他转头看向李渺渺:“渺渺,江城研发中心每年投入的预算是多少?”

李渺渺不假思索道:“今年给他们编的预算是17.4亿元。”

郑理点头道

上一章 返回目录 下一章