第二百零八章 AI和计算生物学(1 / 2)

目前只有华国的魔法师们对魔法的本质有些微了解。

他们在新一代科技革命中占据了先手。

这种先手虽然只是随时可以被突破的信息优势,但是有优势总比没有好。

“我们先形成工作汇报,报给上面决策,现在最重要的是要拖住郑理,让他别太早回去。”

“好,我去安排。”

华国官方对郑理做过多次心理侧写和人物画像,知道郑理看似无情实际上对朋友很够意思。

......

“郑董, 我们现在主要是将自然语言处理领域中的world lattice parising概念引入到创新药研发当中。”

“通过算法设计的蛋白小分子序列在稳定性、蛋白质表达水平和制作成本上要好于传统方法。”

“这个方法早在两年前,当时斯微生物和千度研究员就mRNA疫苗开展了AI序列优化算法的合作。”

“程总是斯微生物的股东和外部董事,当时他负责牵线,把这一技术引入到狮城研究员,我们这两年下来将AI序列优化算法的应用领域拓展到了创新药研发上。”

“目前关于担保之序列设计的迭代技术还在开发中。”

郑理此时身在科创生物江城的研发中心,这里的研发主管正在向郑理汇报工作。

江城研发中心主要负责部分创新药的研发。

自从科创生物崛起后,江城大学的生物系高考分数线提高了至少二十分。

原本江城大学的生物学算是江大的王牌专业, 但是受限于出路不佳,所以分数线远不如经管院。

专业排名靠前不代表分数线高, 江大内部分数最高的专业是金融工程和数学,毕业之后可以拿金融学和数学的双学位。

科创生物在江城的研究中心,校招的主要对象就是江大和江城科技大学。

大量招收生物学毕业的硕士和博士,薪酬待遇比大米在江城的分部高了半个档次。

同时江城的研究中心还和江大的生物学院展开了很多项目合作。

江大内部私下讨论,都觉得郑理作为数学学院的毕业生,最大的蛋糕反而被生物学院吃完了。

“所以这是AI和计算生物学的应用对吧?”

对郑理的问题,江城的研发主管点头道:“是的。”

“我们目前主要做的是序列比对和蛋白质结构预测。”

“计算生物学不仅是这两个领域,还有基因识别、进化树构造等方向。”

“自从ai技术走进人们视野后,机器学习技术让计算生物学得到了极大的发展。”

“基因组学和成像技术的进步导致来自大量样本的分子和细胞分析数据的爆炸式增长。”

“生物数据维度和采集率的快速增长对传统分析策略提出了挑战。现代机器学习方法,如深度学习,承诺利用非常大的数据集来寻找其中的隐藏结构,并做出准确的预测。”

“比如我们有一个小组是专门做预测癌细胞在药物作用下的活力问题。”

“输入特征值将捕获细胞系的体细胞序列变体、药物的化学组成及其浓度汇总,它们将与测量的活力一起可用于训练支持向量机、随机森林分类器或相关的方法。”

“给定未来一个新的细胞系,学习函数通过计算函数来预测其可能的活力。”

“即便函数在我们看来更像是一個黑盒子, 它的内部工作原理、为什么特定的突变组合会影响细胞生长并不容易找到背后的具体原因。”

“两个回归和分类以通过这种方式查看。”

“作为对应物,无监督机器学习方法旨在从数据样本x本身中发现模式, 而不需要输出标签y。”

“类似的聚类、主成分分析和异常值检测等方法都更接近黑盒,我们目前主要应用于生物数据的无监督模型。”

郑理鼓掌道:“很好。”

其实计算生物学的进化路线, 和现代法师的研究有很多相似之处。

法师们通过生物云的高频计算能力,对基因、蛋白质等构成生命的基本要素进行定性定量分析。

法师们的优势不仅在碳基计算机的运算能力和上限比硅基更高,而且来源于他们可以直接通过意志干涉物质世界。

能有更多的特殊样本和针对性诱导样本进行研究。

郑理继续问道:“其实你们目前主要使用的还是神经网络对吧?”

“卷积神经网络、循环神经网络、自动编码机这些。”

研发主管深知郑理的科研能力和所涉及领域之广泛,因此对于郑理一语把他们的关键点透丝毫不意外:

“是的,主要还是神经网络在计算生物领域的应用。”

涉及到研发层面,郑理从来都是有话直说:

“深度学习在计算生物层面的应用很早之前就开始了。”

“Bengio早在2012年就开始用神经网络研究基因组学和生物图像分析,将序列变异和分子特征联系到一起了。”

“也就是说我们使用的技术,如果是外行来听,会觉得很先进,深度学习、人工智能,但是实际上这已经是十年前别人就在玩的东西。”

“我们自己有什么突破?别告诉我只是把别人的方法拿来用。”

“如果只是做到这个程度”

郑理没说完,他转头看向李渺渺:“渺渺,江城研发中心每年投入的预算是多少?”