宋河顺手开了一个新程序,按伊雷马实验室数据,同步复现药物预测流程。
别人做的成果,他不敢全盘接收,还是亲自上手验证一下稳妥!
首先是经典的ddIs预测,即药物-药物相互作用,探讨病人短时间服用多种药物后,产生的复合效应。
当初在京海大学实验室,吕承恩讲过中药预测五原则,相反为制、相畏为制、相喜为制、相资为制、相恶为制,也是药物和药物相互作用的原理,只不过现代的ddIs预测深入到分子层面了。
之前宋河看相关论文时,见过基于图卷积神经网络的ddIs预测,以及基于平衡理论的预测。
前者太片面,只考虑邻接矩阵元素。而后者则太绝对,总结起来就是“朋友的朋友是朋友”、“朋友的朋友是敌人”,但实际的药物研发中,关系远比平衡理论要错综复杂。
电脑屏幕上,伊雷马实验室居然两种方法都弃之不用,赫然使用了新方法进行ddIs预测!
宋河研读许久,基本明白了思路……大数据库推导!
伊雷马实验室尝试将海量化合物进行拓展,梳理出亲戚关系,画出一个壮观的树状图,每个枝丫都连接一种相似的化合物。
之后,再通过已经确定的化合物药用特性,大胆猜测未知化合物的药效。
这感觉好比,知道丈夫是生物学家,知道妻子是短跑运动员,于是便猜测这对夫妻将来的孙子能够……一边短跑冲刺一边手拿显微镜观察细菌……
本质上还是瞎猜药物,但在瞎猜中多了一丝丝牵强附会的推理。
“好难!”宋河吐槽。
他在帖子里寻找伊雷马实验室用的大数据库。
找了半天……没找到?
“怪不得呢!原来公布的只是边缘数据,最核心的没公布啊!”宋河摇头失笑。
没办法,他只得尝试自己搜集数据库。
他先在网上寻找,用过相似工作方式的科研团队。
花了许久,总共找到两个。
一个是千度公司合作的研发团队,通过大量食管癌病人的数据,寻找到22个显着突变基因,随后预测关联出可行的药物信息。
一个是mSK癌症中心,开发了一个体细胞突变相关的知识库,收录了大量靶向药。
“都是做癌症的数据库,用不上啊!”宋河挠头。
思前想后,他掏出手机,找相晓桐老师场外求助。
“老师,我需要一个安眠药相关的大数据库,做药物预测用,您知道从哪能弄到吗?学生万谢!”
刚发消息,宋河马上后悔,大半夜的,会不会打扰老师休息?
没想到过了几秒,回复便来了。
相晓桐:“我知道谭西教授的团队自建了一个安眠药数据库,但谭西那人小心眼,断不可能提供给你。”
相晓桐:“这样吧,我团队里有黑客,帮你上网抓一些相关数据下来,能抓多少不确定,你做个参考。”
宋河连忙回复,“谢谢老师!学生简直不知道该怎么感谢您好了!”
相晓桐:“回头跟着我学脑的时候,好好干活就行。”
一小时后,相晓桐一股脑扔来大堆数据文件。
宋河打开看,每一份文件均为庞然大物!
海量的数据,杂乱不堪,有他想要的化合物分析,有奇奇怪怪的废数据,大部分来自世界各地医药组织的数据库,千奇百怪的语言齐聚一堂,光是机翻都要很久。
如果自己单独干,仅仅梳理完这些数据,恐怕都得拖到过年!
宋河幽幽长叹一声,看来这次做短眠药,必须雇佣实验团队了!
和军用的环形山炸药不同,短眠药这东西主要是商业价值,无需过于水泄不通的保密措施,招些可靠的人手来干活,注意分工即可。
宋河在反间谍教材上,学过一种行之有效的保密方法,盲人摸象法。