化学信息学
化学信息学是一门交叉学科,研究如何使用计算机与信息技术来表示、储存、检索、分析和预测化学数据与分子性质。它结合了化学、计算机科学、数学与信息科学的原理,旨在从大量化学结构与实验数据中提取有用信息,以支持化学研究与药物发现等应用。
历史
[编辑]术语化学信息学(Cheminformatics)是1998年被F.K. 布朗[1][2]定义的:
化学信息学是这些信息资源的混合,将数据转化为信息和信息转化为知识,以便在药物导向识别和优化领域更快地做出更好的决策。
英文中,Cheminformatics和Chemoinformatics两种拼写均被使用,而使用更多的则是较短的变体——Cheminformatics[3]。最近成立的《化学信息学学报》是前者的强力推动。
基础
[编辑]化学信息学将化学,计算机科学和信息科学的科学工作领域结合在化学空间中的拓扑,化学图论,信息检索和数据挖掘领域[4][5][6][7]。化学信息学也可以应用于各种行业,如纸张和纸浆,染料和相关行业的数据分析。
应用
[编辑]存储和检索
[编辑]化学信息学的主要应用是存储,索引和搜索与化合物有关的信息。这种存储信息的有效搜索包括计算机科学中作为数据挖掘,信息检索,信息抽取和机器学习的主题。相关研究课题包括:
文件格式
[编辑]化学结构的计算机表示使用专门的格式,例如基于XML的化学标记语言或简化分子线性输入规范(SMILES)。 这些表征通常用于存储在大型化学数据库中。 虽然一些格式适用于2或3维的视觉表示,但其他格式更适合于研究物理相互作用,建模和对接研究。
虚拟化合物库(Virtual Libraries)
[编辑]化学数据可以涉及真实或虚拟分子。可以以各种方式产生化合物的虚拟化合物库以探索化学空间,并假设具有所需性质的全新的化合物。
最近使用片段优化生长(fragment optimized growth)算法生成化合物类(药物,天然产物,多样性合成产品)的虚拟化合物库[8] 。这是通过使用化学信息工具来训练马尔可夫链在真实化合物类别上的转变概率,然后使用马尔可夫链产生类似于训练数据库的全新化合物。
虚拟筛选(Virtual screening)
[编辑]与高通量筛选相比,虚拟筛选涉及通过各种方法在化合物库中进行计算筛选,例如蛋白质和蛋白质或多肽的对接,用于识别可能具有所需特性(例如针对特定靶标的生物活性) 的分子。在某些情况下, 组合化学用于化合物库的开发,以提高挖掘化学空间的效率。更常见的是,筛选多样化的小分子或天然产物库。
定量构效关系(QSAR)
[编辑]这是定量结构-活性关系和定量结构性质关系值的计算,用于预测其结构中化合物的活性。在这种情况下,化学计量学也和它有很强的关系。化学专家系统也是相关的,因为它们代表化学知识的一部分,作为计算机模拟表示。有一个相对较新的匹配分子对分析或预测驱动的MMPA的概念,它与QSAR模型相结合,以便识别活动悬崖(Activity cliffs)[9]。化学悬崖通常被定义为结构相似且对同一靶点都具有活性但药效差异较大的化合物或化合物组。
参阅
[编辑]参考资料
[编辑]- ^ F.K. Brown. Chapter 35. Chemoinformatics: What is it and How does it Impact Drug Discovery. Annual Reports in Med. Chem. Annual Reports in Medicinal Chemistry. 1998, 33: 375. ISBN 978-0-12-040533-6. doi:10.1016/S0065-7743(08)61100-8.
 - ^ Brown, Frank. Editorial Opinion: Chemoinformatics – a ten year update. Current Opinion in Drug Discovery & Development. 2005, 8 (3): 296–302.
 - ^ Cheminformatics or Chemoinformatics ?. [2017-07-01]. (原始内容存档于2017-06-21).
 - ^ Gasteiger J.(Editor), Engel T.(Editor): Chemoinformatics : A Textbook. John Wiley & Sons, 2004, ISBN 3-527-30681-1
 - ^ A.R. Leach, V.J. Gillet: An Introduction to Chemoinformatics. Springer, 2003, ISBN 1-4020-1347-7
 - ^ Alexandre Varnek and Igor Baskin. Chemoinformatics as a Theoretical Chemistry Discipline. Molecular Informatics. 2011, 30 (1): 20–32. doi:10.1002/minf.201000100.
 - ^ Barry A. Bunin (Author), Brian Siesel (Author), Guillermo Morales (Author), Jürgen Bajorath (Author): Chemoinformatics: Theory, Practice, & Products. Springer, 2006, ISBN 978-1402050008
 - ^ Kutchukian, Peter; Lou, David; Shakhnovich, Eugene. FOG: Fragment Optimized Growth Algorithm for the de Novo Generation of Molecules occupying Druglike Chemical. Journal of Chemical Information and Modeling. 2009, 49 (7): 1630–1642. PMID 19527020. doi:10.1021/ci9000458.
 - ^ Sushko, Yurii; Novotarskyi, Sergii; Körner, Robert; Vogt, Joachim; Abdelaziz, Ahmed; Tetko, Igor V. Prediction-driven matched molecular pairs to interpret QSARs and aid the molecular optimization process. Journal of Cheminformatics: 48. 2014-12-11 [2017-07-01]. doi:10.1186/s13321-014-0048-0. (原始内容存档于2015-09-07) (英语).
 
外部链接
[编辑]- (英文)印第安纳化学信息学教育门户网站
 - (英文)化学信息学学报(Journal of Cheminformatics) (页面存档备份,存于互联网档案馆)
 - (英文)OEChem化学信息学编程工具包 (页面存档备份,存于互联网档案馆)