Rdkit|SMARTS语言应用

news/2024/11/16 19:26:22/

github:地址

文章目录

  • Rdkit|SMARTS语言应用
    • 子结构搜索HasSubstructMatch(patt)
    • 得到子结构序列`GetSubstructMatch`
    • 删除子结构`AllChem.DeleteSubstructs(m,patt)`
    • 取代基替换`AllChem.ReplaceSubstructs(m, patt, rep)`
    • 显示核心结构
    • 显示侧链结构 `Chem.ReplaceCore`
    • 分子拆分
      • Mol本身为多个分子组成
      • 通过分子键拆分骨架`Chem.FragmentOnBonds`
    • Murcho分解`MurckoScaffold.GetScaffoldForMol`
    • 參考

Rdkit|SMARTS语言应用

from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem import Draw
from rdkit.Chem.Scaffolds import MurckoScaffoldmol = Chem.MolFromSmiles("c1ccc(OC)cc1OC")
Chem.Draw.MolToImage(mol, size=(300,300))

子结构搜索HasSubstructMatch(patt)

  • quer:需要检索的片段
  • recursionPossible: (可选)
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

patt = Chem.MolFromSmarts("OC") # # 导入甲氧基子结构
flag = mol.HasSubstructMatch(patt)
if flag:print("molecu m contains group -OCH3")
else:print("molecu m don't contain group -OCH3")

得到子结构序列GetSubstructMatch

  • query: 需要查询的分子
  • useChirality: 能够在匹配中使用立体化学
  • useQueryQueryMatches: 使用查询-查询匹配逻辑

smiles_list= ['CCCCC', 'CCNOCC', 'CSCCNC', 'COOCCNS', 'CSNNSP', 'CCCCS']
mol_list = [Chem.MolFromSmiles(x) for x in smiles_list]
Chem.Draw.MolsToGridImage(mol_list)

## 匹配特定模式的分子
query = Chem.MolFromSmarts('C*C')
match_list = [mol.GetSubstructMatch(query) for mol in mol_list]
print(match_list)
Chem.Draw.MolsToGridImage(mols=mol_list, highlightAtomLists=match_list, molsPerRow=3)

删除子结构AllChem.DeleteSubstructs(m,patt)

  • mol: 需要修饰的分子
  • query: 要用作子结构查询的分子
  • onlyFrags: (可选)如果设置了此切换,则只有在查询匹配原子所在的整个片段时,才会删除原子。默认值为0(删除原子,无论整个片段是否匹配)
  • useChirality:(可选)使用手性匹配子结构查询

del_mol = AllChem.DeleteSubstructs(mol, patt)
mols = [mol, del_mol]
Draw.MolsToGridImage(mols, molsPerRow=4, subImgSize=(200,200),legends=['' for x in mols])

取代基替换AllChem.ReplaceSubstructs(m, patt, rep)

  • mol: 待修饰的分子
  • query: 要用作子结构查询的分子
  • replacement: 用作替代物的分子
  • replaceAll: (可选)如果设置了此切换,则所有子结构匹配,查询将被替换为单个结果,否则每个结果都将包含单独的替代品。
  • replacementConnectionPoint: (可选)应该与之建立键的置换中原子的索引。
  • useChirality: (可选)使用手性匹配子结构查询

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]for r in repsmis:r_mol = Chem.MolFromSmarts(r)res = AllChem.ReplaceSubstructs(mol, patt, r_mol)mols.extend(res)smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

patt = Chem.MolFromSmarts("OC")
repsmis = ['F','Cl','Br','O']
mols = [mol]for r in repsmis:r_mol = Chem.MolFromSmarts(r)res = AllChem.ReplaceSubstructs(mol, patt, r_mol, replaceAll=1)mols.extend(res)smis = [Chem.MolToSmiles(mol) for mol in mols]
mols = [Chem.MolFromSmiles(smi) for smi in smis]
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(200,200), legends=[x for x in smis])

显示核心结构

Chem.ReplaceSidechains(m1,core) : 我们需要定义分子对象,骨架分子; 然后执行ReplaceSidechains函数,删除侧链就能得到骨架可视化。

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • useChirality: (可选)使用手性匹配子结构查询

mol = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceSidechains(mol,core)
Draw.MolToImage(tmp, size=(250,250))

显示侧链结构 Chem.ReplaceCore

  • mol: 需要修饰的分子
  • coreQuery: 用作识别核心的子结构查询的分子
  • matches: mol.GetSubstractMatch(…)返回的类型的匹配向量
  • replaceDummies: 切换替换与查询中的虚设匹配的原子
  • labelByIndex: 切换使用连接到的核心原子的索引标记连接点伪原子。
  • requireDummyMatch: 如果分子的侧链连接在没有用假人标记的点上,它将被拒绝(返回“None”)

m1 = Chem.MolFromSmiles('BrCCc1cncnc1C(=O)O')
core = Chem.MolFromSmiles('c1cncnc1')
tmp = Chem.ReplaceCore(m1, core, labelByIndex=True)
print(tmp)
print(Chem.MolToSmiles(tmp))
Draw.MolToImage(tmp,size=(250,250))

分子拆分

Mol本身为多个分子组成

  • mol: 要使用的分子
  • asMols: 可选)如果提供了这一点并且为真,则碎片将作为分子而不是原子id返回。
  • sanitizeFrags: (可选)如果提供了这一点并且是真的,则碎片分子将在返回之前进行净化。
  • frags:(可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时结果将为mol.GetNumAtoms()长,并且将包含每个Atom的片段分配
  • fragsMolAtomMapping: (可选,默认为None)如果asMols为true,并且这是以空列表的形式提供的,则返回时的结果将是numFrags long,并且每个条目都将包含该片段中原子的索引:[(0,1,2,3),(4,5)]

rs = Chem.GetMolFrags(tmp, asMols=True)
print(len(rs))  # 2
smi0 = Chem.MolToSmiles(rs[0])
print(smi0)  # *CCBr
smi1 = Chem.MolToSmiles(rs[1])
print(smi1)  # [5*]C(=O)O

通过分子键拆分骨架Chem.FragmentOnBonds

  • mol:需要修饰的分子
  • bondIndices: 需要破坏键的索引
  • addDummies:切换虚设原子的添加以指示键断裂的位置
  • dummyLabels:用于提供用于假人的标签。每对中的第一个元素是用于替换键的beginAtom的伪元素的标签,第二个元素是用来替换键的endAtom的伪对象的标签。如果未提供,则用原子索引标记假人。
  • bondTypes: 用于提供在片段和虚设原子之间使用的键类型。如果未提供,则默认为单个。
  • cutsPerAtom: 用于返回在每个原子上进行的切割次数。

smi='C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N'
m = Chem.MolFromSmiles(smi)
Draw.MolToImage(m)

submols = m.GetSubstructMatches(Chem.MolFromSmarts('[!R][R]')) # R表示环上的原子,即匹配环上和非环上的原子
bonds_id = [m.GetBondBetweenAtoms(x,y).GetIdx() for x, y in submols] # 找到这两个原子之间的键
frags = Chem.FragmentOnBonds(m,bonds_id) # 切割得到碎片
smis= Chem.MolToSmiles(frags)
smis = smis.split('.')
mols=[m]
for smi in smis:mols.append(Chem.MolFromSmiles(smi))
Draw.MolsToGridImage(mols, molsPerRow=3, subImgSize=(300,300),legends=['' for x in mols], useSVG=True)

Murcho分解MurckoScaffold.GetScaffoldForMol

把分子中环结构提取出来,然后保留连接环结构的最少的键,如果该结构上的原子是双键连接,则保留双键,得到的结构称为Murcho骨架

m = Chem.MolFromSmiles('C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N')
tmp = MurckoScaffold.GetScaffoldForMol(m)
Draw.MolsToImage([m, tmp])

參考

https://blog.csdn.net/qq_36801966/article/details/106564664


http://www.ppmy.cn/news/789698.html

相关文章

如何利用ipad高效学习python

很多博主拍过iPad作为生产力的视频,比如用iPad画漫画、记笔记、剪视频、轻办公等等,那么iPad可以用来写代码、跑Python吗? 这也是一些初学Python的小伙伴关心的问题,他们经常下载一些编辑Python的APP,试图在上面练习P…

iPadOs中键盘手势大全

iPadOS 中键盘和手势的快捷操作大全 来源:爱思助手 快速移动光标和选择文本 在支持三维触控(3D Touch)的 iOS 设备上面移动光标非常简单,弹出键盘之后,我们只需要在键盘上面重压,即可触发可以任意移动的「…

iPad常用快捷键

iPad常用快捷键 设备:iPad Pro 12.9 第三代 键盘:罗技K380 tips:部分应用中,长按cmd键会显示出当前界面应用的快捷键,学会这个就不用记那么多快捷键了 系统 单击F4/cmdh    返回主页双击F4       进入后台多任务界面 cmdtab      顺序切换后台应用 cmds…

怎么通过Mac键盘在iPhone、iPad上快速打字?

相信大家有没有遇到过这样的困扰?在工作的时候,经常需要在手机回复短信、微信、微博回复个评论,经常在手机和Mac之间来回切换,容易打断自己的节奏。那么有没有办法通过Mac的键盘当做iPhone、iPad的外置键盘呢?还真有&a…

sql练习题

作业: 1.创建表: 创建员工表employee,字段如下: id(员工编号),name(员工名字),gender(员工性别),salary(员工薪…

Mybatis Plus结合Redis实现自定义缓存

文章目录 一、准备工作1.Redis工具类2.Redis配置模版3.手动获取bean的工具类 二、Mybatis Plus结合Redis实现缓存1.自定义缓存管理类2.Mapper类加注解3.Mapper.xml文件开启二级缓存 一、准备工作 1.Redis工具类 import org.springframework.data.redis.core.RedisCallback; i…

纯正贵族,英国女王到底多有钱?

万万没想到吧,堂堂英国女王业是有私房钱的。 都说流水的首相,铁打的女王。这么多年能在英国横着走,女王到底多有钱。但凡沾上个什么二世、三世那都赛事非富即贵的。女王作为英国历史上在位时间最长的君主,英国的每一张纸币和硬币都…

维京人的秘密:残暴背后的真相,敬畏神灵死后进入英灵殿

维京人,一个充满神秘色彩的名字,勾起了人们对于古代北欧残暴战士的想象。然而,维京人究竟是如何形成这样的形象,他们的传统和习俗又是如何塑造了他们的一生呢? 首先,我们要了解维京人的生活背景。维京人生活…