利用Jaspar进行转录因子结合位点预测

server/2024/12/31 3:56:16/

前期我们介绍了如何进行ChIP-qPCR验证,里面提到了一个比较重要的因素——扩增范围的选择及引物的设计。相比双荧光素酶、酵母单杂-点对点验证等允许完整启动子验证的实验,ChIP-qPCR要求单次验证的范围尽量控制在150-200bp内。但一个基因的启动子一般有2-3k,如果漫无目的地选择区域去验证,不仅花费的成本会很高,检测效果也会大打折扣。在没有进行前期ChIP-seq的基础上,如何对感兴趣的转录因子(TF)以及靶基因pro进行验证,以及如何筛选靶点,也成为了许多老师困惑的地方。

前期我们介绍了当拥有motif矩阵时,如何利用fimo进行结合位点预测,详见【一文GET寻找motif在序列上的定位】。这里,给大家介绍一下如何利用Jaspar去寻找感兴趣TF的motif以及利用Jaspar-scan进行结合位点预测。

 一  「 确定目标转录因子名称与靶基因启动子序列 」

要做验证,当然就要确定好验证对象。当验证对象为转录因子时,大多数老师都会将靶基因的验证区域锁定为启动子序列。那么,我们可以通过NCBI(其他数据库也行,在此以NCBI为例)去找到某个靶基因的启动子序列。我们以STAT3(TF)以及CXCL1-pro(靶基因启动子)(物种:human;参考文献:doi:10.1038/s41419-024-06843-y)作为研究对象。核心数据库JASPAR CORE包含的物种类群主要包括vertebrata(脊椎动物),insecta(昆虫),nematoda(线虫),fungi(真菌),plantae(植物)和urochordata(尾索动物)六大类。

(1)CXCL1-pro序列获取

首先在NCBI上找到这个基因的序列,注意看右上角红框部位为这个基因在对应版本基因组染色体上的位置。

图片

将染色体位置往基因上游调整2kb,即可找到它的启动子序列。这里敲重点:一定要注意这个基因是正链基因还是负链基因!两者启动子序列在染色体上的位置是不同的。例如,CXCL1是正链基因,它在染色质上的位置是NC_000004.12:73869393-73871308。那么上游2kb对应的区域就是NC_000004.12:73867393-73869392。但如果是个负链基因(在这里我们假设CXCL1是个负链基因),其启动子序列则是NC_000004.12:73871309-73873309。

图片

箭头的方向可辅助确认正/负链

图片

CXCL1-pro序列

(2)在JASPAR找到STAT3信息

JASPAR网址:https://jaspar.elixir.no/

直接在搜索框中搜索STAT3,因为案例物种是人,本文没有额外进行物种的筛选,如果有一些其他的需求,也可以点开Advanced Options增加筛选条件。

图片

如果出现一个转录因子多个motif,小数点后面的数字越大,表明版本越新(常见的转录因子,不同版本motif展示图可能差异不大,但是实际motif矩阵是不一样的,不同版本motif矩阵预测结果不一定一致)。本文以MA0144.3为例。

图片

 二   「 利用Jaspar-scan进行结合位点预测 」

勾选想要分析的版本,点击页面右边Scan,将前面找到的CXCL1-pro序列输入进去(如果不是启动子,想分析其他区域序列,请注意输入的序列范围需<3Kb)。这里注意不要只输入序列,序列title(>xxx)也需要一起输入才表示这是个fasta格式文件。相对评分阈值(Relative profile score threshold)数据库默认为80%,这个值代表数据库认为结合位点的可信度,这里因为结果比较多,我们调整为85%。确认好相关信息后点击scan。

图片

随后的页面就会跳转为预测结果,重点主要关注相对评估值(Relative Score)以及后面预测的位点。这里以前三为例展示一下在CXCL1-pro中的具体位置。注意,打分排名第二名为负链结合(strand:-),在对应序列时是反向互补配对(DNA为双链,motif结合在启动子负链上也是可能的)。

图片

图片

预测打分前三序列定位

这样就做完了结合位点的预测,找到的结合位点就可以用于后期进行ChIP-qPCR、EMSA等需要具体靶点实验的引物/探针设计了。当然,预测结果仅供参考,建议还是同时结合文献、ChIP测序等结果来挑选位点哦!对ChIP-qPCR感兴趣的老师也可以参考我们的公众号推文——【如何进行ChIP-qPCR富集验证】。

图片


http://www.ppmy.cn/server/154191.html

相关文章

自动化办公-合并多个excel

在日常的办公自动化工作中&#xff0c;尤其是处理大量数据时&#xff0c;合并多个 Excel 表格是一个常见且繁琐的任务。幸运的是&#xff0c;借助 Python 语言中的强大库&#xff0c;我们可以轻松地自动化这个过程。本文将带你了解如何使用 Python 来合并多个 Excel 表格&#…

基于Springboot的养老保险管理系统的设计与实现

博主介绍&#xff1a;java高级开发&#xff0c;从事互联网行业六年&#xff0c;熟悉各种主流语言&#xff0c;精通java、python、php、爬虫、web开发&#xff0c;已经做了多年的设计程序开发&#xff0c;开发过上千套设计程序&#xff0c;没有什么华丽的语言&#xff0c;只有实…

python语音机器人(青云客免费api)

强调&#xff1a;不用登录注册&#xff0c;直接使用就好 青云客智能聊天机器人API python代码&#xff0c;直接可以运行&#xff1a; 1、安装库&#xff1a; pip install requests pyttsx3 SpeechRecognition sounddevice numpy scipy2、完整代码&#xff1a; import request…

Gitlab17.7+Jenkins2.4.91实现Fastapi/Django项目持续发布版本详细操作(亲测可用)

一、gitlab设置&#xff1a; 1、进入gitlab选择主页在左侧菜单的下面点击管理员按钮。 2、选择左侧菜单的设置&#xff0c;选择网络&#xff0c;在右侧选择出站请求后选择允许来自webhooks和集成对本地网络的请求 3、webhook设置 进入你自己的项目选择左侧菜单的设置&#xff…

elasticsearch-java客户端jar包中各模块的应用梳理

最近使用elasticsearch-java客户端实现对elasticsearch服务的Api请求&#xff0c;现对elasticsearch-java客户端jar包中各模块的应用做个梳理。主要是对co.elastic.clients.elasticsearch路径下的各子包的简单说明。使用的版本为&#xff1a;co.elastic.clients:elasticsearch-…

二分和离散化

为什么把二分和离散化放一起&#xff1a;因为离散化其实是一种二分整数的过程。 二分 相信大家都接触过二分查找&#xff08;折半查找&#xff09;&#xff0c;这就是二分的思想。 二分通过每次舍弃一半并不存在答案的区间&#xff0c;进而快速锁定要求的答案&#xff08;二…

Modern C++ std::atomic简介

文章目录 为什么选择 std::atomic?std::atomic 的主要特性1. 支持多种操作2. 灵活的内存序3. 支持多种类型 实践篇&#xff1a;std::atomic 的使用场景环境要求场景 1&#xff1a;如何用 std::atomic 实现线程安全计数器示例需求使用 std::atomic 的高效实现 场景 2&#xff1…

深度学习blog-卷积神经网络(CNN)

卷积神经网络&#xff08;Convolutional Neural Network&#xff0c;CNN&#xff09;是一种广泛应用于计算机视觉领域&#xff0c;如图像分类、目标检测和图像分割等任务中的深度学习模型。 1. 结构 卷积神经网络一般由以下几个主要层组成&#xff1a; 输入层&#xff1a;接收…