2020.9.17丨Chip-seq结果可视化之peak检测(下)

news/2024/10/18 12:20:58/
  • 这一部分是使用deeptools对样品进行相关性分析以及主成分分析,同时从peak中去挖掘motif。我使用的工具是MEME-ChIP,MEME是一个工具系列,挖掘motif的工具比较丰富,MEME、DREME、TomTom、MEME-ChIP,其中MEME-ChIP可以同时调用其他几个工具进行综合分析,比较方便。
  • deeptools是一个很好用的深度分析工具,中文版使用手册可以让你快速上手(虽然翻译有些直,但竟然看得懂!)。在进行相关性分析和主成分分析之前,需要对样品数据进行一个综合统计,deeptools也为我们提供了统计函数
    • 运行代码
      • multiBamSummary \--bamfiles testFiles/*bam \ # using all BAM files in the folder--minMappingQuality 30 \--region 19 \ # limiting the binning of the genome to chromosome 19--labels H3K27me3 H3K4me1 H3K4me3 HeK9me3 input \-out readCounts.npz --outRawCounts readCounts.tab

         

  • 生成样品相关性热图
    • 运行代码
      • plotCorrelation -in readCounts.npz --corMethod spearman --skipZeros --plotTitle "Spearman Correlation of Read Counts" --whatToPlot heatmap --colorMap RdYlBu --plotNumbers -o heatmap_SpearmanCorr_readCounts.png --outFileCorMatrix SpearmanCorr_readCounts.tab
    • 图示
  • 生成PCA成分分析图
    • 运行代码
      • plotPCA -in readCounts.npz -o PCA_readCounts.png -T "PCA of read counts"

         

    • 图示
  • 发现motif
    • 这一步需要我们先把macs2生成的narrowpeak文件中描述peak位置信息(染色体号/起始位点/终止位点;chr1/start/end)三列分割出来(有文章提到使用summer,但是我生成的summer文件位点描述有问题,其他小伙伴也可以试试),需要注意的是我们需要通过bedtools getfasta工具根据位置信息获取序列,该工具要求文件为bed格式。
    • 运行代码
      • cut -f 1,2,3 ../C1_fa_peaks.narrowPeak >C1_great.bed #对peak位置信息进行分列,生成bed文件
        bedtools getfasta -fi Mus_musculus.GRCm38.dna.toplevel.fa -bed C1_great.bed > C1_motif.fa
         
      • 可以使用MEME进行motif挖掘,通过在线工具运行一次后获得默认参数
        • meme C1_motif.fa -dna -oc . -nostatus -time 18000 -mod zoops -nmotifs 3 -minw 6 -maxw 50 -objfun classic -revcomp -markov_order 0

           

      • 图示(还是觉得MEME-ChIP分析更丰富一些,这里只截图了一部分内容)
  • 最后,还可以直接将peak位置信息文件上传到GREAT,使用great在线工具进行注释,获取基因与基因组的关系表

http://www.ppmy.cn/news/581060.html

相关文章

android 代码修改wifi,Android 修改WiFi热点的默认SSID和密码

修改以下代码: fraeworks\base\wifi\java\android\net\wifi下面wifiApConfigStore.Java中的 loadApConfiguration() { .... .... config.preSharedKey in.readUTF(); >修改为希望设置的字符串密码 .... .... } git df frameworks/base/wifi/java/android/net/w…

学科前沿: 儿童型丘脑胶质瘤亚群的独特DNA甲基化特征|文献科普

易点评 儿童恶性星形细胞胶质瘤具有显著的生物学和临床多样性,而这项研究证实了弥漫性胶质瘤中一个以丘脑为主的表观遗传学亚群的存在。作者将表观遗传学和遗传学相结合,通过对大量恶性胶质瘤样本进行全基因组DNA甲基化分析,发现了一组具有E…

【深入UCSC Genome Brower】他山之石

转自:https://mp.weixin.qq.com/s?__bizMzAwMzY4MTYxNw&mid2655752921&idx1&sn159f79dde58d2145c59307e23a06b97a&scene0#wechat_redirect 这是一个神奇的网站:UCSC Genome Brower 有朋友在后台留言让介绍下UCSC Genome Browser&#x…

群体表观遗传差异

群体表观遗传差异 本文为文献阅读笔记,以下内容有个人理解,可能和原文有出入,未经允许,禁转载。 文献:Genetic source of population epigenomic variation Nature Reviews Genetics 2016 影响因子15 用chromatin s…

300黑客共闯沙盒|赛宁数字化靶场助力第十六届全国大学生信息安全竞赛

6月24日,由中央网信办网络安全协调局指导、教育部高等学校网络空间安全专业教学指导委员会主办、福州大学承办的第十六届全国大学生信息安全竞赛—创新实践能力赛华东南分区选拔赛(简称“分区赛”)圆满结束。赛宁网安基于数字化靶场打造的“赛…

window7+blackberry模拟器+i3(联想k27) == 悲剧

现象就是屏幕区域,只刷新焦点那块,而不是整块刷新,比如此标点下去后,就只有此标大小那块区域在刷新.其它没变化. 只有最小化后再还原后才正常. 感觉虚拟机还是不太好用.至少我没在其它应用程序中看到这样现象. 升级了i3的显卡驱动.发现情况好转点. 但是根本现象没解决.影响使用…

表观修饰的“当红炸子鸡” - 组蛋白乳酸化

组蛋白是核小体的组成单位,真核生物的一个核小体由组蛋白H2A,H2B,H3和H4形成的八聚体以及缠绕在上面的DNA组成。在组蛋白的N端尾部会发生大量的翻译后修饰,例如甲基化、乙酰化、泛素化等。不同的组蛋白修饰对机体会有不同的功能&a…

超级增强子鉴定

增强子被定义为增强子标记的峰区,如H3K27ac和H3K4me1,它们位于距注释转录起始位点(TSS)至少2 kb的位置。 将12.5 kb内的增强子峰缝合为一簇,计算每个增强子的H3K27ac结合强度,用于进一步的信号排序&#x…