trf 4.10安装与使用-生信工具42

ops/2025/1/12 3:31:45/
01 背景

DNA 中的串联重复(Tandem Repeat)指的是两个或多个相邻且近似的核苷酸模式的拷贝。Tandem Repeats Finder (TRF) 是一个程序,用于定位并显示 DNA 序列中的串联重复。用户只需提交一个以 FASTA 格式编写的序列,无需指定重复模式、模式大小或其他参数。程序输出两个文件:一个重复表格文件和一个比对文件。

重复表格文件可以在网页浏览器中查看,包含每个重复的相关信息,包括其位置、大小、拷贝数量和核苷酸组成。点击表格条目中的位置索引,可以打开另一个浏览器页面,显示重复序列与共识模式的比对结果。程序运行速度非常快,可在几秒钟内分析约 0.5Mb 的序列。提交的序列长度可以是任意的,程序可以检测模式大小范围在 1 到 2000 个碱基之间的重复。

02 参考
https://github.com/Benson-Genomics-Lab/TRF   #官网
https://tandem.bu.edu/trf/trf.html    #官网2
03 安装

编译指南

编译 TRF 需要:

  • C 编译器(如 gccclang),并安装标准库。
    TRF 已在基于 UNIX 的系统(如 Linux 和 macOS)以及 Windows 的 Cygwin/MinGW 环境中进行了测试。

简略编译步骤(高级用户):

# 检查实际版本
tar xzvf trf-4.10.0.tar.gz
cd trf-4.10.0
mkdir build
cd build
../configure
make
# 安装到系统
sudo make install
# 或将二进制文件复制到其他目录
cp src/trf DESTINATION

从仓库克隆的替代方法:

git clone https://github.com/Benson-Genomics-Lab/TRF.git
cd TRF

逐步编译:

  1. 打开终端,切换到克隆的 TRF 仓库目录。
  2. 创建名为 build 的目录:mkdir build,并切换到该目录。
  3. 运行 ../configure
  4. 运行 make
  5. 如果希望安装可执行文件,运行 sudo make install,否则只需从 build/src 目录中复制生成的二进制文件。

conda安装

conda install bioconda::trf
04 使用
trf File Match Mismatch Delta PM PI Minscore MaxPeriod [options]
参数详细说明:File:输入序列文件(FASTA 格式)。
Match, Mismatch, Delta:用于 Smith-Waterman 比对的匹配、错配、插入/删除的权重。推荐值为 Match=2, Mismatch=7, Delta=7。
PM, PI:匹配和插入/删除的概率。推荐值为 PM=80, PI=10。
Minscore:最小比对得分。
MaxPeriod:最大模式长度。
选项:
-m:生成掩码序列文件(重复序列位置标记为 N)。
-f:记录重复的两侧序列。
-d:生成 .dat 数据文件(文本格式,适合进一步处理)。
-h:禁止生成 HTML 输出。
-l <n>:指定最大重复长度(单位:百万碱基,默认值为 2)。
-u:显示帮助信息。
-v:显示版本信息。
05 常用参数

运行 TRF 的可执行文件测试文件 test_seqs.fasta,命令如下(假设可执行文件名为 trf):

trf test_seqs.fasta 2 5 7 80 10 50 2000 -l 10

这将生成 9 个文件,其中包括:

  • test_seqs.fasta.2.5.7.80.10.50.2000.summary.html
  • 若干 .html 文件和 .txt.html 文件,显示重复信息及比对结果。

推荐的命令行如下:

trf yourfile.fa 2 5 7 80 10 50 2000

运行后,将生成两个或多个 HTML 文件,可使用浏览器查看重复表格和比对结果。

输出说明

表格解释:

重复表格包含以下信息:

  • 重复序列的索引。
  • 模式长度(周期)。
  • 拷贝数量。
  • 模式的共识序列大小。
  • 匹配百分比。
  • 插入/删除百分比。
  • 对齐得分。
  • 各碱基的组成百分比。
  • 熵(基于碱基组成计算)。

比对解释:

比对文件包含:

  • 每个周期的序列与共识序列的比对。
  • 插入/删除(用 - 表示)和错配(用 * 表示)。
  • 邻接碱基的匹配统计。
06 引用

Benson G.
Tandem repeats finder: a program to analyze DNA sequences.
Nucleic Acids Res. 1999; 27(2):573–580. doi:10.1093/nar/27.2.573


http://www.ppmy.cn/ops/149334.html

相关文章

视频转码对画质有影响吗?视频融合平台EasyCVR支持哪些转码格式?

视频转码过程是将视频文件从一种编码格式转换为另一种格式的过程&#xff0c;这一过程在现代数字媒体中扮演着至关重要的角色。众所周知&#xff0c;视频转码不仅仅是简单的格式转换&#xff0c;它涉及多个关键参数的改变&#xff0c;例如视频编码格式、比特率、分辨率以及帧率…

Linux第一个系统程序---进度条

进度条---命令行版本 回车换行 其实本质上回车和换行是不同概念&#xff0c;我们用一张图来简单的理解一下&#xff1a; 在计算机语言当中&#xff1a; 换行符&#xff1a;\n 回车符&#xff1a;\r \r\n&#xff1a;回车换行 这时候有人可能会有疑问&#xff1a;我在学习C…

微信小程序防止重复点击事件

直接写在app.wpy里面&#xff0c;全局可以调用 // 防止重复点击事件preventActive(fn) {const self this;if (this.globalData.PageActive) {this.globalData.PageActive false;if (fn) fn();setTimeout(() > {self.globalData.PageActive true;}, 3000); //设置该时间内…

Saas数据库迁移单租户数据

1、背景 租户使用Saas系统&#xff0c;用一段时间后要将系统、数据搬迁到自建服务器。该Saas系统没有按租户分库&#xff0c;且数据库数据量太大&#xff0c;需要将单租户的数据抽取出来。Saas系统使用Mysql5.7数据库&#xff0c;主要使用INFORMATION_SCHEMA.COLUMNS表进行数据…

scrapy爬取图片

scrapy 爬取图片 环境准备 python3.10scrapy pillowpycharm 简要介绍scrapy Scrapy 是一个开源的 Python 爬虫框架&#xff0c;专为爬取网页数据和进行 Web 抓取而设计。它的主要特点包括&#xff1a; 高效的抓取性能&#xff1a;Scrapy 采用了异步机制&#xff0c;能够高效…

2024年度漏洞态势分析报告,需要访问自取即可!(PDF版本)

2024年度漏洞态势分析报告&#xff0c;需要访问自取即可!(PDF版本),大家有什么好的也可以发一下看看

【DES加密】

什么是DES DES(Data Encryption Standard) 是一种对称加密算法。它的设计目标是提供高度的数据安全性和性能。 DES的概念 DES使用56位的密钥和64位的明文块进行加密。DES算法的分组大小是64位&#xff0c;因此&#xff0c;如果需要加密的明文长度不足64位&#xff0c;需要进…

C#中的Null注意事项

一、开启 C# 的 null 探险之旅 在 C# 编程的奇妙世界里&#xff0c;null 就像是一个神秘莫测的幽灵&#xff0c;时不时冒出来给我们制造一些意想不到的 “惊喜”。它看似简单&#xff0c;仅仅表示 “没有值”&#xff0c;却常常在不经意间引发各种让人头疼的错误&#xff0c;让…