安全技术-网络信息-氧化葡萄糖酸杆菌基因组尺度代谢网络构建.pdf
2022-05-01 14:00:07 2.4MB 文档资料 安全 网络
谢谢你的 通过 K-mer 搜索和 3' 读取扩展进行短序列组装 雷内·沃伦 2006-2021 描述 SSAKE 是一种基因组学应用程序,用于从头组装数百万个非常短的 DNA 序列。 它是一种易于使用、稳健、可靠且易于处理的组装算法,适用于短序列读取,例如 Illumina Ltd. 生成的那些。 SSAKE 算法是许多基因组学应用程序(例如 VCAKE、QSRA、SHARCGS、SSPACE、JR-Assembler)的核心,它们的设计继续激发新一代组装器(例如 JR-Assembler、PNAS 2013)。 SSAKE 的应用扩展到基因组组装之外,该技术被应用于分析 T 细胞宏基因组、靶向从头组装 (TASR)、支架(LINKS、ARCS)、HLA 分型(HLAminer),并且是在结肠癌中发现梭杆菌的关键,这一发现被《时代》杂志评为 2011 年十大医学突破之一。 根据 ICG
1
群体构成方式对大豆百粒重全基因组选择预测准确度的影响.pdf
2022-04-06 00:22:53 597KB 技术文档
OrthoFinder, 对orthologous基因组的准确推断 OrthoFinder" OrthoFinder - 精确推断 orthogroups 。orthologues 。基因树和根species树 ! 图1: 图2: 自动的OrthoFinder分析工具:做什么?OrthoFinder是比较基因组学的快速。准
2022-04-03 20:49:00 47.23MB 开源
1
GC计算 从基因组数据中计算 GC 含量和 GC 偏斜的 circos 格式数据。 用法 用法:GCcalc.py -f input.fa [-w 1000] [-s 1000] 选项:-h, --help 显示此帮助信息并退出 -f FASTA, --file=FASTA Input Fasta format file -w WINDOWSIZE, --window=WINDOWSIZE default:1000 WindowSize to calculate -s STEPSIZE, --step=STEPSIZE default:1000 StepSize for slide widows
2022-03-30 16:28:46 9KB Python
1
序列提取 通过给出基因名称从参考基因组中提取序列 rescue.py 和 seq_extract_rescue.py 一起从宇宙文件中拯救缺失的基因。 seq_extract.py 只需要文件名作为输入。 ##seq_extract_rescue.py ####先决条件文件: GTF文件(基因转换格式) 人类参考基因 宇宙基因列表或基因名称列表 ####先决条件系统: pybedtools 皮萨姆 Python 2.7 ####用法: usage: seq_extract_rescue.py [-h] -g file -t gtf_file -r ref_genome [-o STR] [-p STR] [-b INT] [-f] [-c] Extract target genes and generate bloo
2022-03-22 14:02:03 714KB Python
1
PanGP 是一种快速分析细菌泛基因组谱的工具。 它集成了两种样本算法,可以以极低的时间成本计算出几十个或几百个菌株的群体的泛基因组谱。 同时,设计了一个人性化的图形界面,PanGP可以直接绘制有关全基因组图谱的图像。
2022-02-26 14:09:32 15.99MB 开源软件
1
Geneview:用于基因组数据可视化的python软件包 Geneview是基于matplotlib的Python可视化库。 它提供了用于绘制有吸引力的基因组图形的高级界面。 现在它正在积极开发。 文献资料 例子 我们使用存储库中的数据集GOYA_preview作为以下图的输入。 这是GOYA_preview的格式预览: 曼哈顿情节的基本示例。 import matplotlib.pyplot as plt import geneview as gv df = gv.util.load_dataset('GOYA_preview') # df is DataFrame of pand
2022-02-25 19:05:38 17.94MB visualization python pandas data-visualization
1
基因组数据可用性的激增有望确定观察到的个体性状的遗传原因,并将其应用于发现表型的遗传根源等问题,无论是基因表达或代谢物浓度等分子表型,还是疾病等复杂表型。然而,这些数据集的规模不断扩大,以及相关算法的二次、三次或更高的缩放特性,带来了严重的计算挑战,需要使用领导力规模计算。在本文中,我们描述了一种执行向量相似性度量计算的新方法,适用于配备图形处理单元(GPU)或英特尔至强Phi处理器的并行系统。我们主要关注应用于全基因组关联研究(GWAS)和全表型关联研究(PheWAS)的比例相似性度量。我们描述了算法在加速处理器上的实现,用于消除对称性导致的冗余计算的方法,以及将计算有效映射到多节点并行系统的技术。 结果表明,在ORNL Titan系统上,每节点的高性能和并行可扩展性,每秒的元素比较速率超过5万亿(5×1015)。在一篇配套论文中,我们描述了用于计算比较基因组学应用的自定义相关系数的相应技术。
2022-02-09 18:01:59 3.98MB 基因组数据
盖西 用于基因组富集分析的R包
2022-01-20 11:20:02 9.26MB R
1