本模型充分利用了所给数据的特点,运用统计、最优化等数学方法,从已知样本序列中提炼出能较好代表两类特征的关键字符串,据此提出量化的分类标准,能较好的对任给DNA序列进行分类.首先,从已知样本序列中用广度优先法选出所有重复出现的字符串,并计算其标准化频率及分散度.然后,利用样本数据结合最小二乘法确定两类字符串各自的优先级函数,并且逐步优化其参数使之达到稳定,提高了可信度.最后,根据优先级函数找出关键词,然后确定权数,用层次分析法对未知样本进行分类,并定出显著水平,从而得到了一个比较通用的分类方法.经过检验,此方法对21—40号待测样本进行了很好的分类,对后面的182个DNA序列进行同样的操作,也有较好的效果.
2021-12-01 14:54:56 359KB 建模 DNA序列
1
DNA序列分类模型研究的PPT,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。
2021-11-30 21:34:40 814KB 神经网络
1
基于HBase的DNA序列存储研究,温少雄,谭军,针对生物序列数据量大、增长速度快、序列重复性高等特点,结合HBase分布式数据库的相关理论和技术提出并实现了一套基于HBase的DNA序��
2021-11-30 14:25:49 767KB HBase
1
分子生物学综合应用软件,可以用于多序列比对、PCR引物设计等
2021-11-28 10:11:41 28.54MB 分子生物学 DNA
1
折叠 大规模折叠 DNA 的二级结构。 利用python的基本多进程功能来驱动多个折叠事件。 添加了对随机序列的支持。 在随机化序列之前添加了对屏蔽区域的支持。
2021-11-25 15:10:55 36KB Python
1
吉布斯采样器主题发现 这个 python 脚本是用于在字符序列中查找模式的 gibbs 采样的实现。 一个流行的例子是在 DNA 序列中找到基序。 从另一个脚本运行 首先,导入模块 gibbs 然后调用带有参数序列和字长的方法采样,输出是每个序列的单词位置 有关代码的更多解释(印度尼西亚语),请参阅 。
2021-11-24 20:18:19 7KB Python
1
MPI集群 K-Means算法的顺序和并行实现,数据集为数据点,DNA链为输入,K为质心
2021-11-18 22:57:50 351KB Java
1
DeepVariant DeepVariant是一个分析管道,它使用深度神经网络从下一代DNA测序数据中调用遗传变异。 为什么选择DeepVariant DeepVariant是高度准确的。 在2016年DeepVariant DeepVariant DeepVariant是一个分析管道,该管道使用深度神经网络从下一代DNA测序数据中调用遗传变异。 DeepVariant依赖于Nucleus,这是一个Python和C ++代码库,用于以通用基因组文件格式(例如SAM和VCF)读写数据,旨在与TensorFlow机器学习框架轻松集成。 如何运行我们建议使用我们的Docker解决方案。 该命令将如下所示:BIN_VERSION =“ 0.10.0” sudo docker run
2021-11-08 18:22:45 31.23MB Python Deep Learning
1
使用Python分析Multi-Fasta格式的DNA序列 一个Python程序,将包含多FASTA格式的DNA序列的文件作为输入,并计算以下问题的答案: 文件中有几条记录? FASTA文件中的记录定义为单行标题,后跟序列数据行。 在第一列中,标题行与序列数据之间用大于号(“>”)隔开。 “>”符号后的单词是序列的标识符,该行的其余部分是该条目的可选描述。 “>”和标识符的首字母之间不应有空格。 文件中序列的长度是多少? 最长的序列是什么,最短的序列是什么? 是否有一个以上的最长或最短序列? 它们的标识符是什么? FASTA格式 FASTA格式的序列文件可以包含多个序列。 FASTA格式的每个序列均以单行描述开头,后跟序列数据行。 广告内容描述行必须在第一列中以大于(“>”)符号开头。 FASTA格式的示例序列为: AB000263 | ACC = AB000263 | DESCR
2021-11-08 10:49:48 14KB Python
1
matlab分形教学代码使用 L 系统从“DNA 基因”中绘制分形“动物园动物”和植物:蕨菜、垫片等。 共有三个版本: LiveCode - 这是完整且有效的 True BASIC - 这只是我原来程序的清单和画的几张图 MATLAB - 这是在早期开发 我不确定我是从哪里想到使用这个想法的——它是在 Richard Dawkin 的一本书中,例如,自私的基因还是盲人制表师? 数学名称是 L 系统 “L 系统由乌得勒支大学的匈牙利理论生物学家和植物学家 Aristid Lindenmayer 于 1968 年引入和开发。” 另请参阅 Barnsley fern “Barnsley 开发的 fern 代码是创建分形的迭代函数系统 (IFS) 的一个示例。” 另见迭代函数系统 另见仿射变换 还可以在 LiveCode 中看到“科赫岛:LiveCode 的分形基础” 还可以在 LiveCode 中看到带有 LiveCode 的“龙的进化”
2021-11-02 15:13:00 823KB 系统开源
1