数据资源: 中国林业专利

一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法



申请号 CN202210294418.2

专利名称 一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法

专利类型 发明 

年份 2022 

公开号 CN114842908A

公开日 2022.08.02

主分类号 G16B30/00

分类号 G16B30/00  G06N3/08  G06N3/04  G16B40/00 

申请日 2022.03.24

申请人 南京农业大学 

国家省市 江苏 

联系地址 210095 江苏省南京市玄武区卫岗1号

发明人 江高飞  薛卫  韦中  张家璇  张耀中  徐阳春  沈其荣 

代理人 许轲;徐冬涛

代理机构 南京天华专利代理有限责任公司 32218

内容摘要 本发明公开了一种使用序列k?mer频率优化特征精准识别土壤致病菌污染的方法,其步骤为:步骤一、选取合适的k?mer片段长度,进行频率特征提取;步骤二、对提取的数据进行归一化处理;步骤三、构建交叉融合神经网络;网络由输入层、残差网络、深度网络、交叉网络和特征合并层组成;步骤四、模型预测;第一次使用先训练神经网络参数,再将待预测细菌DNA序列通过步骤一方法提取频率特征,送入训练好的残差神经网络,输出预测结果。本发明准确率优于现有k?mer特征预测算法;自动地将k?mer特征组合在一起,高效学习低维特征交叉和高维非线性特征,生成更优的模型。模型不需要人工特征工程或遍历搜索,具有较低的计算成本。

主权利要求 1.一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法,其特征在于包括如下步骤:步骤一、选取合适的k-mer片段长度,进行频率特征提取;步骤二、对提取的数据进行归一化处理;步骤三、构建交叉融合神经网络;网络由输入层、残差网络、深度网络、交叉网络和特征合并层组成;k-mer特征向量并行送入残差网络、深度网络、交叉网络,特征向量各元素并行计算,最终特征合并实现特征交叉;步骤四、模型预测;第一次使用先训练神经网络参数,再将待预测细菌DNA序列通过步骤一方法提取频率特征,送入训练好的残差神经网络,输出预测结果。

PDF文件 浏览全文

相关图谱

扫描二维码