申请号 CN202210294418.2
专利名称 一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法
专利类型 发明
年份 2022
公开号 CN114842908A
公开日 2022.08.02
主分类号 G16B30/00
分类号 G16B30/00 G06N3/08 G06N3/04 G16B40/00
申请日 2022.03.24
申请人 南京农业大学
国家省市 江苏
联系地址 210095 江苏省南京市玄武区卫岗1号
发明人 江高飞 薛卫 韦中 张家璇 张耀中 徐阳春 沈其荣
代理人 许轲;徐冬涛
代理机构 南京天华专利代理有限责任公司 32218
内容摘要 本发明公开了一种使用序列k?mer频率优化特征精准识别土壤致病菌污染的方法,其步骤为:步骤一、选取合适的k?mer片段长度,进行频率特征提取;步骤二、对提取的数据进行归一化处理;步骤三、构建交叉融合神经网络;网络由输入层、残差网络、深度网络、交叉网络和特征合并层组成;步骤四、模型预测;第一次使用先训练神经网络参数,再将待预测细菌DNA序列通过步骤一方法提取频率特征,送入训练好的残差神经网络,输出预测结果。本发明准确率优于现有k?mer特征预测算法;自动地将k?mer特征组合在一起,高效学习低维特征交叉和高维非线性特征,生成更优的模型。模型不需要人工特征工程或遍历搜索,具有较低的计算成本。
主权利要求 1.一种使用序列k-mer频率优化特征精准识别土壤致病菌污染的方法,其特征在于包括如下步骤:步骤一、选取合适的k-mer片段长度,进行频率特征提取;步骤二、对提取的数据进行归一化处理;步骤三、构建交叉融合神经网络;网络由输入层、残差网络、深度网络、交叉网络和特征合并层组成;k-mer特征向量并行送入残差网络、深度网络、交叉网络,特征向量各元素并行计算,最终特征合并实现特征交叉;步骤四、模型预测;第一次使用先训练神经网络参数,再将待预测细菌DNA序列通过步骤一方法提取频率特征,送入训练好的残差神经网络,输出预测结果。
PDF文件 浏览全文