“葡萄美酒夜光杯,欲饮琵琶马上催。”这句古诗反映了人们自古以来对葡萄的喜爱。种下一粒葡萄种子,从种子萌发到结出果实,需要3年,而想要培育出“令人满意的”葡萄品种,需要的时间更久。能否找到一种既“快速”又“简便”的方法实现葡萄品种的“个性化”设计? 中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)周永锋团队提出利用人工智能进行葡萄育种的新方法,该方法可大幅缩短育种周期,且预测准确度高达85%,相比传统方法,育种效率可提高400%。该研究有望实现葡萄的精准设计育种,加速葡萄品种创新,并为其他多年生作物育种提供方法参考。相关研究成果于11月4日发表在《自然·遗传学》(Nature Genetics)上。 有选择性地通过特定手段对原有葡萄性状进行改良,这一过程被称为育种。早期,人们发现野生葡萄后,会把品质优良的葡萄苗保存下来,通过一代又一代的繁育,只留下符合要求的后代,这种方法固然有用,但高度依赖自然种质资源,可改良程度有限。 后来,人们发现如果既想要葡萄“产量高”,也想要“甜度高”,可以把“产量高”的葡萄品种和“甜度高”的葡萄品种进行杂交,以培育出聚合了双亲优良性状的杂交后代。直到目前,葡萄育种的主要方法仍是杂交育种,这种方法满足了有针对性选育葡萄品种的需求,但育种周期十分漫长,往往需要经过数十年的筛选,工作量极大,且由于葡萄高度杂合,杂交后,后代会出现性状分离,杂交效果并不理想。 进入21世纪以来,育种家提出分子育种——通过分子标记来“设计”性状,并在此基础上,提出了智能设计育种,即基于海量基因组的遗传变异数据进行分析预测,以提高育种效率和精确度。其中,获取全面、准确的作物基因组数据是关键。 为此,周永锋团队自2015年起开始聚焦葡萄设计育种,并于2023年发布了首个葡萄完整参考基因组图谱。随后,该团队又陆续对多个野生和栽培葡萄进行测序、组装,构建了目前首个最全面、最准确的葡萄泛基因组。 为了进一步弄清楚葡萄基因与性状之间的关联,周永锋团队从近万份葡萄品种中选取了400多份有代表性的葡萄品种,连续3年对包括果穗大小、果皮颜色等在内的29个农艺性状进行调查,构建了葡萄基因型图谱和性状图谱。在此基础上,周永锋团队利用数量遗传学分析,鉴定到148个与农艺性状显著相关的基因位点,其中122个位点为首次发现。 全面、准确的基因组数据是精准“设计”育种的基础,而如何深入挖掘这些数据来优化育种策略并指导育种?周永锋团队决定引入机器学习,通过构建预测模型,根据评分进行早期个体的预测和选择,从而指导、优化育种策略。 周永锋团队引入人工智能中的机器学习技术,解析基因型与性状数据间的复杂网络关系,构建了首个葡萄全基因组选择模型。与杂交育种需要根据葡萄成熟后的表型作出判断相比,这种全基因组测序育种模式在葡萄幼苗时期,就可以通过计算机软件预测其成熟后的性状。结果表明,结合了结构变异信息的多基因评分预测模型,其预测准确率高达85%。 通过这一模型,可以快速准确地评估大量育种材料的遗传潜力,从而更好地选择优良品种。与杂交育种需要根据葡萄成熟后的表型作出判断相比,全基因组选择育种技术在葡萄幼苗时期就可以预测其成熟后的性状,尽早剔除掉不符合条件的幼苗,减少了不必要的人工成本和投入,在葡萄育种应用中有很大的应用潜力,提高葡萄育种效率,加速葡萄新种质的创制,革新葡萄育种策略。 |