首页 > 其他分享 >科迪华数据科学家对基因组信息应用于植物育种的观点与建议

科迪华数据科学家对基因组信息应用于植物育种的观点与建议

时间:2023-10-13 23:44:07浏览次数:43  
标签:selection 科迪华 基因组 individuals 育种 genomic population

本文内容整理自科迪华农业科学公司(Corteva Agriscience)的数量遗传学家Alencar Xavier博士几年前做的报告。Alencar Xavier在统计遗传学方面的工作是基因组辅助育种,重点是数据驱动的植物育种的理论和计算方面,例如使用各种信息来源进行建模、预测和选择。其研究涉及使用混合模型,贝叶斯方法和机器学习以及高性能计算的新数量遗传方法的开发和实施。其更多的介绍和工作可参考:

而Corteva于几年前由杜邦先锋、陶氏益农并购重组后,已然成为全球top2的巨型种企,做育种的不用做过多介绍。看看一线大厂的科学家怎么做育种的吧。

引言:在植物育种中利用基因组信息的机遇与挑战

数据的激增与测序成本的下降。

image.png

育种流程

image.png

image.png

image.png

image.png

image.png

遗传优势建模

动物GS中的单步法建模与植物GS中的单阶段建模
image.png

应用

为避免翻译错误,这里放原文为好。

image.png

Germplasm classification (PCA, Clustering, Unsupervised ML, FST)

Characterization

Characterize diversity using unsupervised learning methods.

Heterotic group

Classify (if known) or infer (if unknown) heterotic groups on individuals and populations.

Signatures of selection

Use FST (or related methods) to identify signatures of selection, adaptation and domestication.

Incorporation (GWAS, haplotype analysis)

Trait discovery

Finding new QTLs via association analysis on breeding data and designed populations.

Introduction of diversity

Screening non-elite (or elite from elsewhere) germplasm for pre-breeding.

Haplotype enrichment

Assess genome of non-elite material to add diversity to regions where elite germplasm is fixed.

Genomic selection (BayesABC, Supervised ML, etc.)

F2 enrichment (WF)

Entire population is genotyped with few markers and selected for specific QTL (e.g. disease resistance)

Pre-selection (WF/AF)

Entire population is genotyped and 0% is phenotyped. Selection is based on the genomic merit
estimated a predefined estimation set that is either made by design or using breeding data.

Test-and-shelf (WF/AF)

Entire population is genotyped and X% is phenotyped. Within-season selection is based on the
genomic merit estimated with a genomic model from phenotyped individuals.

Advancement (WF/AF)

Entire population is genotyped and phenotyped. Selection is based on the genetic merit of the
individuals using one or more seasons of data from those individuals.

Product placement (AF)

Similar to advancement but GxE takes the spotlight from G.

Recycling (Simulation and optimization)

Selection of parents

Selection of high BV individuals with complementary polygene or traits.

Select combinations

Providing a set of candidate parents (100% genotyped), combinations are based on clustering,
simulate crosses or predefined criterium (OHV or OPV).

Quantitative assessment (Variance component analysis)

Heritability

Narrow-sense and GxE (e.g. compound symmetry)

Genetic variance decomposition

Classic (Vg = Va + Vd + Vi) and hybrid (Vg = VGCA1 + VGCA2 + VSCA)

Genetic correlations

Across traits or within-trait across environments

Effective population size

Eigen analysis of the G matrix

Genetic progress and rate of genetic gains

Assess multiple years

Evaluate breeding strategies

Simulations and retrospective studies to ask what if questions

挑战

关键挑战

  • 通过“建模+群体设计+实验设计”来提高准确性。
  • 更好地利用 GxE,更好地了解 TPEs。
  • 在基因组模型中使用环境数据(土壤、天气、管理)。
  • 处理多亲本杂交。
  • 有效合作以及在不同项目中保持育种一致性。
  • 指导育种人员如何使用基因组数据。
  • 数据管理——轻松访问任何类型的数据和可视化工具。

反复调整育种设计

  • 确定每个育种阶段的重复与试点数量。
  • 从哪个育种阶段轮回选择亲本。
  • 在哪个阶段 “GxE”超过 “G”。
  • 提高遗传力和优化 GS 模型的策略。

对于育种家

  • 了解你的种质。
  • 了解你的目标环境。
  • 有清晰的育种目标。

总结

  • GS 在晋级(advancement)、轮回选择(recycling))和分析(incorporations))等方面的应用各不相同。

  • 试验设置和育种设计对 GS 起着关键作用。

  • 育种管线是动态的,需要不断改进。

优化育种程序的参考资料:

Rincent et al. (2012) Maximizing the reliability of genomic selection by optimizing the calibration set of reference individuals. Genetics, 192(2), 715-728.

Isidro et al. (2015). Training set optimization under population structure in genomic selection. TAG 128(1), 145-158.

Habier (2016). Improved molecular breeding methods. US20160321396A1.

Ou and Liao (2019). Training set determination for genomic selection. TAG 132(10), 2781-2792.

Brauner et al. (2019). Genomic prediction with multiple biparental families. TAG

标签:selection,科迪华,基因组,individuals,育种,genomic,population
From: https://www.cnblogs.com/miyuanbiotech/p/17763543.html

相关文章

  • 基因组选择(GS)缩短育种周期
    GS与传统表型选择(PS)的比较:Vivek等人进行的研究比较了玉米在干旱条件下的GS和PS。结果发现,使用PS时,每周期的收益是0.27(t/ha),而使用GS时增加到了0.50(t/ha)。将这些值除以周期长度,干旱条件下的年遗传增益分别为0.067(PS)和0.124(GS)。在最佳条件下,每周期的收益从0.34(PS)增加......
  • 易基因:基于类器官的转录和表观基因组分析揭示肠上皮成熟的关键调节因子|Science子刊
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。胎儿肠道经历巨大的扩张和重塑,在发育过程中形成初级绒毛和连续的绒毛间隙。绒毛形成后,相同潜能的上皮祖细胞(equipotentepithelialprogenitors)产生功能明确的成体干细胞(adultstemcells,ASC)。这些细胞主要存在于肠隐......
  • 8. 参考基因组
    1.背景引入  本小节开始讲述转录组测序的准备工作.因为做的是有参的基因组分析,所以首先是准备参考基因组、测序数据.当数据准备完成后,接下来是比对参考基因组,表达定量,合并成表达矩阵,差异表达分析.  上面是转录组分析的大致步骤,这节我们介绍的是参考基因组.2.准备参......
  • 生信教程:使用全基因组SNP数据进行ABBA-BABA分析
    动动发财的小手,点个赞吧!简介ABBABABA统计(也称为“D统计”)为偏离严格的分叉进化历史提供了简单而有力的测试。因此,它们经常用于使用基因组规模的SNP数据(例如来自全基因组测序或RADseq)来测试基因渗入。在本次实践中,我们将结合使用可用软件和一些用R从头编写的代码来执行......
  • 参考基因组准备
    参考:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247483738&idx=1&sn=bd57965cf960293837671b315b35c4d4&chksm=9b4841e1ac3fc8f7d4102f1b07abce8d805542ef56b25c5aab21fb587276170d7a1ef8a6ab8a&scene=21#wechat_redirect下载hg19,hg38,小鼠基因......
  • 基因组大数据计算: CPU和GPU加速方案深度评测
    随着NGS测序通量的大幅提高,搭配高效NGS二级分析技术的精准解决方案快速融进基因组学的各个应用领域:遗传进化、临床诊断、分子育种、医药开发等。以下我们通过对基于CPU和GPU不同硬件平台的NGS二级分析方案进行详细评测,以期为基因组学研究领域的用户提供参考。Sentieon软件是面向CPU......
  • 宏基因组共现网络分析
     引言 宏基因组学是研究环境中各种微生物群体(包括细菌、真菌等)的所有基因的集合,它已成为植物学领域中的重要工具。宏基因组数据的分析对于理解微生物的功能和相互作用至关重要。Co-occurrenceNetwork是一种用于组织和分析孤立数据的方法。它可以将多个基因或序列组织成一个网......
  • 基于机器学习的基因组预测
    目录机器学习与GP基因型数据编码高通量表型数据驱动的育种需要结构化数据集可解释机器学习机器学习与GP与动物育种相比,植物的基因组选择必须通过环境相互作用来考虑更大的基因型,并且需要添加适当的多环境试验数据。机器学习(ML)和深度学习(DL)算法比线性预测模型更复杂,可以发现......
  • 单一个体参考基因组的局限性
     001、在种质资源的群体变异与性状挖掘研究中,通常需要借助1个参考基因组,通过将重测序数据比对到参考基因上来鉴定个体间的遗传变异(Huangetal.,2012)。这种变异鉴定的方法受制于参考基因组序列及其与检测个体间的相似性,参考基因组缺失的基因组信息以及与比对个体差......
  • 基因组组装质量的评价
     001、 。 reference祝光涛,黄三文.360度群体遗传变异扫描——大豆泛基因组研究[J].[2023-08-16].DOI:10.11983/CBB20096.......