文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(二)

基因共表达和转录调控网络

随着生殖生长(DR)的开始,依次经历SMI、GPD、FMI和FOP过程形成穗结构,这是决定SNS每穗小穗数的关键,有助于粮食产量。因此,作者分析了基因共表达情况和调控网络,目的是找出控制这一过程的潜在因素。

640.png

  • 作者基于PCA的距离计算了SMI到FOP阶段的伪时间,发现GPD期和FMI期(前半段)相对比较接近
  • 在穗结构形成过程中,在四个阶段里一共鉴定出了8200个基因差异表达DGE,分为6个不同的簇cluster。

  • 花分生组织和各种激素代谢基因在SMI中高表达;
  • 激素信号转导、极性建立相关基因在GPD和FMI中高表达;
  • 在花器官发育方面,极性控制基因在FOP时高表达。
  1. 同时,发现在第3簇和第6簇内,ERF和WRKY转录因子TFS在SMI期富集并高表达。
  2. 这种基因表达模式符合时空特征,并说明了单个TFs家族在调控穗发育过程转录网络中的潜在重要性。

640.png

  • 可及性较高的染色质区域能为TF的结合提供对接位点,在图中,可以看出ERF、BHLH和SPL的结合基序(模体)在SMI与FOP的结合过程中可及性变异程度最大,说明这些TFs转录因子具有的潜在重要性。
  • 从SMI到FMI的时间序列表达基因簇之间存在明显的序列调控关系,即C6-C3-C2-C4。而在C1和C5中,FOP特异表达的基因是相互分离调控的。表明小穗和小花发育之间存在不同的转录调控网络
  • 从图中可以看出ERF、B3、TCP等TFs可能在该网络中起核心调控作用

640.png

  • 在该调控网络中可以找到一些与小麦穗发育有关的调节因子,比如:TaTB1、VRN1。表明了作者构建出来的TRN网络在发掘重要调节因子方面的能力
  • 接下来,作者为了验证TFs之间转录调控层次的预测能力,提取了一个小模块,其中包含了在其他作物中单独进行功能研究但尚未知道调控关系的因子,比如SPL6、MADS34。即红框中这些因子
  • 作者推测在SPL6-MADS34-MADS15-HMA模块后有一个正的转录调控体系,通过荧光素酶报告检测,在烟草叶片中观察到它们之间存在一个正转录调控回路。

多组学数据挖掘调控因子

染色质的开放区域是建立转录调控关系的关键

640.png

  • 多数TFs结合基序存在于染色质的开放区域
  • 在转录因子结合中心区域,DNA的变异程度明显降低
  • 在开放染色质区域含有明显较的GWAS信号,这些信号与穗形态特征相关。
  • 开放染色质区的QTL频率是全基因组QTL频率的5倍,GNPS、SNS等许多性状均有类似结果。

640.png

  • 作者以每穗可育小穗数FSPS为例,经GWAS分析,共有153个显著相关位点,将候选区间扩大到以GWAS信号峰为中心的1兆比MB,共鉴定出2916个候选基因。其中有1762个基因(C1和C4)在DR和SMI阶段的染色质可及性开放程度最高,这可能与小穗原基的分化有关,最终影响小穗数。这一结果表明,大部分GWAS候选基因在与相应性状关键发育阶段具有较高的染色质开放度。
  • 一共6000多个基因,以转录因子TFS编码基因为要求,得到776个候选基因进行进一步筛选,其中,超过一半(404个TFs)位于穗发育相关的遗传区域内。然后通过寻找开放染色质区域中的SNP来进一步将候选TFs缩小到260个,它们可能影响转录调控回路,并重新连接穗发育的转录调控网络TRN

640.png

  • 在候选TFs中,分为三类:第一类在小麦中功能已经被研究,第二类在其他物种中已被研究,称其为“保守型”,第三类在小麦和其他作物中功能未知,称其为“新型”
  • 值得注意的是,大多数是“新型”转录因子TFs,多达208个,它们没有在小麦或其他作物中研究过。这些转录因子TFs在ERF、WRKY、BHLH、MYB、B3家族中富集。

验证调控因子遗传结构

保守型调控因子中,TaSPL6, TaMADS34, TaMADS15同样出现在之前提到的转录调控网络中,因此,作者接来来验证它们是否会参与穗发育过程。

640.png

  • 通过原位杂交技术展示了这些调控因子时空表达模式,TaSPL6,TaMADS34和 TaMADS15在SAM期弱表达,而在SMI和FOP期高表达。TaHMA是TaMADS15的下游靶位点,在FOP小花原基中也有表达。相似的时空表达模式说明它们在穗发育中的转录调控结构和潜在作用。
  • 然后作者对这三个调控因子进行RNAi沉默,得到转基因植株,34和15(后两个)表现出相似的表型变化,穗长SL缩短
  • 每穗小穗数SNS降低
  • 穗粒数GNPS降低

640.png

  • 在TasPL6-RNAi转基因小麦中,观察到TaMADS34的表达显著降低,进一步表明TaSPL6正向调节TaMADS34,另外后续的调控过程也相类似。证明TASPL6-TAMADS34-TAMADS15-TAHMA模块在小麦穗发育过程中具有调控功能。
  • 然后从进化的角度进一步分析了小麦和禾本科中TASPL6-TAMADS34-TAMADS15-TAHMA调控模块,在二倍体、四倍体、六倍体小麦中,发现在MADS15同源基因的启动子区均存在一个MADS34结合模体,同时,在附图5C中,可以得出在MADS34同源基因的启动子区存在SPL6的结合模体,表明该调控模块可能在小麦中保守
  • 然而,在水稻(Oryza sativa)和玉米(Zea Mays)中,MADS15的启动子区没有MADS34的结合模体,MADS34的启动子区也没有SPL6的结合模体,说明该调控模块在禾本科植物中可能存在差异

验证新发现的调控因子

作者为了验证该模型在识别新型小麦穗发育调节因子方面的能力,研究了Kronos、Cadenza、KN9204的Meta Tilling突变系的穗发育缺陷,将其突变位点全外显子测序鉴定。

全外显子测序:利用序列捕获技术将全基因组中所有外显子区域DNA序列捕获,富集后进行高通量测序的方法。可用于研究已知基因的单核苷酸多态性位点、插入缺失位点等,不适合用于研究基因组结构的变异。

640.png

  • 在208个新型TFs中,131个TFs包含至少有一个功能缺失突变的突变系
  • 在85个纯合突变株系中,有44个TFs在三种类型中表现出穗发育缺陷,分别是:
  1. 第一组:开花时间差异
  2. 第二组:小穗或小花退化差异
  3. 第三组:穗长或每穗小穗数差异
  • 图C和D展示了不同类型的突变系,可以得出:
  1. TaCAMTA-A突变体的开花时间比对照提前了两周左右
  2. TaWRKY37-A突变体的退化小穗数显著增多,导致穗粒数降低
  3. TabHLH009-A突变体突变体穗长缩短小穗密度增加

640.png

  • 在四倍体小麦Kronos的功能缺失突变体TaNAC22-A中,由于花原基分化没有正常终止,所以每个小穗的小花数增加。但是多数小花败育,最终导致穗粒数GNPS降低。
  • 通过原位杂交进一步证实了这些基因的时空表达模式,TaWRKY37-A、TabHLH009-A和TanAC22-A基因均在小穗发育起始期和花原基分化期,与它们的表型缺陷一致。
  • TaWRKY37-A在穗基部和小花分生组织中高表达
  • TaBHLH009-A在穗上部和小花分生组织中高表达
  • TaNAC22-A在小花原基中有显著表达。

TaMYB4-A对穗发育的影响

为了进一步了解TRN和GWAS技术在单个基因分子功能研究中的应用前景,作者选取了一个新型调控因子TaMYB4-A进行深入的研究。TaMYB4-A是TRN中的TFs之一(在前期调控阶段)

640.png

  • 通过GWAS分析,发现它位于一个与每穗可育小穗数FSPS显著相关的区间内。
  • 它的两种单倍型(C型和T型)可分离出214个小麦自然群体,它们的每穗可育小穗数FSPS具有差异显著。
  • 通过原位杂交发现TaMYB4-A在DR期小穗分生组织初步表达,在SMI期和FMI期小穗和小花原基中高表达,说明它在确定小穗数中起作用。

640.png

  • 作者从KN9204、Cadenza中找到了TaMYB4-A功能缺失突变体,发现突变后SL、SNS、GNPS显著降低,进一步证实了它在调节小穗发育中的作用。
  • 荧光素酶报告检测得出在TaMYB4-A的潜在上游调节因子中,WFZP和DOF型TF TADOF17(Traescs2B02G592700)分别能抑制或激活烟草中的TaMYB4-A
    上面三个基因在穗形成过程中表现出与TaMYB4-A同步的时空表达模式
  1. TaAP2-39:通过控制ABA/GA平衡调控水稻分蘖和穗/花序的发育
  2. TaI-BAK1:与油菜素甾体激酶相关,在水稻中过量表达可增加穗长和每穗粒数
  3. TaPILS7:编码生长素载体成分

640.png

  • WFZP高表达转基因小麦中TaMYB4-A的表达量下调,进一步证明了WFZP对TaMYB4-A的抑制作用
  • 小麦TaMYB4-A的遗传网络
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
前端开发 JavaScript 开发者
JavaScript:构建动态网络的引擎
JavaScript:构建动态网络的引擎
|
4月前
|
机器学习/深度学习 算法 量子技术
GQNN框架:让Python开发者轻松构建量子神经网络
为降低量子神经网络的研发门槛并提升其实用性,本文介绍一个名为GQNN(Generalized Quantum Neural Network)的Python开发框架。
89 4
GQNN框架:让Python开发者轻松构建量子神经网络
|
3月前
|
机器学习/深度学习 算法 大数据
构建数据中台,为什么“湖仓一体”成了大厂标配?
在大数据时代,数据湖与数据仓库各具优势,但单一架构难以应对复杂业务需求。湖仓一体通过融合数据湖的灵活性与数据仓的规范性,实现数据分层治理、统一调度,既能承载海量多源数据,又能支撑高效分析决策,成为企业构建数据中台、推动智能化转型的关键路径。
|
13天前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
2月前
|
分布式计算 安全 大数据
别等被黑客敲门才醒悟:大数据如何帮你防住网络攻击?
别等被黑客敲门才醒悟:大数据如何帮你防住网络攻击?
135 32
|
2月前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
1月前
|
机器学习/深度学习 分布式计算 Java
Java与图神经网络:构建企业级知识图谱与智能推理系统
图神经网络(GNN)作为处理非欧几里得数据的前沿技术,正成为企业知识管理和智能推理的核心引擎。本文深入探讨如何在Java生态中构建基于GNN的知识图谱系统,涵盖从图数据建模、GNN模型集成、分布式图计算到实时推理的全流程。通过具体的代码实现和架构设计,展示如何将先进的图神经网络技术融入传统Java企业应用,为构建下一代智能决策系统提供完整解决方案。
230 0
|
2月前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
307 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
4月前
|
监控 安全 Go
使用Go语言构建网络IP层安全防护
在Go语言中构建网络IP层安全防护是一项需求明确的任务,考虑到高性能、并发和跨平台的优势,Go是构建此类安全系统的合适选择。通过紧密遵循上述步骤并结合最佳实践,可以构建一个强大的网络防护系统,以保障数字环境的安全完整。
118 12
|
4月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合

热门文章

最新文章