核心技术
核心技术
小肽算法的建立与筛选
相比于常规的蛋白,小肽分子存在长度短小、长度不一、保守特征不明显、序列修饰较多等特征, 所以用于蛋白比对的常规算法不适合于小肽分子的比对挖掘。科研团队在不断模拟、测试、训练和优化下形成了一套新的蛋白比对分值矩阵,以此为基础开发了一种应用于小肽分子比对的算法。
图2-4小肽分子挖掘与比对的算法
小肽理性设计与创制
小肽分子的AI设计与优化从未创制出“源于自然、优于自然”的小肽是一项系统性的创新工程。通过整合多学科前沿方法,旨在AI设计优化与创制具有特定调控功能的小肽分子,并将其开发为标准化的产品与解决方案,精准解决现代农业在育种与产后环节的核心瓶颈。
该技术始于对植物生命过程的精密解码。利用单细胞转录组测序、蛋白质组学等高通量技术,深入分析植物在特定状态,如创伤再生、果实成熟等过程中细胞的通讯网络。通过生物信息学挖掘与比较,从海量数据中鉴定出在关键生理节点发挥核心作用的内源小肽信号分子及其对应的受体蛋白,建立“信号-受体-表型”的初始关联数据库,为后续设计提供生物学蓝图和候选靶点。
基于积累的小肽功能数据,构建专用的机器学习模型。一方面,对已知活性小肽进行序列优化,在保留其功能骨架的同时改进其稳定性或与受体的亲和力;另一方面,可根据受体蛋白的结构信息,利用深度学习算法进行全新小肽的从头设计。通过计算手段,可提前预测小肽的活性、毒性及环境行为,极大提高了研发的定向性与成功率。
将设计或文库中的海量小肽序列进行实验筛选,通常借助容量巨大的随机肽库平台,例如噬菌体展示库或酵母表面展示库等。以关键受体蛋白为“诱饵”,利用酵母双杂交等技术,快速筛选出能与之特异性结合的“猎物”小肽。随后,通过表面等离子共振等体外生化实验,精确测定两者的结合强度与动力学参数,从海量候选分子中锁定互作最强的先导小肽。
先导小肽确定后,需在植物体中进行严格的功能验证。在模式植物体系(如拟南芥、水稻等)或目标作物中,通过外源施加小肽,定量分析其对目标表型(如再生效率、果实硬度)的改善效果。进而,利用分子生物学技术,解析小肽处理如何影响下游基因表达、蛋白活性以及关键信号通路,从遗传学角度在突变体中进行反向验证,阐明其作用的分子机制。同时,完成产品安全性及环境相容性评估,确保其符合绿色农业的要求。
小肽创制技术构建了一个从“自然信号解码”到“智能分子设计”,经“高效实验筛选”与“深入机理验证”,最终实现“标准化产品落地”的完整创新闭环。它代表了一种可编程、精准化、环境友好的农业技术新范式,为提升种业自主创新能力和保障农产品质量安全提供了强有力的底层工具。
随机肽库筛选目标短肽技术
Yeast two-hybrid(Y2H)系统是一种用于鉴定与给定蛋白质相互作用的蛋白质/肽的筛选系统。Y2H分析系统基于以下原理:许多真核生物转录激活因子由两个物理上分离且功能独立的结构域组成,即DNA结合结构域(DNA-BD)和转录激活结构域(AD)。前者能够识别并结合靶基因启动子中的特定核苷酸序列(UAS),而后者则激活下游靶基因的转录。如果通过分子生物学技术将这两个结构域分离,并在同一宿主细胞中表达,则无法激活应答基因的转录。
图2-5 Yeast two-hybrid(Y2H)系统原理
我们构建了一个可以随机生成20个氨基酸的小肽平台,并通过穷举法生成一系列肽段。此方法可以生成一个大容量的数据库。我们对数据库中的肽段进行酵母双杂交筛选,以得到一系列与客户目标蛋白具有强互作的肽段。
小肽库容验证
小肽团队构建的随机肽库是一种文库构建容量很大的库,可以用来筛选短肽和蛋白质。需要注意的是,随机肽库不受物种限制。通过该平台,研究人员可以筛选与其目标蛋白相互作用的短肽。因此,它是一个非常有用的筛选蛋白质相互作用肽的平台。这种体内筛选方法也非常可行。筛选出的蛋白质还可以再次用于酵母双杂交实验,并结合生物信息学分析,找到与目标蛋白关键结合位点的信息。我们的随机肽库最终在pGADT7GW中构建,并经过Gateway BP-LR反应。
同时,为了进一步测试随机肽库的容量和特性,我们以二级质粒库为模板,设计引物扩增随机肽库序列。将得到的PCR产物用于Illumina测序文库构建。经Illumina Novaseq 6000平台测序后,获得60 bp的reads,用于估算文库容量。结果部分显示,我们的随机肽库构建良好,文库容量足以进行筛选。因此,我们可以宣布我们的随机肽库构建成功。载体构建方法如下。
(1)序列合成
小肽片段1
TCGTCGGGGACAACTTTGTACAAAAAAGTTGGAACCNNKNNKNNKNNKNNKNNKNNKNNKNNKNNKNNKNNKNKNNKNNKNNKNNKNNKNNKNNKNNKNNKTAAGACCCAACTTTCTTGTACAAAGTTGTGCGGCCGCC
随机片段引物1
CGTCGGGGACAACTTTGTACAAAAAAGTTGGAACC
随机片段引物2
GGCGGCCGCACAACTTTGTACAAAGAAAGTTGGTCTTA
(2)初级质粒库的生成
将该片段通过Gateway BP反应构建到入门载体pDONR207中,得到初级文库pONR207-随机肽。
(3)二级质粒库的生成
随后将pDONR207-随机肽质粒文库通过Gateway LR反应构建到目的载体pGADT7-GW上,得到酵母双杂交AD质粒文库。
图 2-6 pDONR207-随机肽载体和pGADT7-GW随机肽载体
(4)随机肽文库的生成
将二级质粒文库(pGADT7GW-随机肽)转移到酵母Y187菌株中,得到Y187 AD标记的随机肽文库。
小肽AI优化
小肽AI优化技术是我们整个小肽创制体系中的核心智能驱动模块。这项技术通过深度融合人工智能、计算生物学与高通量实验科学,构建了一个能够自主学习和迭代的分子设计系统,实现了对小肽分子的理性设计、活性精准预测与高效创制。
该技术的运行建立在一个专有的小肽功能数据库之上,数据库系统整合了来自多组学分析的内源小肽序列、实验获得的受体互作信息以及大量的表型验证结果。这些高质量、多维度数据为人工智能模型提供了学习和推理的基石。
在智能设计核心环节,我们部署了多种协同工作的机器学习模型。序列生成模型能够模仿并超越天然小肽的序列规律,自动创制出大量具有潜在功能的全新候选分子。活性预测模型根据小肽的氨基酸序列等基本特征,能提前预判其生物活性、安全性及稳定性,从而在昂贵的合成与实验之前完成大规模虚拟筛选。通过结合前沿的蛋白质结构预测工具,我们的模型还能在原子层面模拟小肽与目标受体如何“锁钥”结合,从结构上确保设计的精准性。
为了使AI设计落地并不断进化,我们建立了紧密的高通量实验闭环。AI优选出的设计序列被迅速转化为真实的合成小肽分子。随后,这些分子进入标准化、微型化的生物检测平台,进行高效率的功能验证。最关键的一步在于,所有实验产生的真实结果--无论是成功的案例还是失败的数据--都会立即反馈给AI模型。这使得我们的AI系统能够持续从实践中学习,不断修正和优化其内在的设计规则,从而形成一个“设计-构建-测试-学习”的自我增强智能循环。
小肽AI优化技术的最终价值在于它带来了一场研发范式的革新。它将小肽的发现与优化从传统的、依赖运气和经验的“试错”模式,转变为可预测、可编程的“工程设计”模式。这极大地提升了研发效率与成功率,使得针对特定作物、特定需求的“按需定制”成为可能。更重要的是,在不断循环中积累的专属数据和持续进化的AI算法,共同构成了我们深厚且动态的技术壁垒。