碳水化合物(亦称糖质)作为四大基本有机生物大分子之一,不仅支撑细胞结构、提供细胞代谢能量,还在众多生命过程中发挥重要作用,比如辅助蛋白质折叠、参与细胞间识别与免疫反应等。以寡糖或多糖形式的糖质,可通过共价形式连接于多肽、脂质或RNA上,形成“糖缀合物”。相比于我们更为熟悉的DNA/RNA和蛋白质,糖质的功能并非不重要,而是研究难度更大:糖质复杂的单糖类型、分支模式、空间构型、结构柔性,给其三维结构解析带来了巨大困难。因此,对于糖质高分辨的三维结构,我们知之甚少,而结构信息的缺失不仅限制了我们对糖质功能和作用机制的理解,也阻碍了基于人工智能的结构预测与设计的进一步发展。
2024年3月,颜宁团队报道了莱茵衣藻纤绒毛 (mastigoneme) 复合物的高分辨率结构,首次揭示了阿拉伯聚糖在生物结构高级组装中的关键作用[1]。紧接着通过将纤绒毛分辨率进一步提高到2.3Å,观察到了此前在自然界中从未发现过的5’,5’-磷酸二酯键,将相邻的糖链进行共价固定。该研究不仅定义了一种新的糖质基本二级结构单元,也证明了更高分辨率对于糖质结构生物学研究的重要性[2]。
同期开展的,还有一项被颜宁团队称为“荷糖月色”的研究计划——通过“CryoSeek(酷寻)”这一研究策略,将冷冻电镜作为一种观察工具,用于发现完全未知的生物大分子[3]。2024年12月15日,颜宁团队在预印本网站BioRxiv公布了利用CryoSeek思路做出的最新成果,论文标题为The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek(8纳米意大利面:利用酷寻在淡水中发现的包围着四肽重复序列蛋白丝的规则糖质结构)[4]。研究成果报道了在清华大学荷塘水样中鉴定出了一种新型的8nm直径的糖蛋白纤维TLP-4b,其核心是由四肽重复序列连成的线性多肽,外围被厚厚的糖链包裹。四肽重复片段包含一个保守的3,4-二羟脯氨酸 (3,4-dihydroxyproline, DiHyp) ,其3-OH与4-OH均高度O-糖基化。与DiHyp相邻的位置,还存在一个保守的O-糖基化修饰的丝氨酸或苏氨酸。在新闻稿中,颜宁团队解释了将本项研究计划称为“荷糖月色”的原因,并诙谐地将该糖蛋白纤维称之为“8纳米螺蛳粉” (BioRxiv:颜宁团队利用CryoSeek(酷寻)策略发现新型糖蛋白丝)。团队当时已经预告,该研究成果是即将发表的另外一篇论文的姐妹篇。
图1. 从清华大学荷塘样品中解析的糖蛋白纤维TLP-4a
这篇文章还报道了生物信息学分析,表明相似的四肽重复序列在生物界广泛存在。在文章接受之后发布于BioRxiv的TLP-4b糖蛋白丝很快验证了这一点,此后团队将用TLP-4a来命名最早发现的TLP-4。因为在中心线性多肽链类似的基础上,TLP-4a和TLP-4b的糖质组成与结构竟然完全不同,这就引发了诸多有趣的问题,比如什么酶参与其中,底物特异性如何实现,等等。当然,尽管TLP-4a和TLP-4b的糖质分支形式以及数目有较大差异(图2),但万变不离其宗,整个糖蛋白纤维的组装与成型离不开糖质结构的规则排布与相互作用(图3)。
图2. TLP-4a和TLP-4b的糖质分支形式和结构对比
图3. TLP-4a的空间结构完全由糖质间的相互作用来实现
本研究中采用的CryoSeek策略以及后续的结构和生信分析,为从自然界中分离糖蛋白纤维并研究其糖类结构开辟了新路径。以本研究发现的纤维结构为模式研究对象,进一步挖掘并鉴定其它潜在的糖蛋白丝,及至建立更多合适的生物体系,将对进一步理解多糖的合成通路、折叠密码、以及生物学功能具有重要的意义。
清华大学讲席教授、北京生物结构前沿研究中心研究员、深圳医学科学院创始院长、深圳湾实验室主任颜宁、清华大学生命科学学院助理研究员李张强和副教授闫创业为本文的共同通讯作者。清华大学生命科学学院2020级直博生王彤彤、博士后黄文泽为本文共同第一作者。清华大学生命科学学院博士后徐魁,以及2022级直博生孙熠彤参与了本研究。清华大学生命科学学院副教授张强锋为本研究的数据分析提供了帮助。实验的冷冻电镜数据收集得到了清华大学冷冻电镜平台的帮助。实验的质谱鉴定工作得到了蛋白质化学与组学平台的支持,实验的计算工作得到清华大学高性能计算平台、国家蛋白质设施实验技术中心(北京)的支持。本研究得到了国家自然科学基金重大研究计划,北京生物结构前沿研究中心与清华-北大生命科学联合中心的经费支持。
参考文献:
[1] Huang J, Tao H, Chen J, et al. Structure-guided discovery of protein and glycan components in native mastigonemes[J]. Cell, 2024, 187(7): 1733-1744. e12.
[2] Huang J, Tao H, Chen J, et al. High-resolution mastigoneme structure reveals 5', 5'-phosphodiesters stabilized glycan folding[J]. bioRxiv, 2024: 2024.12. 24.630281.
[3] Wang, T., Li, Z., Xu, K., Huang, W., Huang, G., Zhang, Q. C., & Yan, N. (2024). CryoSeek: A strategy for bioentity discovery using cryoelectron microscopy.Proceedings of the National Academy of Sciences, 121(42), e2417046121.
[4] Wang T, Sun Y, Li Z, et al. The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek[J]. bioRxiv, 2024: 2024.12. 15.627649.
目前报道的还只是浅层的观察,
这背后还有大量的生物学问题
等着被一点点“剥洋葱”。