
A metagenomic ‘dark matter’ enzyme catalyses oxidative cellulose conversion
一.研究概要
本文报道了从巴西甘蔗渣覆盖土壤的宏基因组中发现的一种新型金属酶(CelOCE),它能氧化切割纤维素。该酶通过外切机制(exo-type)以C1位专一性氧化纤维素,唯一产物为纤维二糖酸(cellobionic acid)。酶结构为同源二聚体,含铜活性中心,能原位产生过氧化氢。该酶可增强工业真菌Trichoderma reesei的分泌酶系对木质纤维素生物质的降解效率,提高葡萄糖产量。该发现扩展了细菌氧化酶系统对生物质顽固性的理解,并为可持续生物经济提供潜在生物技术应用,如将农业残渣转化为高值生物产品。
二.研究背景
纤维素是地球上最丰富的可再生聚合物,但其微纤结构和与木质素、半纤维素的复合使酶解降解困难。传统纤维素降解模型依赖水解酶(如内切-β-葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),后发现氧化酶如溶解性多糖单加氧酶(LPMOs)可辅助降解结晶区。然而,大多数微生物无法实验室培养,其遗传潜力仍属“暗物质”。本文通过宏基因组挖掘专化于木质纤维素降解的微生物群落,发现一种新型金属酶,挑战现有细菌氧化系统模型,并提升生物质转化效率。
三.研究方法
宏基因组分析:采集甘蔗渣覆盖土壤样本,进行宏基因组测序,组装高质量宏基因组组装基因组(MAGs)。使用隐马尔可夫模型检测远源同源序列,选择8个未知序列在E. coli中表达和表征。
酶学特性表征:纯化酶,使用色谱(HPAEC-PAD)、质谱、FTIR、XPS、亲和凝胶电泳、ITC、EPR、XRF和XAS检测活性、结合亲和力和铜特性。测试底物包括纤维素、寡糖和其他多糖。
结构生物学:晶体结构解析(三种状态),使用第四代同步辐射X射线衍射。
功能验证:将酶整合到工程化T. reesei菌株的分泌组中,在65L和300L生物反应器中测试工业条件下的生物质糖化效率。
系统发生和网络分析:SSN和系统树分析酶同源物。
四.研究结果
(1)新型纤维素氧化酶的发现
鉴定先前未描述的生物质活性微生物和生物催化剂,我们对覆盖有甘蔗渣的土壤样本进行了宏基因组分析,这些土壤已在巴西一家生物炼厂维持了数十年。我们发现,这个环境中的微生物多样性与甘蔗渣堆附近原生植被的散装土壤相比急剧下降(约1000个操作分类单元(OTUs)vs.约2200个OTUs)(图1)。此外,这种微生物多样性的下降伴随着与多糖降解和代谢相关的宏基因组组装基因组(MAGs)数量的增加,表明微生物向木质纤维素细菌的特化(图1)。在回收的高质量MAGs中(图1),一个来自最近提出的和未表征的未培养细菌门4(UBP4)的成员由于其未开发的植物细胞壁降解潜力而被进一步调查。这一潜力通过多个编码糖苷水解酶的基因得到证实,例如来自GH3、GH5、GH9、GH39、GH43、GH44、GH74和GH148家族的基因(图1b)。虽然UBP4门最初在大型宏基因组重建工作中从废水中鉴定,但这里我们描述了一个从土壤中获得的MAG,它在GTDB数据库中与现有UBP4基因组在科水平上分歧。
基于其广泛的CAZyme库(图1d和附图1c)和巴西土壤来源,我们为这个未培养细菌定义为‘Candidatus Telluricellulosum braziliensis’。使用隐马尔可夫模型进行远程同源检测,我们从这个基因组中选择了八个序列,这些序列显示出与已知碳水化合物加工蛋白至少10%的序列同一性,但缺乏CAZy数据库中的匹配。这些序列被合成、在Escherichia coli中表达并进行生化表征(附表4)。其中一个蛋白显示出通过工业竞争性T. reesei菌株产生的纤维素降解酶混合物增强预处理甘蔗渣降解的能力(约21%的改善)(图2a)。这个真菌混合物包括有效降解纤维素和杂木聚糖的关键酶活性,包括纤维二糖水解酶(CBH1和CBH2)、内切-β-葡聚糖酶(EGL1、EGL2和EGL5)、LPMO(LPMO9A)、β-葡糖苷酶(来自Talaromyces emersonii的异源CEL3A)、内切-β-木聚糖酶(XYN1、XYN2和XYN4)、β-木糖苷酶(BXL1)和其他辅助酶。一个细菌酶能够增强优化真菌CAZyme混合物的性能是值得注意的,并突出了其在植物生物质降解应用中的潜力。
图1. 甘蔗渣覆盖土壤的宏基因组挖掘及代谢路径重构
(2)新型纤维素氧化酶外切机制和C1氧化特性
新型纤维素氧化酶在一系列广泛的底物上没有显示出可检测的水解活性,包括多糖、寡糖和合成底物(附表7),表明一种非水解作用模式,可能涉及氧化机制。因此,为了调查这一假设,我们在氧化还原条件下分析了从各种底物释放的产物,特别是存在氧气和电子供体(抗坏血酸(ASC))的情况下。我们发现,该酶仅释放一种产物,从木质纤维素(预处理甘蔗渣)(图2b)、微晶纤维素(Avicel)(附图4a)和无定形纤维素(PASC)(补充图4b)鉴定为纤维二糖酸(附图3)。在纤维寡糖(C2–C6)和其他多糖上的活性测试,包括几丁质、甘露聚糖、木聚糖、木葡聚糖、阿拉伯木聚糖、混合连接β-葡聚糖、海带聚糖、地衣聚糖、淀粉和果胶,没有显示任何降解产物,表明对纤维素底物的明确偏好(附图4c)。特别是,该酶对纤维二糖没有显示结合亲和力(附图5),并且在存在ASC的情况下16 h后没有导致纤维二糖的消耗(附图6),排除了从纤维二糖产生纤维二糖酸的可能性。此外,该酶增强了同一Trichoderma酶混合物的糖化效率,在Avicel和PASC上葡萄糖产量分别提高约8%和12.5%(图2a),支持其特定活性和在纤维素转化中的作用。
不同的技术,包括亲和凝胶电泳(附图7)、傅里叶变换红外光谱(FTIR)(附图2a)和X射线光电子光谱(XPS)(附图2b)定性地证明了该蛋白结合纤维素的能力。而且,只有变性剂如SDS才能有效地从纤维素中置换酶(扩展数据图2a,b)。结合等温线显示了低微摩尔范围(7–9 µM)的解离常数,用于PASC(图2c),而对于微晶纤维素(Avicel)没有达到饱和(图2d),类似于在纤维素活性LPMOs中观察到。值得注意的是,铜的氧化还原状态并没有像LPMOs中观察到的那样影响结合亲和力或最大结合容量(Bmax),可能由于该酶中催化铜的埋藏性质。竞争结合测定进一步显示,该酶在牛血清白蛋白(BSA)的存在下显著保留其纤维素结合能力,类似于纤维素酶(附图8)。总之,这些纤维素结合测定突出了发现的酶对纤维素的特异性相互作用和高亲和力。
为了记录该酶的分类发生,我们进行了序列相似性网络(SSN)和系统发生分析,揭示了序列数据库中注释为假设蛋白的许多直系同源物(序列同一性>30%)。这些直系同源物被鉴定分布在与生物质降解相关的各种细菌门中,以及古菌中(附图3)。包括Bacteroides caccae、Draconibacterium halophilum、Rhodocytophaga rosea、Adhaeribacter swui和Lacunisphaera limnophila在内的物种含有直系同源序列和与纤维素降解相关的不同CAZymes,例如来自GH5、GH8和GH9家族的。通过SSN分析鉴定出的最近表征同源物(图2e)属于不同的等功能簇(序列同一性<30%),并涉及抗生素生物合成(BacB)或尿糖酸代谢(KdgF)。用异源产生的BacB和KdgF进行的控制实验没有从预处理甘蔗渣中产生任何产物(图2b),表明纤维素氧化切割特定于包含发现酶的序列簇。
我们的结果支持从与植物细胞壁降解相关的先前未描述门中发现的纤维素氧化切割酶(CelOCE)。CelOCE通过先前未知的外切作用机制切割纤维素,释放纤维二糖酸作为唯一产物。
图2. 新型纤维素氧化酶功能和序列直系同源
(3)新型纤维素氧化酶独特的铜催化中心
为了阐明其氧化还原活性的机制,我们在三种不同状态下解析了CelOCE的晶体结构(附表1)。CelOCE采用紧凑的果冻卷折叠,包括两个反平行β-片(附图4a),并形成背对背同源二聚体,活性位点位于相反的面(图3a和附图4b)。这种二聚排列由广泛的β-片相互作用稳定(附图4b和附表8),并通过分析尺寸排阻色谱结合多角度光散射在溶液中进一步验证(附图9),支持它代表生物活性形式。
每个亚基包含一个单铜原子,在畸变八面体配位球中,涉及三个组氨酸(H44、H46和H84)、一个谷氨酰胺(Q50)和两个水分子(图3b)。在糖模拟物甘油的存在下,一个水分子被甘油的氧原子取代,将剩余的水分子置换到赤道平面,与H44、H46和Q50并列(附图5a)。在低pH(约pH 3.0)下,H44可能被质子化,并观察到它翻转向散装溶剂(附图5b),这是一种最近在LPMO中报道的行为。铜原子埋藏在活性位点中,该位点表现出囊状拓扑,与LPMOs相反(图3c和附图6a)。此外,这个活性位点嵌套在一个扁平界面中,这种结构排列非常适合与纤维素相互作用(图3c)。
图3. 新型纤维素氧化酶结构特性和酶促动力学
CelOCE中铜的存在进一步通过同步辐射X射线荧光(XRF)分析(附图10)、X射线吸收光谱(XAS)(附图11)、等温滴定量热法(ITC)(图3d)和电子顺磁共振(EPR)(图3e和附图12)证实。将CelOCE与酶饱和铜后与其他金属如镍的长时间孵育没有改变XAS谱,表明对铜的偏好(附图11)。此外,使用ITC测量了铜结合亲和力,显示低微摩尔范围的解离常数(Kd = 1.14 ± 0.11 µM)(图3d)。结合过程主要由焓贡献驱动(ΔH = −19.8 ± 0.2 kJ mol⁻¹),并伴随有有利的熵成分(TΔS = −14.1 ± 0.2 kJ mol⁻¹),导致放热过程,每个单体结合一个铜原子。
CelOCE的EPR谱是+2氧化态铜中心的特征,具有轴向EPR信号(gz > gy ≈ gx, Az > Ay ≈ Ax)(图3e和附表9)。它与LPMOs中占主导的菱形EPR信号(gz ≠ gy ≠ gx, Az ≠ Ay ≠ Ax)⁵,³⁴形成对比,表明CelOCE具有不同的配位球。在存在还原剂(ASC)的控制实验中使用EPR显示信号强烈下降,表明形成了EPR无声的Cu(I)形式(图3e)。此外,螯合剂EDTA也使EPR信号沉默(附图12),并强烈减少了纤维二糖酸的释放(附图13),突出了铜对催化的重要性。
图4 新型纤维素氧化酶结构特性和酶促动力学
虽然像裂解性多糖单加氧酶一样依赖铜离子,但CelOCE的铜配位环境和活性位点结构差异性,底物埋藏更深,更像一个活性“口袋”。它以后背相对的方式形成同源二聚体,一个亚基结合纤维素时,另一个亚基能原位生成过氧化氢效率极高。
(5)CelOCE基因导入里氏木霉(Trichoderma reesei)中与原有的纤维素酶协同表达
他们将CelOCE的基因导入工业常用菌株—里氏木霉(Trichoderma reesei)中,使其与原有的纤维素酶协同表达。结果令人惊讶,在pilot生物反应器(65L 和 300L)中成功量产;对甘蔗渣和桉树木材的葡萄糖释放率提升19–21%,效果甚至优于目前常用的真菌LPMO;可在高固体负载(15%)条件下运行。
图5. 纤维素酶协同表达促进纤维素转化
这项研究不仅揭示了一类全新的纤维素氧化降解的分子机制,拓展了我们对微生物能量代谢和碳转化的理解,也为生物智制、绿色能源和可持续材料的开发提供了新酶。根据最新挖掘的这些“暗物质酶”,将农业废弃物高效转化为生物燃料、高附加值的化学品。
参考文献:
Santos CA, Morais MAB, Mandelli F, et al. A metagenomic 'dark matter' enzyme catalyses oxidative cellulose conversion. Nature. 2025;639(8056):1076-1083. doi:10.1038/s41586-024-08553-z
文献链接:https://www.nature.com/articles/s41586-024-08553-z