蛋白质是天然的生物聚合物,具有广阔的化学空间和复杂的功能,如结合、催化、运输和信号传导。几十年来,聚合物科学的首要目标一直是创造类似蛋白质的功能聚合物材料,不仅用于对蛋白质的基本理解,还用于解决现实世界的挑战。例如,通过固相肽合成(SPPS)制备的肽已经被广泛探索。然而,SPPS通常受到其产品规模小、长度短的限制。最近的研究表明,即使没有肽主链,具有统计控制的侧链组成的合成无规杂多聚物也能够表现出蛋白质样功能。为此,通过N-羧酸酐(NCAs)的开环聚合(ROP)制备的合成多肽已成为有前途的蛋白质模拟物,有可能结合肽和合成聚合物的优点。具体而言,多肽具有与蛋白质相同的主链甚至生物功能,同时可以在高达千克的规模和高数均分子量(Mn)下有效地生产。然而,与其他聚合物类似,多肽合成也会受到维度限制,这意味着只有几个残基的组合可能会导致化学空间太大,无法充分探索。为了从巨大的化学空间中获得功能蛋白模拟多肽,需要:(1)从设计空间中以高保真度容易地生产多肽;以及(2)以较低的劳动力和时间成本制定有效的空间探索战略。自动化和高通量合成(HTS)的发展极大地促进了小分子药物的发现和生物大分子的进化。此外,最近的应用化学中的机器学习进一步加速了函数挖掘过程和实验结果的解释。尽管HTS和/或机器学习用于制造功能聚合物可以追溯到20世纪90年代初,但与小分子和生物大分子合成的进展相比,该领域的进展在很大程度上落后。目前,聚合物的HTS主要通过平行步进生长聚合或链生长自由基聚合来实现。此外,聚合后改性(PPM)方案对于文库生成也是常见的。与平行聚合方法相比,PPM策略的优势在于,所有数据都可以从一批合成的共享前体聚合物中生成。为此,高效的Huisgen环加成、活化的酯-胺偶联和硫醇-烯反应是最常用的反应之一。迄今为止,将NCA和多肽化学纳入HTS工作流程的尝试一直很有挑战性,而且很少。为此,北京大学吕华研究员团队开发了一种基于硒酸盐和各种亲电试剂在水溶液中的点击式反应的多肽高通量多样化方法。该平台易于自动化,可以在一天内快速生成多达1200个同源多肽或随机杂多肽(RHP)。该工作以题为“A high-throughput platform for efficient exploration of functional polypeptide chemical space”发表在《Nature Synthesis》上。
受基于硒代半胱氨酸的生物偶联研究的启发,作者试图将硒醇盐引入多肽PPM的侧链,硒醇盐可以说是水溶液中最亲核的官能团之一。在各种硒醇保护策略中,由于其有效性和温和性,作者选择通过消除硒氧化物在聚合后产生活性硒物种。这种类型的反应先前被记录用于引入双键。然而,由此产生的硒物种通常被认为是副产品并被丢弃。基于Chen等人报道的硒和酰胺羰基分别位于氨基酸侧链的δ和ζ位置时,消除将仅发生在Se δ–C ε键,而不是C β–Se δ键,作者设计了一种硒酸多肽P(pAm-SeHC),其侧基是一种潜在的硒酸盐。硒代氨基酸(pAm-SeHC)是由l-蛋氨酸和元素硒以一锅法合成的,无需色谱,可获得多克级的纯产物。然后使用作者课题组最近开发的耐湿方法获得单体,即pAm-SeHC-NCA。在不同的单体与引发剂浓度([M]/[I])比下,苄基胺引发的pAm-SeHC-NCA的ROP产生了完全的单体转化,产生了所需的硒多肽P(pAm-SeHC),其受控Mn高达35.8 × 103 g mol−1,分散度约为1.10。还值得一提的是,整个过程不涉及任何挥发性硒物种,因此避免了不希望的恶臭,这是有机硒化合物的常见安全问题。随后,作者采用一锅两步法制备了预期的PSeO2Na。通过 1H和 77Se NMR光谱证实了PSeO 2Na的产生,根据NCA计算,总产率约为60%。值得注意的是,PSeO2Na在-20度条件下至少可以稳定3个月,这使其成为放大合成和长期储存的理想中间体。此外,PEG-b-P(pAm-SeHC)也以适中的产率制备了具有聚乙二醇(PEG)的嵌段共聚物(即PEG-b-PSeO 2Na)。
在水中用NaBH 4还原PSeO 2Na,可以得到用于进一步官能化的含硒油酸多肽(PSeNa)。这种原位生成的PSeNa可溶于水溶液,并且对与各种活化或失活的亲电试剂的取代反应具有高度反应性。PPM表现出几乎定量的侧链转化,并且对于具有不同聚合度(聚合度为45-130)的PSeNa同样有效。一些获得的多肽在水中表现出典型的右旋α-螺旋构象,这意味着在PPM条件下主链的外消旋最小。手性的保留可以通过选择具有不同构型的起始氨基酸(例如d-或dl-甲硫氨酸)来提供容易的构象调节的机会。作者还观察到侧链氧化诱导的螺旋到螺旋的转变,这类似于低聚(乙二醇)接枝的硒酸多肽。PSeNa的PPM对各种功能表现出显著的耐受性,包括那些难以通过NCA的ROP直接引入的功能。用GalNAc(P24)和甘露糖(P25)修饰的多肽很容易一步实现,在生物医学应用中具有很大的前景,包括溶酶体靶向嵌合体和免疫疗法。值得注意的是,一些合成的硒代多肽即使在三氟乙酸(TFA)中也具有极低的溶解度。为了解决这个问题,这些聚合物是用可溶性更强的嵌段共聚物PEG-b-PSeO 2Na作为PPM(P5、P6和P7)的前体制备的。除了有机卤化物外,其他亲电底物也被用于PSeNa修饰。例如,用环氧化物修饰PSeNa可以顺利地用β-羟基硒化物生成多肽(P26和P27)。我们还成功地制备了两种携带硒化物的多肽(P28和P29)——由于其易受亲核试剂的影响,硒化物是一种与NCA的ROP不相容的官能团。类似地,从氯甲酸盐(P30)制备了一种连接硒碳酸酯的多肽。这些聚合物都以超过80%的分离产率和几乎定量的接枝效率获得。在胺官能化树脂上也尝试了ROP、氧化消除和随后的PPM工艺,以检查将这种化学与公认的SPPS相结合的可行性。发现产物在树脂表面上保持受控,在裂解后提供具有高Mn和单峰SEC峰的P(pAm-SeHC)。此外,还对树脂进行了氧化消除和随后用Hal-13进行的PPM,发现其非常有效。裂解后,方便地获得了具有定量接枝效率的纯产物P13。
随着制备同源多肽的成功,作者接下来通过用多种有机卤化物同时处理前体来开发RHP合成的化学方法。为了促进未来HTS和机器学习算法的开发,作者试图通过机器可读输入来预测性地控制RHP的分子组成。为此,我们选择了有机卤化物的进料体积比,因为它可以直接转换为自动化液体处理工作站的命令。为了实现这一目标,在三个二元体系上仔细优化了RHP合成的条件:1)两种有机卤化物都被灭活(Hal-16和Hal-22);(2) 两种有机卤化物都被激活(Hal-11和Hal-12);和(3)一种有机卤化物被激活而另一种被失活(分别为Hal-9和Hal-22)。经过反复试验,并考虑到相对反应性的差异,我们将储备溶液的浓度分别固定在1.2和1.0,相当于失活和活化有机卤化物的硒醇盐浓度。同时,将有机卤化物的总体积设置为等于PSeNa溶液的体积。利用这些优化的条件,在所有三种情况下,RHP的输入体积比和实际分子组成之间都获得了良好的匹配。由于硒酸盐的高反应性,在RHP合成中使用大量过量的有机卤化物是不必要的(有时甚至会恶化)。总的来说,这种精确控制RHP组成的能力为生成用于机器学习的高质量数据集奠定了坚实的基础,并为定量结构-活动关系(SAR)铺平了道路。
在核磁共振管内的模型研究中,作者发现当使用灭活的有机卤化物Hal-16时,PPM在50度6小时或者37度8小时内结束,于活化的有机卤化物Hal-9,在50度时完成修饰只需要1小时。基于这一发现,RHP的HTS是在一个商业化的自动工作站的帮助下建立的,该工作站用于将有机卤化物的储备溶液分配到板上。然后,通过移液加入新鲜还原的PSeNa溶液,并将板密封并在50℃下的烘箱中孵育6–8小时。使用脱盐板平行纯化所得聚合物。这种半自动化的工作流程极大地提高了合成能力,并能够在一天内并行制备约400个RHP(四个板)。如果仅使用活化的有机卤化物进行改性,则产量可以很容易地提高到每天约1200个RHP(12个板)。
作者之前合成了两种硒多肽P(EGx-SeHC)(x = 3或4),但它们仅表现出弱活性。在这里,试图通过该平台改善RHP的类GPx活动,并为未来的工作提供有关SAR的信息。选择了七种具有良好水溶性的有机卤化物用于PPM。这些有机卤化物具有不同的结构特征,包括电荷、氢键供体和受体、中性极性基团、炔基和芳香基。荧光素被连接到前体聚合物的氨基末端(聚合度 = 70)作为内部标记,以量化每个孔中的聚合物含量。在先前优化研究的基础上,作者建立了一个工作流程,在10秒内执行RHP的HTS、并行纯化和活性分析。然而,即使有这样的吞吐量,假设RHP的空间也太大,无法充分探索。因此,作者采用了目前在化学界备受关注的贝叶斯优化来帮助确定实验的优先级并加速发现。使用贝叶斯优化进行了四次迭代,共约660个实验,每次迭代166个实验。研究发现,虽然随机搜索始终能找到活动范围在150–200之间的候选者,但贝叶斯优化有效地找到了具有更高改进型谷胱甘肽过氧化物酶(GPx)样活动的RHP,特别是在第三次和第四次迭代中。为了进一步验证结果,在烧瓶中合成了贝叶斯优化的两个命中,并评估了它们的GPx样活性。Hit-1表现出比用Hal-19修饰的同源多肽高约两倍的GPx样活性,Hal-19是设计空间中最具活性的同源多肽,这意味着RHP的活性不仅仅是每个组分活性的归一化平均值。虽然详细的SAR目前正在研究中,但上述结果表。