طراحی de novo و دقیق در سطح اتمی آنتی‌بادی‌ها با RFdiffusion

0

چکیده

با وجود نقش محوری آنتی‌بادی‌ها در پزشکی مدرن، در حال حاضر هیچ روشی برای طراحی کاملاً محاسباتی (in silico) آنتی‌بادی‌های جدید و اختصاصی برای یک اپی‌توپ مشخص وجود ندارد. در عوض، کشف آنتی‌بادی در حال حاضر به ایمن‌سازی، غربالگری کتابخانه‌های تصادفی یا جداسازی مستقیم آنتی‌بادی‌ها از بیماران متکی است. در این مقاله، ما نشان می‌دهیم که ترکیب طراحی محاسباتی پروتئین با استفاده از یک شبکه RFdiffusion بهینه‌سازی‌شده و غربالگری نمایش سطحی مخمر (yeast display screening)، امکان تولید de novo زنجیره‌های سنگین متغیر آنتی‌بادی (VHHs)، قطعات متغیر تک‌زنجیره‌ای (scFvs) و آنتی‌بادی‌های کامل را فراهم می‌آورد که با دقتی در سطح اتمی به اپی‌توپ‌های مشخص‌شده توسط کاربر متصل می‌شوند. ما به‌صورت تجربی ویژگی‌های اتصال‌دهنده‌های VHH را برای چهار اپی‌توپ مرتبط با بیماری بررسی کردیم. میکروسکوپ الکترونی کرایو (Cryo-EM) حالت اتصال VHHهای طراحی‌شده را که هماگلوتینین آنفولانزا و توکسین B کلستریدیوم دیفیسیل (TcdB) را هدف قرار می‌دهند، تأیید می‌کند. یک ساختار با وضوح بالا از VHH هدف‌گیرنده آنفولانزا، دقت اتمی نواحی تعیین‌کننده مکمل (CDRs) طراحی‌شده را اثبات می‌کند. اگرچه طراحی‌های محاسباتی اولیه تمایل اتصال متوسطی (در محدوده ده‌ها تا صدها نانومولار Kd) از خود نشان می‌دهند، بلوغ تمایل (affinity maturation) با استفاده از OrthoRep امکان تولید اتصال‌دهنده‌هایی با تمایل نانومولار تک‌رقمی را فراهم می‌کند که گزینش‌پذیری اپی‌توپ مورد نظر را حفظ می‌کنند. ما همچنین طراحی de novo scFvها را برای TcdB و یک کمپلکس پپتید PHOX2B-MHC با ترکیب CDRهای طراحی‌شده از زنجیره‌های سنگین و سبک نشان می‌دهیم. میکروسکوپ الکترونی کرایو حالت اتصال دو scFv متمایز برای TcdB را تأیید می‌کند و داده‌های با وضوح بالا برای یکی از طراحی‌ها، طراحی دقیق در سطح اتمی کانفورماسیون هر شش حلقه CDR را به اثبات می‌رساند. رویکرد ما چارچوبی برای طراحی محاسباتی، غربالگری و مشخصه‌یابی آنتی‌بادی‌های کاملاً de novo با دقت در سطح اتمی، هم در ساختار و هم در هدف‌گیری اپی‌توپ، ایجاد می‌کند.

متن اصلی

آنتی‌بادی‌ها دسته غالب درمان‌های پروتئینی هستند؛ به‌طوری‌که بیش از ۱۶۰ داروی آنتی‌بادی در حال حاضر در سراسر جهان مجوز گرفته‌اند و انتظار می‌رود ارزش بازار آن‌ها در ۵ سال آینده به ۴۴۵ میلیارد دلار آمریکا برسد. توسعه آنتی‌بادی معمولاً در دو مرحله انجام می‌شود: (۱) کشف آنتی‌بادی‌هایی که به یک اپی‌توپ خاص متصل می‌شوند؛ و (۲) بلوغ تمایل و بهینه‌سازی بالینی آن آنتی‌بادی‌ها. در حال حاضر، شناسایی آنتی‌بادی‌های اختصاصی برای یک اپی‌توپ به ایمن‌سازی حیوانات یا غربالگری کتابخانه‌های آنتی‌بادی برای یافتن مولکول‌های کاندیدی که به هدف مورد نظر متصل می‌شوند، و سپس نقشه‌برداری اپی‌توپ بعدی، متکی است. این روش‌ها طاقت‌فرسا، زمان‌بر و ممکن است در شناسایی آنتی‌بادی‌هایی که با اپی‌توپ مرتبط با درمان تعامل دارند، ناموفق باشند. تلاش‌ها در زمینه طراحی محاسباتی آنتی‌بادی‌ها عموماً بر مرحله دوم بهینه‌سازی در توسعه آنتی‌بادی متمرکز بوده است، مانند نمونه‌برداری از حلقه‌های CDR طبیعی جایگزین برای بهبود تمایل اتصال یا استفاده از طراحی توالی Rosetta برای بهبود نواحی تعاملی. اخیراً، شبکه‌های یادگیری عمیق مبتنی بر ساختار و توالی برای طراحی واریانت‌های جدید توالی آنتی‌بادی آموزش داده شده‌اند، اما این روش‌ها نیازمند یک آنتی‌بادی متصل‌شونده اولیه برای بهینه‌سازی هستند. همچنین پیشرفت‌های اخیر در بهینه‌سازی آنتی‌بادی با روش‌های یادگیری عمیق که بر روی داده‌های تولیدشده توسط روش‌های تجربی قدرتمند جدید آموزش دیده‌اند، وجود داشته است. در مقابل، روش‌های محاسباتی قادر به انجام مرحله اول طراحی آنتی‌بادی (تولید آنتی‌بادی‌های متصل‌شونده به اپی‌توپ خاص) وجود ندارند و بنابراین، طراحی de novo (بدون همولوژی با آنتی‌بادی موجود که آن اپی‌توپ را هدف قرار می‌دهد) آنتی‌بادی‌ها همچنان یک مسئله حل‌نشده باقی مانده است. پیشرفت سریعی در طراحی پروتئین‌های متصل‌شونده (غیر از آنتی‌بادی) با استفاده از RFdiffusion حاصل شده است. با این حال، همانند سایر روش‌های طراحی فصل مشترک de novo، این اتصال‌دهنده‌ها تقریباً به طور انحصاری به تعاملات مبتنی بر ساختار ثانویه منظم (مارپیچ یا رشته) با اپی‌توپ هدف متکی هستند، و بنابراین شبکه اصلی (‘vanilla’) RFdiffusion قادر به طراحی de novo آنتی‌بادی‌ها نیست (شکل تکمیلی ۱؛ به مرجع مراجعه کنید).

یک روش ایده‌آل برای طراحی آنتی‌بادی‌های de novo باید این امکانات را فراهم کند: (۱) هدف‌گیری هر اپی‌توپ مشخص بر روی هر هدف مورد نظر؛ (۲) تمرکز نمونه‌برداری بر روی حلقه‌های CDR، در حالی که توالی و ساختار چارچوب به یک چارچوب آنتی‌بادی درمانی بسیار بهینه‌سازی‌شده و مشخص‌شده توسط کاربر نزدیک باقی بماند؛ و (۳) نمونه‌برداری از جایگاه‌های مختلف آنتی‌بادی طراحی‌شده نسبت به اپی‌توپ به‌صورت جسم صلب (rigid-body). ما این فرضیه را مطرح کردیم که یک نسخه تخصصی از RFdiffusion که بر روی ساختارهای آنتی‌بادی بهینه‌سازی شده باشد، باید قادر به طراحی فصل مشترک‌های جدید با واسطه CDR باشد. این فرضیه با توجه به تنوع و کیفیت فصل مشترک‌های de novo که RFdiffusion می‌تواند طراحی کند و با توجه به اینکه ترمودینامیک زیربنایی تشکیل فصل مشترک یکسان است، مطرح شد و ما برای توسعه چنین روشی اقدام کردیم.

آموزش RFdiffusion برای طراحی آنتی‌بادی

RFdiffusion از نمایش چارچوب AlphaFold2 (مرجع) و RF2 برای ستون فقرات پروتئین‌ها استفاده می‌کند که شامل مختصات کربن آلفا (Cα) و جهت‌گیری صلب N-Cα-C برای هر اسید آمینه است. در طول آموزش، از یک برنامه نویزدهی استفاده می‌شود که در طی تعداد مشخصی از «گام‌های زمانی» (T)، چارچوب‌های پروتئین را به سمت توزیع‌های پیشین تصادفی تخریب می‌کند (مختصات Cα با نویز گاوسی سه‌بعدی و جهت‌گیری‌های اسید آمینه با حرکت براونی روی SO3 تخریب می‌شوند). در حین آموزش، یک ساختار از بانک داده پروتئین (PDB) و یک گام زمانی تصادفی (t) نمونه‌برداری شده و t گام نویزدهی بر روی ساختار اعمال می‌شود. RFdiffusion ساختار بدون نویز (pX0) را در هر گام زمانی پیش‌بینی می‌کند و یک تابع هزینه میانگین مربعات خطا بین ساختار واقعی (X0) و پیش‌بینی (pX0) کمینه می‌شود. در زمان استنتاج، یک توزیع تصادفی از اسیدهای آمینه (XT) نمونه‌برداری شده و RFdiffusion به طور مکرر آن را بدون نویز می‌کند تا ساختارهای پروتئینی جدیدی تولید کند.

ما RFdiffusion را عمدتاً بر روی ساختارهای کمپلکس آنتی‌بادی بهینه‌سازی کردیم (شکل ۱؛ به بخش روش‌ها در اطلاعات تکمیلی مراجعه کنید). در هر مرحله از آموزش، ساختار آنتی‌بادی تخریب می‌شود. برای اینکه بتوان ساختار و توالی چارچوب را در زمان استنتاج مشخص کرد، توالی و ساختار چارچوب به عنوان ورودی شرطی به RFdiffusion در طول آموزش ارائه می‌شود (شکل ۱b). از آنجا که مطلوب است موقعیت جسم صلب (dock) بین آنتی‌بادی و هدف توسط RFdiffusion همراه با کانفورماسیون حلقه‌های CDR طراحی شود، ساختار چارچوب به صورت مستقل از چارچوب جهانی در طول آموزش ارائه می‌شود (شکل ۱c). ما از «مسیر الگو» (template track) RF2/RFdiffusion برای ارائه ساختار چارچوب به صورت یک ماتریس دوبعدی از فواصل دوتایی و زوایای دووجهی بین هر جفت اسید آمینه استفاده می‌کنیم (نمایشی که از آن می‌توان ساختارهای سه‌بعدی را با دقت بازسازی کرد) (شکل تکمیلی ۱a). الگوهای چارچوب و هدف، موقعیت نسبی خود را در فضای سه‌بعدی کدگذاری نمی‌کنند. در این کار، ما توالی و ساختار ناحیه چارچوب را ثابت نگه داشتیم و بر طراحی CDRها و جایگذاری کلی آنتی‌بادی به‌صورت جسم صلب نسبت به هدف تمرکز کردیم. ما RFdiffusion را با یک ویژگی اضافی «نقطه داغ» (hotspot) که به‌صورت کدگذاری یک-از-k (one-hot) ارائه می‌شود، آموزش دادیم. این ویژگی بخشی از اسیدهای آمینه‌ای را که CDRهای آنتی‌بادی با آن‌ها تعامل دارند، مشخص می‌کند تا در زمان استنتاج، بتوانیم آنتی‌بادی‌ها را به سمت یک سایت خاص هدایت کنیم (شکل ۱d؛ ما در ادامه متن به این سایت‌ها «اپی‌توپ» می‌گوییم). برای سادگی، ما در ادامه این مقاله از این نسخه بهینه‌سازی‌شده شبکه با عنوان RFdiffusion یاد می‌کنیم.

شکل ۱: مروری بر RFdiffusion برای طراحی آنتی‌بادی.
شکل ۱

الف، RFdiffusion به گونه‌ای آموزش داده می‌شود که در زمان T، نمونه‌ای از توزیع پیشین (توزیع گاوسی سه‌بعدی برای انتقالات و توزیع یکنواخت SO3 برای چرخش‌ها) گرفته شده و بین زمان‌های T و 0 بدون نویز می‌شود تا یک scFv (در این مورد) تولید گردد. ب، چارچوب آنتی‌بادی به عنوان یک توالی و «الگو» به RFdiffusion ارائه می‌شود؛ الگو فواصل دوتایی و زوایای دووجهی بین اسیدهای آمینه چارچوب را مشخص می‌کند. به عنوان مثال، می‌توان طراحی یک VHH (بالا) یا scFv (پایین) را مشخص کرد. ج، تنوع در حالت اتصال (dock) آنتی‌بادی-هدف به این دلیل حاصل می‌شود که الگوی چارچوب، رابطه جسم صلب چارچوب-هدف را کدگذاری نمی‌کند. حالت‌های اتصال متنوع توسط RFdiffusion نمونه‌برداری می‌شوند. د، اپی‌توپ با ارائه اسیدهای آمینه «نقطه داغ» (hotspot) مشخص می‌شود که آنتی‌بادی طراحی‌شده را هدایت می‌کنند (مقایسه کنید نارنجی، چپ، با صورتی، راست). هـ، مروری بر خط لوله طراحی محاسباتی که در این مقاله شرح داده شده است. RFdiffusion با دریافت هدف، نقاط داغ اپی‌توپ و چارچوب آنتی‌بادی، مرحله طراحی ستون فقرات را انجام می‌دهد. ProteinMPNN تنها توالی اسیدهای آمینه CDR (و نه اسیدهای آمینه چارچوب) را طراحی می‌کند. RoseTTAFold2 بهینه‌سازی‌شده ساختار آنتی‌بادی طراحی‌شده را با دریافت هدف (توالی، ساختار و به‌صورت اختیاری بخشی از اسیدهای آمینه نقطه داغ) و توالی آنتی‌بادی طراحی‌شده پیش‌بینی می‌کند. خودسازگاری (شباهت بالا بین ساختارهای پیش‌بینی‌شده و طراحی‌شده) و اطمینان بالا (خطای هم‌ترازی پیش‌بینی‌شده پایین) موفقیت محاسباتی (in silico) را تعریف می‌کنند. توجه داشته باشید که AlphaFold3 که در زمان انجام این کار در دسترس نبود، پیش‌بینی‌کننده بهتری برای موفقیت نسبت به RoseTTAFold2 است. و، سهم این کار، خط لوله طراحی آنتی‌بادی اختصاصی برای اپی‌توپ است که در پنل هـ نشان داده شده است. چندین روش می‌تواند برای اعتبارسنجی تجربی طراحی‌ها و سپس بلوغ تمایل یا بهینه‌سازی آن‌ها استفاده شود. در این کار، ما از نمایش سطحی مخمر و/یا بیان در E. coli با SPR برای اعتبارسنجی تجربی (به ترتیب حدود ۶ هفته و ۲ هفته پس از سفارش الیگونوکلئوتید) و بلوغ تمایل OrthoRep استفاده کردیم.

با این رژیم آموزشی، RFdiffusion قادر است ساختارهای آنتی‌بادی را طراحی کند که با ساختار چارچوب ورودی مطابقت نزدیکی داشته و با حلقه‌های CDR جدید، اپی‌توپ مشخص‌شده را هدف قرار دهد (شکل تکمیلی ۱). پس از مرحله RFdiffusion، ما از ProteinMPNN برای طراحی توالی حلقه‌های CDR استفاده می‌کنیم. آنتی‌بادی‌های طراحی‌شده تعاملات متنوعی با اپی‌توپ هدف برقرار می‌کنند و به طور قابل توجهی با توالی‌های موجود در مجموعه داده آموزشی متفاوت هستند (شکل داده‌های گسترده ۱). هیچ همبستگی بین شباهت به مجموعه داده آموزشی و موفقیت در اتصال وجود نداشت (شکل داده‌های گسترده ۱الف، خطوط قرمز).

بهینه‌سازی RF2 برای اعتبارسنجی آنتی‌بادی

خطوط لوله طراحی معمولاً طیف گسترده‌ای از راه‌حل‌ها را برای هر چالش طراحی مشخص تولید می‌کنند. یک راه مؤثر برای فیلتر کردن پروتئین‌ها و فصل مشترک‌های طراحی‌شده که به احتمال زیاد از نظر تجربی موفق خواهند بود، بر اساس شباهت ساختار طراحی‌شده با ساختار پیش‌بینی‌شده توسط AlphaFold2 برای توالی طراحی‌شده است (این اغلب به عنوان «خودسازگاری» شناخته می‌شود)، که نشان داده شده است با موفقیت تجربی همبستگی خوبی دارد. با این حال، در مورد آنتی‌بادی‌ها، AlphaFold2 در پیش‌بینی دقیق ساختارهای آنتی‌بادی-آنتی‌ژن ناموفق است، که استفاده از آن را به عنوان یک فیلتر در خط لوله طراحی آنتی‌بادی غیرممکن می‌سازد، و در ابتدای این پروژه، AlphaFold3 (مرجع) در دسترس نبود.

ما به دنبال بهبود فیلتر کردن طراحی‌ها با بهینه‌سازی RoseTTAFold2 بر روی ساختارهای آنتی‌بادی بودیم. برای ساده‌سازی پیش‌بینی ساختار آنتی‌بادی، ما در طول آموزش اطلاعاتی در مورد ساختار هدف و محل اپی‌توپ هدف که آنتی‌بادی به آن متصل می‌شود، ارائه دادیم؛ RF2 بهینه‌سازی‌شده همچنان باید CDRها را به درستی مدل‌سازی کرده و جهت‌گیری صحیح آنتی‌بادی را نسبت به ناحیه هدف پیدا کند. منطق ارائه این اطلاعات این است که ساختار هدف و محل اتصال در طول طراحی در دسترس هستند (اما معمولاً در طول پیش‌بینی ساختار عمومی در دسترس نیستند). با این رژیم آموزشی و اطلاعات اضافی، RF2 قادر است به طور قوی جفت‌های واقعی آنتی‌بادی-آنتی‌ژن را از جفت‌های فریبنده تشخیص دهد و اغلب ساختارهای کمپلکس آنتی‌بادی-آنتی‌ژن را با دقت پیش‌بینی می‌کند، اما تنها زمانی که کانفورماسیون متصل (holo) ساختار هدف و اطلاعات اپی‌توپ ارائه شود (شکل داده‌های گسترده ۲الف-د). در پیش‌بینی مونومر، RF2 بهینه‌سازی‌شده از مدل‌های قبلی که در آن زمان موجود بودند، عملکرد بهتری داشت، به‌ویژه در پیش‌بینی ساختار CDR H3 (شکل داده‌های گسترده ۲هـ،و).

هنگامی که این شبکه RF2 بهینه‌سازی‌شده برای پیش‌بینی مجدد ساختار VHHهای طراحی‌شده با RFdiffusion استفاده می‌شود، بخش قابل توجهی از آنها با اطمینان پیش‌بینی می‌شوند که تقریباً به همان شکلی که طراحی شده‌اند، متصل می‌شوند (شکل داده‌های گسترده ۳الف). علاوه بر این، تجزیه و تحلیل‌های واکنش متقاطع محاسباتی نشان داد که VHHهای طراحی‌شده با RFdiffusion به ندرت پیش‌بینی می‌شود که به پروتئین‌های نامرتبط متصل شوند (شکل داده‌های گسترده ۳ب). VHHهایی که با اطمینان پیش‌بینی می‌شود به هدف طراحی‌شده خود متصل شوند، پیش‌بینی می‌شود که فصل مشترک‌های با کیفیتی را تشکیل دهند، که با Rosetta ddG اندازه‌گیری می‌شود (شکل داده‌های گسترده ۳ج). این نشان می‌دهد که فیلتر کردن با RF2 ممکن است اتصال‌دهنده‌هایی را که از نظر تجربی موفق هستند، غنی‌سازی کند.

طراحی و مشخصه‌یابی VHHها

ما در ابتدا بر طراحی آنتی‌بادی‌های تک‌دامنه‌ای (VHHs) که توسط شترسانان تولید می‌شوند، تمرکز کردیم. تا به امروز، دو درمان مبتنی بر VHH توسط FDA تأیید شده و کارآزمایی‌های بالینی بسیاری در حال انجام است. با وجود داشتن حلقه‌های CDR کمتر (سه) نسبت به آنتی‌بادی‌های معمولی (شش)، میانگین سطح فصل مشترک تعاملی یک VHH بسیار شبیه به یک آنتی‌بادی است، که نشان می‌دهد روشی که قادر به طراحی VHH باشد، می‌تواند برای طراحی آنتی‌بادی نیز مناسب باشد. در واقع، معیارهای محاسباتی برای scFvها و VHHها کیفیت مشابهی از فصل مشترک‌ها را نشان دادند، که توسط Rosetta و RF2 بهینه‌سازی‌شده ارزیابی شد (شکل داده‌های گسترده ۳ب-و).

ما یک چارچوب VHH انسانی‌شده که به طور گسترده استفاده می‌شود (h-NbBcII10FGLA) را به عنوان پایه کمپین‌های طراحی VHH خود انتخاب کردیم و VHHهایی را برای طیف وسیعی از اهداف مرتبط با بیماری طراحی کردیم: توکسین TcdB از C. difficile، هماگلوتینین H1 آنفولانزا، سایت‌های I و III ویروس سین‌سیشیال تنفسی (RSV)، دامنه اتصال به گیرنده (RBD) SARS-CoV-2 و IL-7Rα. طراحی‌های فیلترشده محاسباتی یا با توان بالا توسط نمایش سطحی مخمر (۹۰۰۰ طراحی برای هر هدف؛ سایت‌های I و III RSV، RBD و هماگلوتینین آنفولانزا) یا با توان پایین‌تر با بیان در اشریشیا کلی و رزونانس پلاسمون سطحی (SPR) با غلظت واحد (۹۵ طراحی برای هر هدف؛ TcdB، IL-7Rα و هماگلوتینین آنفولانزا؛ مورد آخر با هر دو روش غربالگری شد) غربالگری شدند.

اتصال‌دهنده‌های با بالاترین تمایل برای سایت III RSV، هماگلوتینین آنفولانزا، RBD و TcdB به ترتیب در شکل ۲الف-ج،هـ نشان داده شده‌اند (همچنین برای تمام ردپاهای SPR اتصال‌دهنده‌های VHH تأیید شده در این مطالعه به شکل تکمیلی ۲ و برای نرخ موفقیت در برابر هر هدف که از ۰٪ تا ۲٪ متغیر است، به جدول ۶ روش‌های تکمیلی مراجعه کنید). حلقه‌های CDR از VHHهای مشاهده‌شده در طبیعت متمایز هستند، که نشان‌دهنده تعمیم قابل توجهی فراتر از مجموعه داده آموزشی است (شکل داده‌های گسترده ۱). از بین اتصال‌دهنده‌های هماگلوتینین که در برابر مونومر هماگلوتینین تولیدشده در سلول حشره آزمایش شدند، اتصال‌دهنده با بالاترین تمایل دارای ثابت تفکیک (Kd) ۷۸ نانومولار بود (شکل ۲ب)، در حالی که سایر اتصال‌دهنده‌ها تمایل‌های ۵۴۶، ۶۹۸ و ۷۹۰ نانومولار داشتند. برای TcdB، اپی‌توپ هدف، فصل مشترک Frizzled بود که هیچ آنتی‌بادی یا VHH در PDB وجود ندارد که این سایت را هدف قرار دهد. برای بهترین VHH طراحی‌شده هم از RBD (Kd = ۵.۵ میکرومولار؛ شکل ۲ج) و هم از TcdB (Kd = ۲۶۰ نانومولار؛ شکل ۲د)، تأیید شد که اتصال به اپی‌توپ مورد نظر است: با افزودن یک اتصال‌دهنده de novo طراحی‌شده و از نظر ساختاری مشخص‌شده قبلی به آن اپی‌توپ (AHB2 (PDB ID 7UHB) برای RBD و FZD48 (PDB ID 9CM5 (مرجع)) برای TcdB)، اتصال به طور کامل از بین رفت (شکل ۲ج،د و شکل داده‌های گسترده ۴الف-ج). این VHH TcdB همچنین سمیت TcdB را در سلول‌های ناک‌اوت شده CSPG4 (یک گیرنده جایگزین TcdB) با غلظت مؤثر نیمه-ماکزیمم (EC50) ۴۶۰ نانومولار خنثی کرد (شکل داده‌های گسترده ۴د،هـ). برای TcdB، تعاملات اختصاصی بودند و هیچ اتصالی به توکسین کشنده Paeniclostridium sordellii (TcsL) که بسیار مرتبط است (همولوژی توالی ۷۰٪)، مشاهده نشد (شکل داده‌های گسترده ۴ب). این داده‌ها توانایی RFdiffusion را در طراحی VHHهایی که تعاملات اختصاصی با اپی‌توپ هدف برقرار می‌کنند، نشان می‌دهند.

شکل ۲: مشخصه‌یابی بیوشیمیایی VHHهای طراحی‌شده.
شکل ۲

الف،ب، نه هزار VHH طراحی‌شده در برابر سایت III RSV (الف؛ VHH_RSV_01) و هماگلوتینین آنفولانزا (ب؛ VHH_flu_01) با نمایش سطحی مخمر غربالگری شدند، پیش از بیان محلول بهترین‌ها در E. coli. SPR نشان داد که VHHهای با بالاترین تمایل به سایت III RSV و هماگلوتینین به ترتیب با تمایل ۱.۴ میکرومولار و ۷۸ نانومولار به اهداف مربوطه خود متصل می‌شوند. ج، نه هزار طراحی VHH در برابر RBD SARS-CoV-2 آزمایش شدند و پس از بیان محلول، SPR تمایل ۵.۵ میکرومولار را برای طراحی VHH_RBD_D4 به هدف تأیید کرد (چپ). اتصال به اپی‌توپ مورد انتظار بود که با رقابت با یک اتصال‌دهنده de novo تأیید شده از نظر ساختاری (AHB2 (PDB ID 7UHB)، راست) تأیید شد. د، نود و پنج طراحی VHH در برابر TcdB C. difficile آزمایش شدند. VHH با بالاترین تمایل، VHH_TcdB_H2، با تمایل ۲۶۲ نانومولار متصل شد (چپ)، و همچنین با یک اتصال‌دهنده de novo تأیید شده از نظر ساختاری (FZD48، PDB ID 9CM5 (مرجع)) به همان اپی‌توپ رقابت کرد (راست). برای کمی‌سازی رقابت نشان داده شده در پنل‌های ج و د به شکل داده‌های گسترده ۴الف-ج نیز مراجعه کنید. در تمام پنل‌ها، پاسخ اتصال اندازه‌گیری شده با خط آبی پررنگ و برازش کلی با استفاده از مدل تعامل ۱:۱ با خط چین‌دار سیاه نشان داده شده است.

میکروسکوپ الکترونی کرایو از VHH متصل‌شونده به هماگلوتینین آنفولانزا

ما به دنبال ارزیابی دقت طراحی از طریق تعیین ساختار با میکروسکوپ الکترونی کرایو (cryo-EM) از VHHهای طراحی‌شده ضد هماگلوتینین در کمپلکس با گلیکوپروتئین هماگلوتینین تریمری آنفولانزا (سویه A/USA:Iowa/1943 H1N1؛ شکل تکمیلی ۴) که به طور طبیعی گلیکوزیله شده است، بودیم. این پروتئین اپی‌توپ ساقه حفاظت‌شده را که در طول طراحی محاسباتی VHH و غربالگری بیوشیمیایی بالادستی استفاده شده بود، حفظ می‌کند. پردازش داده‌های cryo-EM نشان داد که یک طراحی VHH به طور مؤثر به تریمر هماگلوتینین کاملاً گلیکوزیله شده متصل می‌شود (از بین چهار مورد آزمایش شده)، که از این پس به عنوان VHH_flu_01 نامیده می‌شود (شکل ۳ و شکل داده‌های گسترده ۵). طبقه‌بندی دوبعدی تمام ذرات در مجموعه داده (شکل ۳الف) و ساختار ۳.۰ آنگسترومی تعیین‌شده از کمپلکس (شکل ۳ب و جدول ۱۰ روش‌های تکمیلی) نشان داد که تقریباً ۶۶٪ از ذرات هماگلوتینین به حداکثر دو VHH در هر تریمر متصل شده‌اند (شکل ۳الف-ح). این اشغال جزئی احتمالاً به گلیکان N296 نسبت داده می‌شود که در زیرواحدهای غیرمتصل، اپی‌توپ هدف را تا حدی مسدود می‌کند اما هنگام اتصال به VHH_flu_01 تغییر جهت می‌دهد (شکل ۳ح را ببینید).

شکل ۳: مشخصه‌یابی ساختاری با میکروسکوپ الکترونی کرایو (Cryo-EM) از اتصال VHH طراحی‌شده de novo به هماگلوتینین آنفولانزا و TcdB.
شکل ۳

الف، میانگین‌های کلاس دوبعدی cryo-EM برچسب‌گذاری‌شده از VHH_flu_01 طراحی‌شده که به هماگلوتینین (HA) آنفولانزا سویه A/USA:Iowa/1943 H1N1 متصل است. ب، بازسازی سه‌بعدی cryo-EM با وضوح ۳.۰ آنگستروم نشان می‌دهد که VHH_flu_01 به H1 در امتداد ساقه در دو پروتومر متصل شده است. ج، ساختار cryo-EM از VHH_flu_01 متصل به هماگلوتینین آنفولانزا. د، انطباق ساختار CDR3 VHH طراحی‌شده با ساختار cryo-EM. هـ، مقایسه روتامرهای پیش‌بینی‌شده CDR3 با ساختار cryo-EM ساخته‌شده با وضوح ۳.۰ آنگستروم. و،ز، ساختار cryo-EM با طراحی مطابقت نزدیکی دارد. ح، بررسی پروتومرهای هماگلوتینین آزاد (apo) در کنار پروتومرهای متصل به VHH طراحی‌شده، جابجایی گلیکان N296 را برای امکان اتصال VHH طراحی‌شده به ساقه نشان می‌دهد. ط، میانگین‌های کلاس دوبعدی cryo-EM برچسب‌گذاری‌شده از VHH طراحی‌شده، VHH_TcdB_H2، متصل به TcdB کامل. ی، بازسازی سه‌بعدی cryo-EM با وضوح ۴.۶ آنگستروم از کمپلکس نشان می‌دهد که VHH_TcdB_H2 همان‌طور که پیش‌بینی شده بود به اپی‌توپ هدف متصل شده است. CROPs، الیگوپپتیدهای تکراری ترکیبی؛ GTD، دامنه گلوکوزیل‌ترانسفراز. ک، به دلیل وضوح متوسط، ابتدا قطعه‌ای از TcdB در نقشه چگالی cryo-EM داک شد و سپس مدل طراحی کامل—شامل قطعه TcdB و VHH طراحی‌شده—با قطعه TcdB از پیش جایگذاری‌شده، هم‌تراز شد. طراحی پیش‌بینی‌شده با کمپلکس تعیین‌شده تجربی در ساختار، هدف‌گیری اپی‌توپ و کانفورماسیون کلی مطابقت نزدیکی دارد. ل، میانگین‌های کلاس دوبعدی cryo-EM برچسب‌گذاری‌شده از VHH طراحی‌شده، VHH_TcdB_H2_ortho، متصل به TcdB کامل. م، بازسازی سه‌بعدی cryo-EM با وضوح ۵.۷ آنگستروم از کمپلکس نشان می‌دهد که VHH_TcdB_H2_ortho همان‌طور که پیش‌بینی شده بود به اپی‌توپ هدف متصل شده است. ن، قطعه‌ای از TcdB در نقشه cryo-EM داک شد و سپس مدل کامل شامل VHH بالغ‌شده با OrthoRep هم‌تراز شد. ساختار حاصل هیچ تغییر قابل تشخیصی در جهت اتصال یا زاویه داکینگ نسبت به طراحی اصلی نشان نمی‌دهد، که نشان می‌دهد بلوغ OrthoRep حالت پیش‌بینی‌شده تعامل با اپی‌توپ را حفظ کرده است. در تمام پنل‌ها: زرد نشان‌دهنده هماگلوتینین است؛ خاکستری نشان‌دهنده پیش‌بینی طراحی محاسباتی است؛ صورتی یا سرمه‌ای نشان‌دهنده VHH (cryo-EM) است؛ و فیروزه‌ای نشان‌دهنده گلیکان است.

ساختار هماگلوتینین آنفولانزا که به دو نسخه از VHH_flu_01 متصل است (شکل ۳ب،ج و شکل داده‌های گسترده ۵)، زاویه نزدیک شدن VHH را نشان می‌دهد که با مدل پیش‌بینی‌شده مطابقت نزدیکی دارد (شکل ۳و) و ستون فقرات VHH بسیار به طراحی RFdiffusion نزدیک است، با انحراف معیار جذر میانگین مربعات (RMSD) محاسبه‌شده ۱.۴۵ آنگستروم (شکل ۳ز). ساختار CDR3 نیز بین ساختار cryo-EM و مدل محاسباتی بسیار مشابه است (RMSD = ۰.۸ آنگستروم؛ شکل ۳د)، و اسیدهای آمینه V100، V101، S103 و F108 در حلقه CDR3 طراحی‌شده de novo با اپی‌توپ ساقه هماگلوتینین آنفولانزا در ساختار cryo-EM تعامل دارند، همان‌طور که توسط RFdiffusion طراحی شده و با RF2 مجدداً پیش‌بینی شده است (شکل ۳هـ). این طراحی با نزدیک‌ترین آنتی‌بادی-VHH متصل به این اپی‌توپ در PDB بسیار متفاوت است (شکل داده‌های گسترده ۱و،ز و شکل تکمیلی ۵). در مجموع، این نتایج طراحی VHH را با دقت در سطح اتمی نشان می‌دهند.

میکروسکوپ الکترونی کرایو از VHHها برای TcdB و SARS-CoV-2

برای بهبود تمایل اتصال VHHهای طراحی‌شده de novo، ما از سیستم تکثیر DNA مستعد خطای متعامد، OrthoRep، برای جهش‌زایی مداوم ژن‌های هدف در داخل سلول زنده (in vivo) استفاده کردیم. نشان داده شده است که OrthoRep بلوغ سریع تمایل آنتی‌بادی‌های نمایش داده شده بر سطح مخمر را پیش می‌برد. ما از این قابلیت برای بلوغ تمایل VHHهایی که TcdB، هماگلوتینین H1 آنفولانزا و RBD SARS-CoV-2 را هدف قرار می‌دهند، استفاده کردیم. VHHهای بالغ‌شده چندین جهش نسبت به طراحی‌های والد خود کسب کردند و تمایل اتصال را تقریباً دو مرتبه بزرگی بهبود بخشیدند (شکل تکمیلی ۳)، که آنها را به کاندیداهای مناسبی برای مشخصه‌یابی ساختاری بعدی با cryo-EM تبدیل کرد.

برای TcdB، کمپین طراحی ما اپی‌توپ متصل‌شونده به Frizzled را که بر روی RBD قرار دارد، هدف قرار داد. TcdB از چهار دامنه عملکردی شامل یک دامنه مرکزی تحویل و RBD (DRBD) تشکیل شده است که VHHها برای اتصال به آن طراحی شده بودند. مشخصه‌یابی با cryo-EM از طراحی والد اصلی، VHH_TcdB_H2، تأیید کرد که VHH با اپی‌توپ هدف Frizzled DRBD درگیر می‌شود (شکل تکمیلی ۷). تجزیه و تحلیل از طریق طبقه‌بندی دوبعدی و سه‌بعدی ترکیبی از ذرات TcdB متصل و غیرمتصل را نشان داد (شکل ۳ط و شکل‌های تکمیلی ۶ و ۷). طبقه‌بندی گسترده سه‌بعدی و پالایش محلی چندین حالت ساختاری TcdB را در مجموعه داده شناسایی کرد، از جمله یک حالت گسترده متصل (شکل داده‌های گسترده ۶ و شکل تکمیلی ۸). پالایش سه‌بعدی VHH متصل در حالت TcdB گسترده، یک نقشه با وضوح متوسط ۴.۶ آنگستروم به دست داد که مدل طراحی با اطمینان در آن به صورت جسم صلب داک شد و تطابق بالایی با ساختار مورد نظر طراحی نشان داد (شکل ۳ط-ک). برای ارزیابی اینکه آیا تمایل بهبود یافته از طریق OrthoRep حالت اتصال اصلی طراحی والد را حفظ کرده است یا خیر، ما تجزیه و تحلیل cryo-EM اضافی بر روی VHH بالغ‌شده، VHH_TcdB_H2_ortho، انجام دادیم. این آزمایش‌ها نسبت بالایی از ذرات TcdB را که اکنون توسط VHH متصل شده‌اند، نشان داد که با تمایل افزایش یافته آن سازگار است (شکل ۳ل-ن و شکل تکمیلی ۳ب). با استفاده از یک خط لوله پردازش مشابه برای کمپلکس VHH-TcdB والد، ما کمپلکس VHH بالغ‌شده-TcdB را با وضوح متوسط ۵.۷ آنگستروم حل کردیم، که به ما امکان داد با اطمینان VHH طراحی‌شده را در چگالی cryo-EM با تطابق نزدیک داک کنیم. این تأیید کرد که VHH هدف‌گیری به اپی‌توپ صحیح را حفظ کرده و حالت اتصال اصلی خود را پس از بلوغ تمایل با واسطه OrthoRep حفظ کرده است (شکل ۳ل-ن و شکل داده‌های گسترده ۶). این نتایج قابلیت RFdiffusion را در طراحی VHHهای دقیق de novo که قادر به هدف قرار دادن اپی‌توپ‌های قبلاً کاوش‌نشده هستند و برای بلوغ تمایل بعدی مناسب هستند، برجسته می‌کند.

سپس ما از cryo-EM برای مشخصه‌یابی یک VHH بالغ‌شده (VHH_RBD_D4_ortho19) که RBD اسپایک SARS-CoV-2 را هدف قرار می‌دهد، استفاده کردیم، جایی که آزمایش‌های رقابتی نشان داد که VHH والد به اپی‌توپ مورد نظر متصل می‌شود (شکل ۲ج، شکل داده‌های گسترده ۴ج و شکل‌های تکمیلی ۳ب و ۹). RBD بین کانفورماسیون‌های «بالا» و «پایین» جابجا می‌شود و حالت «بالا» اتصال به گیرنده و ورود ویروس را ممکن می‌سازد. میانگین‌های کلاس دوبعدی cryo-EM و بازسازی‌های طبقه‌بندی سه‌بعدی از کمپلکس متصل به VHH ترکیبی از کانفورماسیون‌های RBD (۱-۲ «بالا») را نشان داد و چگالی VHH منحصراً در حالت بالا مشاهده شد. این با طراحی آن سازگار است، زیرا اپی‌توپ هدف در کانفورماسیون پایین مسدود شده است (شکل تکمیلی ۹الف،ب). پالایش کلی با وضوح تخمینی متوسط ۳.۹ آنگستروم، چگالی کاملاً مشخصی را برای قسمت پایینی پروتئین اسپایک (وضوح محلی تقریباً ۲.۵ آنگستروم) فراهم کرد، اما انعطاف‌پذیری نسبی RBD منجر به میانگین‌گیری قابل توجه سیگنال شد و باعث از بین رفتن چگالی در سطوح کانتور بالاتر گردید، که ارزیابی دقت طراحی VHH را غیرممکن ساخت (شکل تکمیلی ۹ج-هـ). گسترش تقارن و پالایش محلی به بهبود وضوح فصل مشترک RBD-VHH کمک کرد و فولد VHH مورد نظر و هدف‌گیری دقیق اپی‌توپ را پس از داکینگ جسم صلب مدل طراحی در نقشه چگالی تأیید کرد (شکل تکمیلی ۹و،ز)، که با داده‌های رقابت بیوشیمیایی ما (شکل ۲ج) مطابقت داشت. با این حال، اگرچه VHH به اپی‌توپ صحیح RBD متصل شد، حالت اتصال آن به طور قابل توجهی از مدل طراحی منحرف شد و در عوض یک تعامل عمدتاً با واسطه چارچوب را اتخاذ کرد که با پیش‌بینی‌های گذشته‌نگر AlphaFold3 مطابقت بیشتری داشت (شکل تکمیلی ۹ز،ح). به دلیل انحراف بین داک طراحی‌شده و داک تعیین‌شده تجربی، ما این مورد را به عنوان یک شکست در طراحی طبقه‌بندی کردیم.

طراحی scFvها با شش CDR طراحی‌شده

با توجه به موفقیت RFdiffusion در طراحی VHHها با سه CDR de novo، ما در مرحله بعد توانایی آن را برای طراحی هر دو زنجیره سنگین و سبک در قالب scFv آزمایش کردیم. از RFdiffusion برای تولید scFvهایی که سایت‌های اپی‌توپ خاصی را هدف قرار می‌دهند، با پیروی از استراتژی مشابه رویکرد طراحی VHH استفاده شد. با این حال، برخلاف VHHها که تنها سه CDR به صورت de novo ساخته می‌شدند، طراحی scFv شامل ساخت هر شش CDR بر روی هر دو زنجیره سنگین و سبک علاوه بر حالت داکینگ بود.

مشکل سنتز ژن برای scFvها بسیار بزرگتر از VHHها است، زیرا آنها برای مونتاژ ساده از جفت‌های الیگونوکلئوتیدهای معمولی سنتز شده بر روی آرایه‌های الیگونوکلئوتیدی بیش از حد طولانی هستند و جفت کردن منحصر به فرد آنها به دلیل همولوژی توالی بالا بین scFvها چالش‌برانگیز است. ما پروتکل‌های مونتاژ مرحله‌ای را توسعه دادیم که امکان ساخت کتابخانه‌هایی با زنجیره‌های سنگین و سبک را فراهم می‌کند که یا به طور خاص مانند مدل‌های طراحی جفت شده‌اند (شکل‌های تکمیلی ۱۰ و ۱۱) یا به صورت ترکیبی در زیرمجموعه‌هایی از طراحی‌ها با حالت‌های اتصال به هدف مشابه مخلوط شده‌اند (شکل تکمیلی ۱۲). رویکرد دوم به غلبه بر چالش بزرگتر طراحی دقیق شش CDR de novo کمک می‌کند، که امکان خطا را در مقایسه با مسئله VHH افزایش می‌دهد، زیرا تنها یک CDR نامطلوب می‌تواند اتصال را به خطر بیندازد. ما دریافتیم که با داشتن مجموعه‌هایی از طراحی‌های تقریباً منطبق بر هم که همان سایت را با همان حالت اتصال هدف قرار می‌دهند، scFvهای جدید تولید شده با ترکیب جفت‌های زنجیره‌های سنگین و سبک از طراحی‌های مختلف، با فراوانی مشابهی نسبت به طراحی‌های اصلی، با اطمینان پیش‌بینی می‌شوند که به سایت هدف در حالت اتصال طراحی‌شده متصل شوند (شکل داده‌های گسترده ۷الف). در مقابل، جفت‌سازی تصادفی و بدون توجه به ساختار به ندرت به اتصال‌دهنده‌های پیش‌بینی‌شده منجر می‌شد (شکل داده‌های گسترده ۷الف). از این رو، با مخلوط کردن CDRها از طراحی‌های مختلفی که در یک جهت‌گیری یکسان متصل می‌شوند، می‌توانیم به طور مؤثر بر شکست‌های ناشی از CDRهای منفرد که به طور ناقص طراحی شده‌اند، غلبه کنیم و در نتیجه یک راه‌حل ترکیبی برای یک مسئله پیچیده‌تر ترکیبی (طراحی scFv دو زنجیره‌ای در مقابل طراحی VHH یک زنجیره‌ای) ارائه دهیم. این استراتژی یک مزیت کلیدی طراحی مبتنی بر ساختار را برجسته می‌کند: جفت‌سازی «هوشمندانه» زنجیره‌های سنگین و سبک با یک مدل ساختاری از هر آنتی‌بادی امکان‌پذیر است و به کتابخانه‌های آنتی‌بادی طراحی‌شده de novo اجازه می‌دهد تا به مقیاس‌های قابل دستیابی با روش‌های سنتی مونتاژ کتابخانه برسند، علی‌رغم محدودیت‌های فعلی در سنتز ژن.

ما موفق شدیم scFvهای اختصاصی برای اپی‌توپ را از کتابخانه‌های ترکیبی سنگین-سبک (با پیچیدگی نظری حدود ۱۰ میلیون؛ شکل داده‌های گسترده ۷ب،ج و ۸الف-ج) شناسایی کنیم، اما از کتابخانه‌های جفت‌سازی ثابت (شکل تکمیلی ۱۳) موفق نشدیم. پس از بیان و خالص‌سازی، تجزیه و تحلیل SPR شش scFv متمایز که از دو داک منحصر به فرد که اپی‌توپ Frizzled TcdB را هدف قرار می‌دادند، طیفی از تمایل‌ها را نشان داد (شکل ۴د-ح): اتصال‌دهنده با بالاترین تمایل، scFv6، دارای Kd ۷۲ نانومولار بود (شکل ۴ز). تبدیل scFv به یک IgG1 کامل، آنتی‌بادی‌هایی تولید کرد که با تمایل قابل مقایسه (۶۸ نانومولار) متصل می‌شوند، که نشان می‌دهد روش طراحی ما می‌تواند برای تولید آنتی‌بادی‌های کامل استفاده شود (شکل ۴ط). هیچ آنتی‌بادی متصل به این اپی‌توپ در PDB وجود ندارد، از این رو، این موفقیت را نمی‌توان به یادآوری (memorization) نسبت داد. پیش‌بینی بعدی ساختار scFv با AlphaFold3 حالت اتصالی را نشان داد که با دو طراحی والد تقریباً منطبق بر هم که زنجیره‌های سبک و سنگین را فراهم کرده بودند، یکسان بود (شکل تکمیلی ۱۶ج،د). رقابت با یک گیرنده شناخته‌شده، Frizzled-7، برای این اپی‌توپ تأیید کرد که اتصال scFv5 در محل مورد نظر بوده است (شکل ۴ی). در مقابل، هیچ رقابتی در حضور CSPG4، یک گیرنده جایگزین که با اپی‌توپی در هسته توکسین تعامل دارد، مشاهده نشد. بنابراین، scFvهایی که اپی‌توپ‌های مشخص‌شده توسط کاربر را هدف قرار می‌دهند، می‌توانند از کتابخانه‌های ترکیبی طراحی‌شده با آگاهی از ساختار شناسایی شوند.

شکل ۴: مشخصه‌یابی بیوشیمیایی scFvهای مونتاژ شده ترکیبی با شش CDR طراحی‌شده.
شکل ۴

الف، هم‌ترازی چند توالی از شش scFv که به TcdB متصل می‌شوند. scFvهای ۱-۵ از یک خوشه ساختاری یکسان سرچشمه می‌گیرند، در حالی که scFv6 از یک خوشه متمایز است. ب،ج، پیش‌بینی‌های AlphaFold3 از scFv5 (ب) و scFv6 (ج) در کمپلکس با TcdB. پیش‌بینی می‌شود scFv5 و scFv6 به یک اپی‌توپ مشابه اما نه یکسان متصل شوند. جهت‌گیری پیش‌بینی‌شده scFv6 نسبت به TcdB در مقایسه با scFv5 چرخیده است. د، تمایل scFv5 به TcdB با SPR ۴۶۰ نانومولار بود. هـ، پیش‌بینی محاسباتی فصل مشترک scFv5-TcdB برای VH (قطعه متغیر زنجیره سنگین؛ چپ) و VL (قطعه متغیر زنجیره سبک؛ راست). و، scFv5، هنگامی که به عنوان یک IgG1 کامل بیان می‌شود، تمایل اتصال ۳۸۰ نانومولار به TcdB را با SPR نشان می‌دهد. ز، تمایل scFv6 به TcdB با SPR ۷۲ نانومولار بود. ح، پیش‌بینی محاسباتی فصل مشترک scFv6-TcdB برای VH (چپ) و VL (راست). ط، scFv6، هنگامی که به عنوان یک IgG1 کامل بیان می‌شود، تمایل اتصال ۶۸ نانومولار به TcdB را با SPR نشان می‌دهد. ی، scFv5 با Frizzled-7 رقابت می‌کند و با CSPG4 رقابت نمی‌کند، که نشان‌دهنده اتصال در محل مورد نظر است. scFv5 به یک تراشه CM5 کونژوگه شد و TcdB RBD با غلظت ۵۰ نانومولار به تنهایی یا مخلوط با ۱ میکرومولار از Frizzled-7، CSPG4 یا scFv5 روی آن جریان داده شد. ک،ل، تجزیه و تحلیل مقایسه‌ای SPR از اتصال B1.2.1 به C*07:02-PHOX2B در مقابل C*07:02-PHOX2B(R6A). scFv ایموبلایز شد و سپس اتصال در محل هدف و خارج از هدف در یک تیتراسیون هشت مرحله‌ای دو برابر با غلظت بالایی ۵ میکرومولار اندازه‌گیری شد. تجزیه و تحلیل سینتیک حالت پایدار (ک) و ردپای خام SPR (ل) از اتصال در محل هدف و خارج از هدف، اتصال اختصاصی به هدف مورد نظر را نشان می‌دهد. م، پیش‌بینی‌های AlphaFold3 از HLA-C*07:02 با پپتید PHOX2B (چپ) و PHOX2B(R6A) (راست). پیش‌بینی می‌شود R6 از PHOX2B در معرض حلال باشد. ن، پیش‌بینی AlphaFold3 از scFv B1.2.1 در کمپلکس با C*07:02-PHOX2B (چپ). تماس‌های قطبی پیش‌بینی‌شده با R6 پپتید PHOX2B (راست)، با واسطه CDRH3، CDRL1 و CDRL2 نیز نشان داده شده است. این شکل با استفاده از BioRender (http://biorender.com) ایجاد شده است.

در مرحله بعد، ما یک اپی‌توپ مرتبط با بالین را هدف قرار دادیم: پپتید QYNPIRTTF مشتق از ژن وابستگی نوروبلاستوما و تنظیم‌کننده اصلی رونویسی PHOX2B در کمپلکس با آلوتیپ HLA-C*07:02 از مجموعه سازگاری بافتی اصلی (MHC) (ما در ادامه به این پپتید به سادگی PHOX2B می‌گوییم). پپتید PHOX2B در ابتدا از طریق ایمونوپپتیدومیکس نمونه‌های مشتق از بیمار نوروبلاستوما کشف شد و با گیرنده‌های آنتی‌ژن کایمریک پپتید-محور (PC-CARs) برای درمان نوروبلاستومای پرخطر هدف قرار گرفته است. با این حال، PC-CARهای شناسایی شده قبلی محدود به تشخیص PHOX2B ارائه‌شده بر روی HLAهای گروه سرولوژیکی A9 هستند و آلوتیپ رایج HLA-C*07:02 را شامل نمی‌شوند (مرجع). هدف قرار دادن کمپلکس PHOX2B-HLA-C*07:02 می‌تواند جمعیت بیماران قابل درمان را به طور معناداری افزایش دهد و تمرکز توسعه درمانی‌های جاری بوده است. اخیراً، اتصال‌دهنده‌های (غیر آنتی‌بادی) طراحی‌شده محاسباتی برای PHOX2B-HLA-C*07:02 با استفاده از سیستم TRACeR-I توسعه یافته‌اند، در حالی که TCRهای با تمایل بالا برای هدف قرار دادن پپتیدها بر روی آلوتیپ‌های رایج HLA-C*08:02/HLA-C*05:01 شناسایی شده‌اند. یکی از مزایای طراحی مبتنی بر ساختار، توانایی هدف قرار دادن اسیدهای آمینه پپتیدی خاص برای دستیابی به ویژگی اتصال است (به جای اتصال فقط به MHC)، و بنابراین ما از RFdiffusion برای هدف قرار دادن اسید آمینه R6 استفاده کردیم که مشخص شده است در اتصال PC-CAR مهم است. با توجه به پایداری پایین کمپلکس PHOX2B-HLA-C*07:02 (دمای ذوب Tm برابر با ۴۴.۲ درجه سانتی‌گراد)، ما از یک رویکرد تثبیت‌شده با پیوند دی‌سولفیدی برای تهیه یک فرم تثبیت‌شده از هدف pHLA استفاده کردیم. با استفاده از رویکرد مونتاژ ترکیبی که در بالا توضیح داده شد، ما اتصال‌دهنده‌های scFv با تمایل متوسط (۴۰۰ نانومولار اندازه‌گیری شده با SPR و ۱ میکرومولار اندازه‌گیری شده با کالری‌سنجی تیتراسیون ایزوترمال (ITC)؛ شکل ۴ک،ل و شکل داده‌های گسترده ۸هـ-ز) را به PHOX2B-HLA-C*07:02 شناسایی کردیم. اتصال به پپتید اختصاصی بود و هیچ اتصال قابل تشخیصی به پپتید PHOX2B با جهش نقطه‌ای R6A (PHOX2B(R6A)-HLA-C*07:02؛ شکل ۴ل) مشاهده نشد. تلاش‌هایی برای گنجاندن اتصال‌دهنده‌های scFv در یک 4-1BB-CAR انجام شد، اما سنجش‌های سمیت سلولی سلول‌های T هیچ کشتار قابل تشخیصی را در طیفی از رده‌های سلولی نوروبلاستوما نشان نداد (شکل تکمیلی ۱۴)، احتمالاً به دلیل تمایل اتصال متوسط و/یا سطوح پایین چگالی آنتی‌ژن بیان‌شده بر روی سلول‌های تومور. اگرچه هنوز جای زیادی برای بهبود تمایل وجود دارد، این نشان‌دهنده توانایی طراحی آنتی‌بادی مبتنی بر ساختار، همراه با روش‌های مونتاژ کتابخانه مناسب، برای طراحی اتصال‌دهنده‌های خاص به اپی‌توپ‌های هدف چالش‌برانگیز و مهم از نظر بالینی است.

طراحی scFv با دقت اتمی برای TcdB

برای ارزیابی دقت طراحی de novo scFv، ما ساختارهای cryo-EM دو scFv مونتاژ شده ترکیبی، scFv5 و scFv6 را که هر دو اپی‌توپ Frizzled TcdB را هدف قرار می‌دادند، تعیین کردیم. تجزیه و تحلیل cryo-EM تأیید کرد که هر دو scFv همانطور که طراحی شده بودند به اپی‌توپ Frizzled متصل می‌شوند (شکل ۵ و شکل داده‌های گسترده ۹). میانگین‌های کلاس دوبعدی با وضوح بالا از scFv6 چگالی واضحی را هم برای TcdB و هم برای scFv متصل شده نشان داد که با یک بازسازی سه‌بعدی ۳.۶ آنگسترومی بیشتر پشتیبانی شد (شکل ۵الف،ب و شکل داده‌های گسترده ۹). ساختار حل‌شده نشان داد که scFv6 با جهت‌گیری اتصال پیش‌بینی‌شده با اپی‌توپ Frizzled در امتداد دامنه DRBD خود درگیر می‌شود (شکل ۵د و جدول ۱۰ روش‌های تکمیلی). انطباق ساختار cryo-EM با مدل طراحی، تطابق قابل توجهی را نشان داد و هر دو زنجیره سنگین و سبک همانطور که در نظر گرفته شده بود با اپی‌توپ تعامل داشتند (شکل ۵ج و شکل تکمیلی ۱۶الف،ب). فولد کلی با طراحی، که یک مدل ترکیبی از دو زنجیره نشأت گرفته از طراحی‌های متمایز اما از نظر ساختاری مشابه بود، مطابقت نزدیکی داشت (RMSD = ۰.۹ آنگستروم)، و هر یک از شش CDR دقت نزدیک به اتمی را نشان دادند (RMSDهای ستون فقرات: CDRH1 = ۰.۴ آنگستروم، CDRH2 = ۰.۳ آنگستروم، CDRH3 = ۰.۷ آنگستروم، CDRL1 = ۰.۲ آنگستروم، CDRL2 = ۱.۱ آنگستروم و CDRL3 = ۰.۲ آنگستروم؛ شکل ۵هـ،و). این تطابق به کانفورماسیون‌های روتامری زنجیره‌های جانبی CDR و تعاملات آنها با اپی‌توپ Frizzled نیز گسترش یافت، که بر دقت RFdiffusion در طراحی تعاملات de novo scFv-هدف تأکید می‌کند (شکل ۵ز).

شکل ۵: مشخصه‌یابی ساختاری با میکروسکوپ الکترونی کرایو (Cryo-EM) از دو scFv متصل‌شونده به TcdB.
شکل ۵

الف، میانگین‌های کلاس دوبعدی cryo-EM برچسب‌گذاری‌شده از یک scFv طراحی‌شده، scFv6، متصل به TcdB. ب، یک بازسازی سه‌بعدی cryo-EM با وضوح ۳.۶ آنگستروم از کمپلکس نشان می‌دهد که scFv6 در امتداد اپی‌توپ Frizzled به TcdB متصل شده است. ج، ساختار cryo-EM از scFv6 در کمپلکس با TcdB با مدل طراحی مطابقت نزدیکی دارد. د، ساختار cryo-EM از scFv6 متصل به TcdB. هـ، cryo-EM طراحی دقیق scFv6 با استفاده از RFdiffusion را آشکار می‌کند. و، انطباق هر یک از شش ساختار پیش‌بینی‌شده حلقه CDR scFv6 طراحی‌شده در مقایسه با ساختار cryo-EM ساخته‌شده. ز، مقایسه روتامرهای پیش‌بینی‌شده CDRH3 با ساختار cryo-EM ساخته‌شده با وضوح ۳.۶ آنگستروم. ح، میانگین‌های کلاس دوبعدی cryo-EM برچسب‌گذاری‌شده از scFv طراحی‌شده، scFv5، متصل به TcdB کامل. ط، یک بازسازی سه‌بعدی cryo-EM با وضوح ۶.۱ آنگستروم از کمپلکس نشان می‌دهد که scFv5 همانطور که پیش‌بینی شده بود به اپی‌توپ هدف متصل شده است. ی، به دلیل وضوح متوسط، ابتدا قطعه‌ای از TcdB در نقشه چگالی cryo-EM داک شد و سپس مدل طراحی کامل—شامل قطعه TcdB و scFv طراحی‌شده—با قطعه TcdB از پیش جایگذاری‌شده، هم‌تراز شد. این رویکرد نشان می‌دهد که طراحی پیش‌بینی‌شده با کمپلکس تعیین‌شده تجربی در ساختار، هدف‌گیری اپی‌توپ و کانفورماسیون کلی مطابقت نزدیکی دارد. در مدل‌ها، زرد نشان‌دهنده TcdB است؛ سرمه‌ای نشان‌دهنده قطعه متغیر زنجیره سنگین (cryo-EM) است؛ صورتی نشان‌دهنده قطعه متغیر زنجیره سبک (cryo-EM) است؛ و خاکستری نشان‌دهنده پیش‌بینی طراحی محاسباتی است.

scFv5 برای اتصال به همان اپی‌توپ اما با زاویه نزدیک شدن متمایز نسبت به scFv6 طراحی شده بود (شکل ۴ب،ج). یک بازسازی cryo-EM با وضوح ۶.۱ آنگستروم اتصال scFv5 را به اپی‌توپ Frizzled TcdB تأیید کرد و میانگین‌های کلاس دوبعدی چگالی واضحی را برای کمپلکس نشان داد (شکل ۵ح و شکل تکمیلی ۱۵). داکینگ جسم صلب مدل طراحی در چگالی cryo-EM تطابق نزدیکی را بین حالت‌های اتصال پیش‌بینی‌شده و تعیین‌شده تجربی نشان داد (شکل ۵ط،ی).

اوراکل‌های بهبودیافته نرخ موفقیت را افزایش می‌دهند

اگرچه نتایج ما نشان می‌دهد که طراحی de novo آنتی‌بادی‌ها امکان‌پذیر است، نرخ موفقیت تجربی پایین باقی می‌ماند. یک عامل کلیدی در موفقیت‌های قبلی در طراحی اتصال‌دهنده‌های de novo، فیلترهای بهبود یافته بود (در درجه اول AlphaFold2 (مرجع))، که موفقیت تجربی را در زیرمجموعه‌ای از طراحی‌هایی که به صورت تجربی آزمایش می‌شوند، غنی‌سازی کرد. در ابتدای این مطالعه، ما به دنبال ساخت چنین فیلتری با بهینه‌سازی RoseTTAFold2 بودیم (شکل داده‌های گسترده ۲ و ۳)، اما قدرت فیلتر کردن این مدل محدود است (حداقل با تنظیمات استفاده شده؛ ارائه ۱۰۰٪ از «نقاط داغ» فصل مشترک). این احتمالاً دلیل نرخ پایین موفقیت تجربی و طراحی نادرست SARS-CoV-2 است، جایی که فولد کلی و هدف‌گیری اپی‌توپ صحیح بود، اما جهت‌گیری اتصال صحیح نبود.

پس از کار طراحی در این مطالعه، AlphaFold3 (مرجع) منتشر شد و دقت پیش‌بینی ساختار آنتی‌بادی را، هم با حضور آنتی‌ژن و هم بدون آن، بهبود بخشیده است. به صورت گذشته‌نگر، می‌توانیم ارزیابی کنیم که چگونه فیلتر کردن با AlphaFold3 نرخ موفقیت تجربی را بهبود می‌بخشید. اول، AlphaFold3 به طور دقیق ساختار تأیید شده تجربی VHH SARS-CoV-2 که به طور نادرست طراحی شده بود را پیش‌بینی می‌کند (شکل تکمیلی ۹). اگر از AlphaFold3 به عنوان یک فیلتر اولیه استفاده شده بود، این طراحی به دلیل اختلاف بین ساختارهای پیش‌بینی‌شده و مورد نظر رد می‌شد و در نتیجه از آزمایش تجربی آن جلوگیری می‌شد. دوم، ما ساختارهای طراحی‌های VHH برای SARS-CoV-2، هماگلوتینین آنفولانزا، TcdB و IL-7Rα را با استفاده از AlphaFold3 با یک هم‌ترازی چند توالی (MSA) و الگوها برای هدف و تنها یک الگو برای VHH (از آنجا که CDRها de novo هستند، ما استدلال کردیم که MSA کاربرد محدودی خواهد داشت) پیش‌بینی کردیم. ما پیش‌بینی‌ها را برای کتابخانه‌هایی با حداقل یک VHH تأیید شده از نظر ساختاری (TcdB، هماگلوتینین آنفولانزا و SARS-CoV-2) تجزیه و تحلیل کردیم. این نتایج تحت سلطه VHHهای ضد هماگلوتینین هستند زیرا اکثر اتصال‌دهنده‌های موفق از این کتابخانه بودند. ما دریافتیم که امتیاز مدل‌سازی الگوی پیش‌بینی‌شده فصل مشترک (ipTM) AlphaFold3، که معیاری از اطمینان مدل در فصل مشترک است، پیش‌بینی‌کننده موفقیت اتصال است (مساحت زیر منحنی = ۰.۸۶؛ شکل داده‌های گسترده ۱۰الف،ب). به طور کلی، تنها ۹٪ از طراحی‌های VHH سفارش داده شده ما دارای ipTM > ۰.۶ هستند، که نشان می‌دهد نرخ موفقیت با گنجاندن یک فیلتر ipTM بهبود خواهد یافت. ما تجزیه و تحلیل مشابهی را برای کتابخانه‌های scFv مونتاژ شده ترکیبی انجام دادیم؛ ما ساختارهای طراحی‌های scFv والد (قبل از مونتاژ ترکیبی) و طراحی‌های scFv تأیید شده تجربی (مونتاژ شده ترکیبی) را با استفاده از AlphaFold3 با یک MSA برای توالی هدف و الگوها برای هدف و همچنین زنجیره‌های سنگین و سبک، با در نظر گرفتن حداکثر امتیاز ipTM در ۱۰ تکرار (seed) پیش‌بینی کردیم. ما دریافتیم که طراحی‌های موفق به امتیازهای ipTM AlphaFold3 بالاتری نسبت به طراحی‌های والد خوشه‌بندی می‌شوند (شکل داده‌های گسترده ۱۰ج). تنها ۴٪ از کتابخانه طراحی اولیه دارای ipTM > ۰.۸۵ است، در حالی که ۵ از ۶ طراحی تأیید شده تجربی از این آستانه عبور می‌کنند، که باز هم نشان می‌دهد فیلتر کردن با ipTM AlphaFold3 باید نرخ موفقیت را افزایش دهد (شکل داده‌های گسترده ۱۰د).

بحث

نتایج ما نشان می‌دهد که طراحی de novo دامنه‌های آنتی‌بادی که اپی‌توپ‌های خاصی را روی یک هدف هدف قرار می‌دهند، امکان‌پذیر است. داده‌های ساختاری cryo-EM برای VHHهای طراحی‌شده برای هماگلوتینین آنفولانزا و TcdB تطابق بسیار نزدیکی با مدل‌های طراحی محاسباتی را نشان می‌دهد، که نشان می‌دهد رویکرد ما می‌تواند کمپلکس‌های VHH را با دقت اتمی—شامل حلقه H3 بسیار متغیر و جهت‌گیری کلی اتصال—طراحی کند که با هر ساختار شناخته‌شده‌ای در PDB بسیار متفاوت است. علاوه بر این، داده‌های ساختاری cryo-EM از scFvهای طراحی‌شده متصل به TcdB، توانایی RFdiffusion را در طراحی دقیق scFvهای دو زنجیره‌ای نشان می‌دهد. تا آنجا که ما می‌دانیم، اینها اولین موارد تأیید شده از نظر ساختاری از آنتی‌بادی‌های طراحی‌شده de novo هستند.

روش محاسباتی ما با رویکردهای غربالگری تجربی که برای بازیابی آنتی‌بادی‌ها از کتابخانه‌های بزرگ تصادفی توسعه یافته‌اند، به چندین روش هم‌افزایی دارد. اول، روش‌های انتخاب با نمایش سطحی مخمر که به طور گسترده برای غربالگری کتابخانه آنتی‌بادی استفاده می‌شوند، امکان بازیابی اتصال‌دهنده‌های با بالاترین تمایل را در میان مجموعه‌های بزرگ طراحی‌ها فراهم می‌کنند، که در حال حاضر به دلیل نرخ موفقیت طراحی نسبتاً پایین ضروری است. دوم، غربالگری کتابخانه‌های ترکیبی که زنجیره‌های سنگین و سبک را از طراحی‌هایی با حالت‌های اتصال مشابه مخلوط می‌کنند، امکان شناسایی scFvهای متشکل از زنجیره‌های سازگار از نظر ساختاری را که اپی‌توپ‌های خاصی را هدف قرار می‌دهند، فراهم می‌کند، همانطور که در اینجا برای TcdB و MHC پپتید-PHOX2B نشان داده شد. سوم، بلوغ تمایل با استفاده از OrthoRep تمایل اندازه‌گیری شده طراحی‌های اولیه VHH را تا محدوده نانومولار تک‌رقمی یا زیرنانومولار بهبود می‌بخشد، در حالی که حالت اتصال طراحی‌شده اصلی را حفظ می‌کند. از دیدگاه عملی، پیشرفت کلیدی این کار، توانایی تولید VHHها و scFvها در برابر یک هدف نیست—چیزی که اغلب از طریق روش‌های صرفاً تجربی قابل دستیابی است—بلکه توانایی هدف قرار دادن دقیق اپی‌توپ‌های اتصال خاص است. ویژگی اپی‌توپ برای کاربردهای درمانی مانند آنتاگونیست‌هایی که تعاملات لیگاند-گیرنده را مسدود می‌کنند، آنتی‌بادی‌هایی که از رقابت با مولکول‌های درون‌زا اجتناب می‌کنند، تعدیل‌کننده‌هایی که تغییرات کانفورماسیونی را برای فعال کردن سیگنال‌دهی القا می‌کنند، یا آنتی‌بادی‌هایی که اپی‌توپ‌های ویروسی حفاظت‌شده یا محدود از نظر تکاملی را هدف قرار می‌دهند، حیاتی است.

هنوز جای زیادی برای بهبود وجود دارد. برای مرحله طراحی ستون فقرات، گنجاندن بهبودهای معماری اخیر و پیشرفت‌های جدید در مدل‌سازی مولد ممکن است مدل‌های طراحی با قابلیت طراحی‌پذیری و تنوع بالاتر به دست دهد. RoseTTAFold2 و RFdiffusion همچنین اخیراً برای مدل‌سازی تمام مولکول‌های زیستی (به جای فقط پروتئین‌ها) گسترش یافته‌اند و گنجاندن این قابلیت در واریانت طراحی آنتی‌بادی RFdiffusion باید امکان طراحی دقیق آنتی‌بادی‌ها را برای اپی‌توپ‌های حاوی اتم‌های غیرپروتئینی، مانند گلیکان‌ها، فراهم کند. ProteinMPNN در این کار فعلی اصلاح نشد، اما طراحی توالی‌هایی که با توالی‌های CDR انسانی مطابقت نزدیک‌تری دارند، انتظار می‌رود که پتانسیل ایمنی‌زایی آنتی‌بادی‌های طراحی‌شده را کاهش دهد. در واقع، توالی‌های طراحی‌شده در حال حاضر تا حدودی کمتر انسانی هستند (همانطور که با امتیاز OASis ارزیابی شده است) نسبت به CDRهای آنتی‌بادی‌های درمانی (شکل تکمیلی ۱د). بهبودهای بیشتر در روش‌های پیش‌بینی ساختار آنتی‌بادی باید بهینه‌سازی سریع‌تر روش‌های طراحی بالادستی را امکان‌پذیر کرده و نرخ موفقیت تجربی را بهبود بخشد.

در نهایت، طراحی محاسباتی de novo آنتی‌بادی‌ها با استفاده از RFdiffusion ما و رویکردهای مرتبط می‌تواند کشف و توسعه آنتی‌بادی را متحول کند. با بهبود روش و افزایش نرخ موفقیت، این پتانسیل را دارد که سریع‌تر و مقرون‌به‌صرفه‌تر از ایمن‌سازی حیوانات یا غربالگری کتابخانه‌های تصادفی باشد. یک رویکرد مبتنی بر ساختار برای طراحی آنتی‌بادی همچنین باید به بهینه‌سازی ویژگی‌های دارویی کلیدی، مانند تجمع، حلالیت و سطوح بیان (همه چالش‌های عمده در توسعه آنتی‌بادی) به شیوه‌ای آگاهانه از ساختار کمک کند. در مجموع، ما انتظار داریم که طراحی محاسباتی آنتی‌بادی‌ها تعداد اهداف بالینی قابل دستیابی و بیماری‌های قابل دسترس برای درمان‌های آنتی‌بادی را افزایش دهد.

خلاصه گزارش‌دهی

اطلاعات بیشتر در مورد طراحی پژوهش در خلاصه گزارش‌دهی Nature Portfolio که به این مقاله پیوند داده شده است، موجود است.

ممکن است شما دوست داشته باشید
ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.