طراحی de novo و دقیق در سطح اتمی آنتیبادیها با RFdiffusion
چکیده
با وجود نقش محوری آنتیبادیها در پزشکی مدرن، در حال حاضر هیچ روشی برای طراحی کاملاً محاسباتی (in silico) آنتیبادیهای جدید و اختصاصی برای یک اپیتوپ مشخص وجود ندارد. در عوض، کشف آنتیبادی در حال حاضر به ایمنسازی، غربالگری کتابخانههای تصادفی یا جداسازی مستقیم آنتیبادیها از بیماران متکی است. در این مقاله، ما نشان میدهیم که ترکیب طراحی محاسباتی پروتئین با استفاده از یک شبکه RFdiffusion بهینهسازیشده و غربالگری نمایش سطحی مخمر (yeast display screening)، امکان تولید de novo زنجیرههای سنگین متغیر آنتیبادی (VHHs)، قطعات متغیر تکزنجیرهای (scFvs) و آنتیبادیهای کامل را فراهم میآورد که با دقتی در سطح اتمی به اپیتوپهای مشخصشده توسط کاربر متصل میشوند. ما بهصورت تجربی ویژگیهای اتصالدهندههای VHH را برای چهار اپیتوپ مرتبط با بیماری بررسی کردیم. میکروسکوپ الکترونی کرایو (Cryo-EM) حالت اتصال VHHهای طراحیشده را که هماگلوتینین آنفولانزا و توکسین B کلستریدیوم دیفیسیل (TcdB) را هدف قرار میدهند، تأیید میکند. یک ساختار با وضوح بالا از VHH هدفگیرنده آنفولانزا، دقت اتمی نواحی تعیینکننده مکمل (CDRs) طراحیشده را اثبات میکند. اگرچه طراحیهای محاسباتی اولیه تمایل اتصال متوسطی (در محدوده دهها تا صدها نانومولار Kd) از خود نشان میدهند، بلوغ تمایل (affinity maturation) با استفاده از OrthoRep امکان تولید اتصالدهندههایی با تمایل نانومولار تکرقمی را فراهم میکند که گزینشپذیری اپیتوپ مورد نظر را حفظ میکنند. ما همچنین طراحی de novo scFvها را برای TcdB و یک کمپلکس پپتید PHOX2B-MHC با ترکیب CDRهای طراحیشده از زنجیرههای سنگین و سبک نشان میدهیم. میکروسکوپ الکترونی کرایو حالت اتصال دو scFv متمایز برای TcdB را تأیید میکند و دادههای با وضوح بالا برای یکی از طراحیها، طراحی دقیق در سطح اتمی کانفورماسیون هر شش حلقه CDR را به اثبات میرساند. رویکرد ما چارچوبی برای طراحی محاسباتی، غربالگری و مشخصهیابی آنتیبادیهای کاملاً de novo با دقت در سطح اتمی، هم در ساختار و هم در هدفگیری اپیتوپ، ایجاد میکند.
متن اصلی
آنتیبادیها دسته غالب درمانهای پروتئینی هستند؛ بهطوریکه بیش از ۱۶۰ داروی آنتیبادی در حال حاضر در سراسر جهان مجوز گرفتهاند و انتظار میرود ارزش بازار آنها در ۵ سال آینده به ۴۴۵ میلیارد دلار آمریکا برسد. توسعه آنتیبادی معمولاً در دو مرحله انجام میشود: (۱) کشف آنتیبادیهایی که به یک اپیتوپ خاص متصل میشوند؛ و (۲) بلوغ تمایل و بهینهسازی بالینی آن آنتیبادیها. در حال حاضر، شناسایی آنتیبادیهای اختصاصی برای یک اپیتوپ به ایمنسازی حیوانات یا غربالگری کتابخانههای آنتیبادی برای یافتن مولکولهای کاندیدی که به هدف مورد نظر متصل میشوند، و سپس نقشهبرداری اپیتوپ بعدی، متکی است. این روشها طاقتفرسا، زمانبر و ممکن است در شناسایی آنتیبادیهایی که با اپیتوپ مرتبط با درمان تعامل دارند، ناموفق باشند. تلاشها در زمینه طراحی محاسباتی آنتیبادیها عموماً بر مرحله دوم بهینهسازی در توسعه آنتیبادی متمرکز بوده است، مانند نمونهبرداری از حلقههای CDR طبیعی جایگزین برای بهبود تمایل اتصال یا استفاده از طراحی توالی Rosetta برای بهبود نواحی تعاملی. اخیراً، شبکههای یادگیری عمیق مبتنی بر ساختار و توالی برای طراحی واریانتهای جدید توالی آنتیبادی آموزش داده شدهاند، اما این روشها نیازمند یک آنتیبادی متصلشونده اولیه برای بهینهسازی هستند. همچنین پیشرفتهای اخیر در بهینهسازی آنتیبادی با روشهای یادگیری عمیق که بر روی دادههای تولیدشده توسط روشهای تجربی قدرتمند جدید آموزش دیدهاند، وجود داشته است. در مقابل، روشهای محاسباتی قادر به انجام مرحله اول طراحی آنتیبادی (تولید آنتیبادیهای متصلشونده به اپیتوپ خاص) وجود ندارند و بنابراین، طراحی de novo (بدون همولوژی با آنتیبادی موجود که آن اپیتوپ را هدف قرار میدهد) آنتیبادیها همچنان یک مسئله حلنشده باقی مانده است. پیشرفت سریعی در طراحی پروتئینهای متصلشونده (غیر از آنتیبادی) با استفاده از RFdiffusion حاصل شده است. با این حال، همانند سایر روشهای طراحی فصل مشترک de novo، این اتصالدهندهها تقریباً به طور انحصاری به تعاملات مبتنی بر ساختار ثانویه منظم (مارپیچ یا رشته) با اپیتوپ هدف متکی هستند، و بنابراین شبکه اصلی (‘vanilla’) RFdiffusion قادر به طراحی de novo آنتیبادیها نیست (شکل تکمیلی ۱؛ به مرجع مراجعه کنید).
یک روش ایدهآل برای طراحی آنتیبادیهای de novo باید این امکانات را فراهم کند: (۱) هدفگیری هر اپیتوپ مشخص بر روی هر هدف مورد نظر؛ (۲) تمرکز نمونهبرداری بر روی حلقههای CDR، در حالی که توالی و ساختار چارچوب به یک چارچوب آنتیبادی درمانی بسیار بهینهسازیشده و مشخصشده توسط کاربر نزدیک باقی بماند؛ و (۳) نمونهبرداری از جایگاههای مختلف آنتیبادی طراحیشده نسبت به اپیتوپ بهصورت جسم صلب (rigid-body). ما این فرضیه را مطرح کردیم که یک نسخه تخصصی از RFdiffusion که بر روی ساختارهای آنتیبادی بهینهسازی شده باشد، باید قادر به طراحی فصل مشترکهای جدید با واسطه CDR باشد. این فرضیه با توجه به تنوع و کیفیت فصل مشترکهای de novo که RFdiffusion میتواند طراحی کند و با توجه به اینکه ترمودینامیک زیربنایی تشکیل فصل مشترک یکسان است، مطرح شد و ما برای توسعه چنین روشی اقدام کردیم.
آموزش RFdiffusion برای طراحی آنتیبادی
RFdiffusion از نمایش چارچوب AlphaFold2 (مرجع) و RF2 برای ستون فقرات پروتئینها استفاده میکند که شامل مختصات کربن آلفا (Cα) و جهتگیری صلب N-Cα-C برای هر اسید آمینه است. در طول آموزش، از یک برنامه نویزدهی استفاده میشود که در طی تعداد مشخصی از «گامهای زمانی» (T)، چارچوبهای پروتئین را به سمت توزیعهای پیشین تصادفی تخریب میکند (مختصات Cα با نویز گاوسی سهبعدی و جهتگیریهای اسید آمینه با حرکت براونی روی SO3 تخریب میشوند). در حین آموزش، یک ساختار از بانک داده پروتئین (PDB) و یک گام زمانی تصادفی (t) نمونهبرداری شده و t گام نویزدهی بر روی ساختار اعمال میشود. RFdiffusion ساختار بدون نویز (pX0) را در هر گام زمانی پیشبینی میکند و یک تابع هزینه میانگین مربعات خطا بین ساختار واقعی (X0) و پیشبینی (pX0) کمینه میشود. در زمان استنتاج، یک توزیع تصادفی از اسیدهای آمینه (XT) نمونهبرداری شده و RFdiffusion به طور مکرر آن را بدون نویز میکند تا ساختارهای پروتئینی جدیدی تولید کند.
ما RFdiffusion را عمدتاً بر روی ساختارهای کمپلکس آنتیبادی بهینهسازی کردیم (شکل ۱؛ به بخش روشها در اطلاعات تکمیلی مراجعه کنید). در هر مرحله از آموزش، ساختار آنتیبادی تخریب میشود. برای اینکه بتوان ساختار و توالی چارچوب را در زمان استنتاج مشخص کرد، توالی و ساختار چارچوب به عنوان ورودی شرطی به RFdiffusion در طول آموزش ارائه میشود (شکل ۱b). از آنجا که مطلوب است موقعیت جسم صلب (dock) بین آنتیبادی و هدف توسط RFdiffusion همراه با کانفورماسیون حلقههای CDR طراحی شود، ساختار چارچوب به صورت مستقل از چارچوب جهانی در طول آموزش ارائه میشود (شکل ۱c). ما از «مسیر الگو» (template track) RF2/RFdiffusion برای ارائه ساختار چارچوب به صورت یک ماتریس دوبعدی از فواصل دوتایی و زوایای دووجهی بین هر جفت اسید آمینه استفاده میکنیم (نمایشی که از آن میتوان ساختارهای سهبعدی را با دقت بازسازی کرد) (شکل تکمیلی ۱a). الگوهای چارچوب و هدف، موقعیت نسبی خود را در فضای سهبعدی کدگذاری نمیکنند. در این کار، ما توالی و ساختار ناحیه چارچوب را ثابت نگه داشتیم و بر طراحی CDRها و جایگذاری کلی آنتیبادی بهصورت جسم صلب نسبت به هدف تمرکز کردیم. ما RFdiffusion را با یک ویژگی اضافی «نقطه داغ» (hotspot) که بهصورت کدگذاری یک-از-k (one-hot) ارائه میشود، آموزش دادیم. این ویژگی بخشی از اسیدهای آمینهای را که CDRهای آنتیبادی با آنها تعامل دارند، مشخص میکند تا در زمان استنتاج، بتوانیم آنتیبادیها را به سمت یک سایت خاص هدایت کنیم (شکل ۱d؛ ما در ادامه متن به این سایتها «اپیتوپ» میگوییم). برای سادگی، ما در ادامه این مقاله از این نسخه بهینهسازیشده شبکه با عنوان RFdiffusion یاد میکنیم.
الف، RFdiffusion به گونهای آموزش داده میشود که در زمان T، نمونهای از توزیع پیشین (توزیع گاوسی سهبعدی برای انتقالات و توزیع یکنواخت SO3 برای چرخشها) گرفته شده و بین زمانهای T و 0 بدون نویز میشود تا یک scFv (در این مورد) تولید گردد. ب، چارچوب آنتیبادی به عنوان یک توالی و «الگو» به RFdiffusion ارائه میشود؛ الگو فواصل دوتایی و زوایای دووجهی بین اسیدهای آمینه چارچوب را مشخص میکند. به عنوان مثال، میتوان طراحی یک VHH (بالا) یا scFv (پایین) را مشخص کرد. ج، تنوع در حالت اتصال (dock) آنتیبادی-هدف به این دلیل حاصل میشود که الگوی چارچوب، رابطه جسم صلب چارچوب-هدف را کدگذاری نمیکند. حالتهای اتصال متنوع توسط RFdiffusion نمونهبرداری میشوند. د، اپیتوپ با ارائه اسیدهای آمینه «نقطه داغ» (hotspot) مشخص میشود که آنتیبادی طراحیشده را هدایت میکنند (مقایسه کنید نارنجی، چپ، با صورتی، راست). هـ، مروری بر خط لوله طراحی محاسباتی که در این مقاله شرح داده شده است. RFdiffusion با دریافت هدف، نقاط داغ اپیتوپ و چارچوب آنتیبادی، مرحله طراحی ستون فقرات را انجام میدهد. ProteinMPNN تنها توالی اسیدهای آمینه CDR (و نه اسیدهای آمینه چارچوب) را طراحی میکند. RoseTTAFold2 بهینهسازیشده ساختار آنتیبادی طراحیشده را با دریافت هدف (توالی، ساختار و بهصورت اختیاری بخشی از اسیدهای آمینه نقطه داغ) و توالی آنتیبادی طراحیشده پیشبینی میکند. خودسازگاری (شباهت بالا بین ساختارهای پیشبینیشده و طراحیشده) و اطمینان بالا (خطای همترازی پیشبینیشده پایین) موفقیت محاسباتی (in silico) را تعریف میکنند. توجه داشته باشید که AlphaFold3 که در زمان انجام این کار در دسترس نبود، پیشبینیکننده بهتری برای موفقیت نسبت به RoseTTAFold2 است. و، سهم این کار، خط لوله طراحی آنتیبادی اختصاصی برای اپیتوپ است که در پنل هـ نشان داده شده است. چندین روش میتواند برای اعتبارسنجی تجربی طراحیها و سپس بلوغ تمایل یا بهینهسازی آنها استفاده شود. در این کار، ما از نمایش سطحی مخمر و/یا بیان در E. coli با SPR برای اعتبارسنجی تجربی (به ترتیب حدود ۶ هفته و ۲ هفته پس از سفارش الیگونوکلئوتید) و بلوغ تمایل OrthoRep استفاده کردیم.
با این رژیم آموزشی، RFdiffusion قادر است ساختارهای آنتیبادی را طراحی کند که با ساختار چارچوب ورودی مطابقت نزدیکی داشته و با حلقههای CDR جدید، اپیتوپ مشخصشده را هدف قرار دهد (شکل تکمیلی ۱). پس از مرحله RFdiffusion، ما از ProteinMPNN برای طراحی توالی حلقههای CDR استفاده میکنیم. آنتیبادیهای طراحیشده تعاملات متنوعی با اپیتوپ هدف برقرار میکنند و به طور قابل توجهی با توالیهای موجود در مجموعه داده آموزشی متفاوت هستند (شکل دادههای گسترده ۱). هیچ همبستگی بین شباهت به مجموعه داده آموزشی و موفقیت در اتصال وجود نداشت (شکل دادههای گسترده ۱الف، خطوط قرمز).
بهینهسازی RF2 برای اعتبارسنجی آنتیبادی
خطوط لوله طراحی معمولاً طیف گستردهای از راهحلها را برای هر چالش طراحی مشخص تولید میکنند. یک راه مؤثر برای فیلتر کردن پروتئینها و فصل مشترکهای طراحیشده که به احتمال زیاد از نظر تجربی موفق خواهند بود، بر اساس شباهت ساختار طراحیشده با ساختار پیشبینیشده توسط AlphaFold2 برای توالی طراحیشده است (این اغلب به عنوان «خودسازگاری» شناخته میشود)، که نشان داده شده است با موفقیت تجربی همبستگی خوبی دارد. با این حال، در مورد آنتیبادیها، AlphaFold2 در پیشبینی دقیق ساختارهای آنتیبادی-آنتیژن ناموفق است، که استفاده از آن را به عنوان یک فیلتر در خط لوله طراحی آنتیبادی غیرممکن میسازد، و در ابتدای این پروژه، AlphaFold3 (مرجع) در دسترس نبود.
ما به دنبال بهبود فیلتر کردن طراحیها با بهینهسازی RoseTTAFold2 بر روی ساختارهای آنتیبادی بودیم. برای سادهسازی پیشبینی ساختار آنتیبادی، ما در طول آموزش اطلاعاتی در مورد ساختار هدف و محل اپیتوپ هدف که آنتیبادی به آن متصل میشود، ارائه دادیم؛ RF2 بهینهسازیشده همچنان باید CDRها را به درستی مدلسازی کرده و جهتگیری صحیح آنتیبادی را نسبت به ناحیه هدف پیدا کند. منطق ارائه این اطلاعات این است که ساختار هدف و محل اتصال در طول طراحی در دسترس هستند (اما معمولاً در طول پیشبینی ساختار عمومی در دسترس نیستند). با این رژیم آموزشی و اطلاعات اضافی، RF2 قادر است به طور قوی جفتهای واقعی آنتیبادی-آنتیژن را از جفتهای فریبنده تشخیص دهد و اغلب ساختارهای کمپلکس آنتیبادی-آنتیژن را با دقت پیشبینی میکند، اما تنها زمانی که کانفورماسیون متصل (holo) ساختار هدف و اطلاعات اپیتوپ ارائه شود (شکل دادههای گسترده ۲الف-د). در پیشبینی مونومر، RF2 بهینهسازیشده از مدلهای قبلی که در آن زمان موجود بودند، عملکرد بهتری داشت، بهویژه در پیشبینی ساختار CDR H3 (شکل دادههای گسترده ۲هـ،و).
هنگامی که این شبکه RF2 بهینهسازیشده برای پیشبینی مجدد ساختار VHHهای طراحیشده با RFdiffusion استفاده میشود، بخش قابل توجهی از آنها با اطمینان پیشبینی میشوند که تقریباً به همان شکلی که طراحی شدهاند، متصل میشوند (شکل دادههای گسترده ۳الف). علاوه بر این، تجزیه و تحلیلهای واکنش متقاطع محاسباتی نشان داد که VHHهای طراحیشده با RFdiffusion به ندرت پیشبینی میشود که به پروتئینهای نامرتبط متصل شوند (شکل دادههای گسترده ۳ب). VHHهایی که با اطمینان پیشبینی میشود به هدف طراحیشده خود متصل شوند، پیشبینی میشود که فصل مشترکهای با کیفیتی را تشکیل دهند، که با Rosetta ddG اندازهگیری میشود (شکل دادههای گسترده ۳ج). این نشان میدهد که فیلتر کردن با RF2 ممکن است اتصالدهندههایی را که از نظر تجربی موفق هستند، غنیسازی کند.
طراحی و مشخصهیابی VHHها
ما در ابتدا بر طراحی آنتیبادیهای تکدامنهای (VHHs) که توسط شترسانان تولید میشوند، تمرکز کردیم. تا به امروز، دو درمان مبتنی بر VHH توسط FDA تأیید شده و کارآزماییهای بالینی بسیاری در حال انجام است. با وجود داشتن حلقههای CDR کمتر (سه) نسبت به آنتیبادیهای معمولی (شش)، میانگین سطح فصل مشترک تعاملی یک VHH بسیار شبیه به یک آنتیبادی است، که نشان میدهد روشی که قادر به طراحی VHH باشد، میتواند برای طراحی آنتیبادی نیز مناسب باشد. در واقع، معیارهای محاسباتی برای scFvها و VHHها کیفیت مشابهی از فصل مشترکها را نشان دادند، که توسط Rosetta و RF2 بهینهسازیشده ارزیابی شد (شکل دادههای گسترده ۳ب-و).
ما یک چارچوب VHH انسانیشده که به طور گسترده استفاده میشود (h-NbBcII10FGLA) را به عنوان پایه کمپینهای طراحی VHH خود انتخاب کردیم و VHHهایی را برای طیف وسیعی از اهداف مرتبط با بیماری طراحی کردیم: توکسین TcdB از C. difficile، هماگلوتینین H1 آنفولانزا، سایتهای I و III ویروس سینسیشیال تنفسی (RSV)، دامنه اتصال به گیرنده (RBD) SARS-CoV-2 و IL-7Rα. طراحیهای فیلترشده محاسباتی یا با توان بالا توسط نمایش سطحی مخمر (۹۰۰۰ طراحی برای هر هدف؛ سایتهای I و III RSV، RBD و هماگلوتینین آنفولانزا) یا با توان پایینتر با بیان در اشریشیا کلی و رزونانس پلاسمون سطحی (SPR) با غلظت واحد (۹۵ طراحی برای هر هدف؛ TcdB، IL-7Rα و هماگلوتینین آنفولانزا؛ مورد آخر با هر دو روش غربالگری شد) غربالگری شدند.
اتصالدهندههای با بالاترین تمایل برای سایت III RSV، هماگلوتینین آنفولانزا، RBD و TcdB به ترتیب در شکل ۲الف-ج،هـ نشان داده شدهاند (همچنین برای تمام ردپاهای SPR اتصالدهندههای VHH تأیید شده در این مطالعه به شکل تکمیلی ۲ و برای نرخ موفقیت در برابر هر هدف که از ۰٪ تا ۲٪ متغیر است، به جدول ۶ روشهای تکمیلی مراجعه کنید). حلقههای CDR از VHHهای مشاهدهشده در طبیعت متمایز هستند، که نشاندهنده تعمیم قابل توجهی فراتر از مجموعه داده آموزشی است (شکل دادههای گسترده ۱). از بین اتصالدهندههای هماگلوتینین که در برابر مونومر هماگلوتینین تولیدشده در سلول حشره آزمایش شدند، اتصالدهنده با بالاترین تمایل دارای ثابت تفکیک (Kd) ۷۸ نانومولار بود (شکل ۲ب)، در حالی که سایر اتصالدهندهها تمایلهای ۵۴۶، ۶۹۸ و ۷۹۰ نانومولار داشتند. برای TcdB، اپیتوپ هدف، فصل مشترک Frizzled بود که هیچ آنتیبادی یا VHH در PDB وجود ندارد که این سایت را هدف قرار دهد. برای بهترین VHH طراحیشده هم از RBD (Kd = ۵.۵ میکرومولار؛ شکل ۲ج) و هم از TcdB (Kd = ۲۶۰ نانومولار؛ شکل ۲د)، تأیید شد که اتصال به اپیتوپ مورد نظر است: با افزودن یک اتصالدهنده de novo طراحیشده و از نظر ساختاری مشخصشده قبلی به آن اپیتوپ (AHB2 (PDB ID 7UHB) برای RBD و FZD48 (PDB ID 9CM5 (مرجع)) برای TcdB)، اتصال به طور کامل از بین رفت (شکل ۲ج،د و شکل دادههای گسترده ۴الف-ج). این VHH TcdB همچنین سمیت TcdB را در سلولهای ناکاوت شده CSPG4 (یک گیرنده جایگزین TcdB) با غلظت مؤثر نیمه-ماکزیمم (EC50) ۴۶۰ نانومولار خنثی کرد (شکل دادههای گسترده ۴د،هـ). برای TcdB، تعاملات اختصاصی بودند و هیچ اتصالی به توکسین کشنده Paeniclostridium sordellii (TcsL) که بسیار مرتبط است (همولوژی توالی ۷۰٪)، مشاهده نشد (شکل دادههای گسترده ۴ب). این دادهها توانایی RFdiffusion را در طراحی VHHهایی که تعاملات اختصاصی با اپیتوپ هدف برقرار میکنند، نشان میدهند.
الف،ب، نه هزار VHH طراحیشده در برابر سایت III RSV (الف؛ VHH_RSV_01) و هماگلوتینین آنفولانزا (ب؛ VHH_flu_01) با نمایش سطحی مخمر غربالگری شدند، پیش از بیان محلول بهترینها در E. coli. SPR نشان داد که VHHهای با بالاترین تمایل به سایت III RSV و هماگلوتینین به ترتیب با تمایل ۱.۴ میکرومولار و ۷۸ نانومولار به اهداف مربوطه خود متصل میشوند. ج، نه هزار طراحی VHH در برابر RBD SARS-CoV-2 آزمایش شدند و پس از بیان محلول، SPR تمایل ۵.۵ میکرومولار را برای طراحی VHH_RBD_D4 به هدف تأیید کرد (چپ). اتصال به اپیتوپ مورد انتظار بود که با رقابت با یک اتصالدهنده de novo تأیید شده از نظر ساختاری (AHB2 (PDB ID 7UHB)، راست) تأیید شد. د، نود و پنج طراحی VHH در برابر TcdB C. difficile آزمایش شدند. VHH با بالاترین تمایل، VHH_TcdB_H2، با تمایل ۲۶۲ نانومولار متصل شد (چپ)، و همچنین با یک اتصالدهنده de novo تأیید شده از نظر ساختاری (FZD48، PDB ID 9CM5 (مرجع)) به همان اپیتوپ رقابت کرد (راست). برای کمیسازی رقابت نشان داده شده در پنلهای ج و د به شکل دادههای گسترده ۴الف-ج نیز مراجعه کنید. در تمام پنلها، پاسخ اتصال اندازهگیری شده با خط آبی پررنگ و برازش کلی با استفاده از مدل تعامل ۱:۱ با خط چیندار سیاه نشان داده شده است.
میکروسکوپ الکترونی کرایو از VHH متصلشونده به هماگلوتینین آنفولانزا
ما به دنبال ارزیابی دقت طراحی از طریق تعیین ساختار با میکروسکوپ الکترونی کرایو (cryo-EM) از VHHهای طراحیشده ضد هماگلوتینین در کمپلکس با گلیکوپروتئین هماگلوتینین تریمری آنفولانزا (سویه A/USA:Iowa/1943 H1N1؛ شکل تکمیلی ۴) که به طور طبیعی گلیکوزیله شده است، بودیم. این پروتئین اپیتوپ ساقه حفاظتشده را که در طول طراحی محاسباتی VHH و غربالگری بیوشیمیایی بالادستی استفاده شده بود، حفظ میکند. پردازش دادههای cryo-EM نشان داد که یک طراحی VHH به طور مؤثر به تریمر هماگلوتینین کاملاً گلیکوزیله شده متصل میشود (از بین چهار مورد آزمایش شده)، که از این پس به عنوان VHH_flu_01 نامیده میشود (شکل ۳ و شکل دادههای گسترده ۵). طبقهبندی دوبعدی تمام ذرات در مجموعه داده (شکل ۳الف) و ساختار ۳.۰ آنگسترومی تعیینشده از کمپلکس (شکل ۳ب و جدول ۱۰ روشهای تکمیلی) نشان داد که تقریباً ۶۶٪ از ذرات هماگلوتینین به حداکثر دو VHH در هر تریمر متصل شدهاند (شکل ۳الف-ح). این اشغال جزئی احتمالاً به گلیکان N296 نسبت داده میشود که در زیرواحدهای غیرمتصل، اپیتوپ هدف را تا حدی مسدود میکند اما هنگام اتصال به VHH_flu_01 تغییر جهت میدهد (شکل ۳ح را ببینید).
الف، میانگینهای کلاس دوبعدی cryo-EM برچسبگذاریشده از VHH_flu_01 طراحیشده که به هماگلوتینین (HA) آنفولانزا سویه A/USA:Iowa/1943 H1N1 متصل است. ب، بازسازی سهبعدی cryo-EM با وضوح ۳.۰ آنگستروم نشان میدهد که VHH_flu_01 به H1 در امتداد ساقه در دو پروتومر متصل شده است. ج، ساختار cryo-EM از VHH_flu_01 متصل به هماگلوتینین آنفولانزا. د، انطباق ساختار CDR3 VHH طراحیشده با ساختار cryo-EM. هـ، مقایسه روتامرهای پیشبینیشده CDR3 با ساختار cryo-EM ساختهشده با وضوح ۳.۰ آنگستروم. و،ز، ساختار cryo-EM با طراحی مطابقت نزدیکی دارد. ح، بررسی پروتومرهای هماگلوتینین آزاد (apo) در کنار پروتومرهای متصل به VHH طراحیشده، جابجایی گلیکان N296 را برای امکان اتصال VHH طراحیشده به ساقه نشان میدهد. ط، میانگینهای کلاس دوبعدی cryo-EM برچسبگذاریشده از VHH طراحیشده، VHH_TcdB_H2، متصل به TcdB کامل. ی، بازسازی سهبعدی cryo-EM با وضوح ۴.۶ آنگستروم از کمپلکس نشان میدهد که VHH_TcdB_H2 همانطور که پیشبینی شده بود به اپیتوپ هدف متصل شده است. CROPs، الیگوپپتیدهای تکراری ترکیبی؛ GTD، دامنه گلوکوزیلترانسفراز. ک، به دلیل وضوح متوسط، ابتدا قطعهای از TcdB در نقشه چگالی cryo-EM داک شد و سپس مدل طراحی کامل—شامل قطعه TcdB و VHH طراحیشده—با قطعه TcdB از پیش جایگذاریشده، همتراز شد. طراحی پیشبینیشده با کمپلکس تعیینشده تجربی در ساختار، هدفگیری اپیتوپ و کانفورماسیون کلی مطابقت نزدیکی دارد. ل، میانگینهای کلاس دوبعدی cryo-EM برچسبگذاریشده از VHH طراحیشده، VHH_TcdB_H2_ortho، متصل به TcdB کامل. م، بازسازی سهبعدی cryo-EM با وضوح ۵.۷ آنگستروم از کمپلکس نشان میدهد که VHH_TcdB_H2_ortho همانطور که پیشبینی شده بود به اپیتوپ هدف متصل شده است. ن، قطعهای از TcdB در نقشه cryo-EM داک شد و سپس مدل کامل شامل VHH بالغشده با OrthoRep همتراز شد. ساختار حاصل هیچ تغییر قابل تشخیصی در جهت اتصال یا زاویه داکینگ نسبت به طراحی اصلی نشان نمیدهد، که نشان میدهد بلوغ OrthoRep حالت پیشبینیشده تعامل با اپیتوپ را حفظ کرده است. در تمام پنلها: زرد نشاندهنده هماگلوتینین است؛ خاکستری نشاندهنده پیشبینی طراحی محاسباتی است؛ صورتی یا سرمهای نشاندهنده VHH (cryo-EM) است؛ و فیروزهای نشاندهنده گلیکان است.
ساختار هماگلوتینین آنفولانزا که به دو نسخه از VHH_flu_01 متصل است (شکل ۳ب،ج و شکل دادههای گسترده ۵)، زاویه نزدیک شدن VHH را نشان میدهد که با مدل پیشبینیشده مطابقت نزدیکی دارد (شکل ۳و) و ستون فقرات VHH بسیار به طراحی RFdiffusion نزدیک است، با انحراف معیار جذر میانگین مربعات (RMSD) محاسبهشده ۱.۴۵ آنگستروم (شکل ۳ز). ساختار CDR3 نیز بین ساختار cryo-EM و مدل محاسباتی بسیار مشابه است (RMSD = ۰.۸ آنگستروم؛ شکل ۳د)، و اسیدهای آمینه V100، V101، S103 و F108 در حلقه CDR3 طراحیشده de novo با اپیتوپ ساقه هماگلوتینین آنفولانزا در ساختار cryo-EM تعامل دارند، همانطور که توسط RFdiffusion طراحی شده و با RF2 مجدداً پیشبینی شده است (شکل ۳هـ). این طراحی با نزدیکترین آنتیبادی-VHH متصل به این اپیتوپ در PDB بسیار متفاوت است (شکل دادههای گسترده ۱و،ز و شکل تکمیلی ۵). در مجموع، این نتایج طراحی VHH را با دقت در سطح اتمی نشان میدهند.
میکروسکوپ الکترونی کرایو از VHHها برای TcdB و SARS-CoV-2
برای بهبود تمایل اتصال VHHهای طراحیشده de novo، ما از سیستم تکثیر DNA مستعد خطای متعامد، OrthoRep، برای جهشزایی مداوم ژنهای هدف در داخل سلول زنده (in vivo) استفاده کردیم. نشان داده شده است که OrthoRep بلوغ سریع تمایل آنتیبادیهای نمایش داده شده بر سطح مخمر را پیش میبرد. ما از این قابلیت برای بلوغ تمایل VHHهایی که TcdB، هماگلوتینین H1 آنفولانزا و RBD SARS-CoV-2 را هدف قرار میدهند، استفاده کردیم. VHHهای بالغشده چندین جهش نسبت به طراحیهای والد خود کسب کردند و تمایل اتصال را تقریباً دو مرتبه بزرگی بهبود بخشیدند (شکل تکمیلی ۳)، که آنها را به کاندیداهای مناسبی برای مشخصهیابی ساختاری بعدی با cryo-EM تبدیل کرد.
برای TcdB، کمپین طراحی ما اپیتوپ متصلشونده به Frizzled را که بر روی RBD قرار دارد، هدف قرار داد. TcdB از چهار دامنه عملکردی شامل یک دامنه مرکزی تحویل و RBD (DRBD) تشکیل شده است که VHHها برای اتصال به آن طراحی شده بودند. مشخصهیابی با cryo-EM از طراحی والد اصلی، VHH_TcdB_H2، تأیید کرد که VHH با اپیتوپ هدف Frizzled DRBD درگیر میشود (شکل تکمیلی ۷). تجزیه و تحلیل از طریق طبقهبندی دوبعدی و سهبعدی ترکیبی از ذرات TcdB متصل و غیرمتصل را نشان داد (شکل ۳ط و شکلهای تکمیلی ۶ و ۷). طبقهبندی گسترده سهبعدی و پالایش محلی چندین حالت ساختاری TcdB را در مجموعه داده شناسایی کرد، از جمله یک حالت گسترده متصل (شکل دادههای گسترده ۶ و شکل تکمیلی ۸). پالایش سهبعدی VHH متصل در حالت TcdB گسترده، یک نقشه با وضوح متوسط ۴.۶ آنگستروم به دست داد که مدل طراحی با اطمینان در آن به صورت جسم صلب داک شد و تطابق بالایی با ساختار مورد نظر طراحی نشان داد (شکل ۳ط-ک). برای ارزیابی اینکه آیا تمایل بهبود یافته از طریق OrthoRep حالت اتصال اصلی طراحی والد را حفظ کرده است یا خیر، ما تجزیه و تحلیل cryo-EM اضافی بر روی VHH بالغشده، VHH_TcdB_H2_ortho، انجام دادیم. این آزمایشها نسبت بالایی از ذرات TcdB را که اکنون توسط VHH متصل شدهاند، نشان داد که با تمایل افزایش یافته آن سازگار است (شکل ۳ل-ن و شکل تکمیلی ۳ب). با استفاده از یک خط لوله پردازش مشابه برای کمپلکس VHH-TcdB والد، ما کمپلکس VHH بالغشده-TcdB را با وضوح متوسط ۵.۷ آنگستروم حل کردیم، که به ما امکان داد با اطمینان VHH طراحیشده را در چگالی cryo-EM با تطابق نزدیک داک کنیم. این تأیید کرد که VHH هدفگیری به اپیتوپ صحیح را حفظ کرده و حالت اتصال اصلی خود را پس از بلوغ تمایل با واسطه OrthoRep حفظ کرده است (شکل ۳ل-ن و شکل دادههای گسترده ۶). این نتایج قابلیت RFdiffusion را در طراحی VHHهای دقیق de novo که قادر به هدف قرار دادن اپیتوپهای قبلاً کاوشنشده هستند و برای بلوغ تمایل بعدی مناسب هستند، برجسته میکند.
سپس ما از cryo-EM برای مشخصهیابی یک VHH بالغشده (VHH_RBD_D4_ortho19) که RBD اسپایک SARS-CoV-2 را هدف قرار میدهد، استفاده کردیم، جایی که آزمایشهای رقابتی نشان داد که VHH والد به اپیتوپ مورد نظر متصل میشود (شکل ۲ج، شکل دادههای گسترده ۴ج و شکلهای تکمیلی ۳ب و ۹). RBD بین کانفورماسیونهای «بالا» و «پایین» جابجا میشود و حالت «بالا» اتصال به گیرنده و ورود ویروس را ممکن میسازد. میانگینهای کلاس دوبعدی cryo-EM و بازسازیهای طبقهبندی سهبعدی از کمپلکس متصل به VHH ترکیبی از کانفورماسیونهای RBD (۱-۲ «بالا») را نشان داد و چگالی VHH منحصراً در حالت بالا مشاهده شد. این با طراحی آن سازگار است، زیرا اپیتوپ هدف در کانفورماسیون پایین مسدود شده است (شکل تکمیلی ۹الف،ب). پالایش کلی با وضوح تخمینی متوسط ۳.۹ آنگستروم، چگالی کاملاً مشخصی را برای قسمت پایینی پروتئین اسپایک (وضوح محلی تقریباً ۲.۵ آنگستروم) فراهم کرد، اما انعطافپذیری نسبی RBD منجر به میانگینگیری قابل توجه سیگنال شد و باعث از بین رفتن چگالی در سطوح کانتور بالاتر گردید، که ارزیابی دقت طراحی VHH را غیرممکن ساخت (شکل تکمیلی ۹ج-هـ). گسترش تقارن و پالایش محلی به بهبود وضوح فصل مشترک RBD-VHH کمک کرد و فولد VHH مورد نظر و هدفگیری دقیق اپیتوپ را پس از داکینگ جسم صلب مدل طراحی در نقشه چگالی تأیید کرد (شکل تکمیلی ۹و،ز)، که با دادههای رقابت بیوشیمیایی ما (شکل ۲ج) مطابقت داشت. با این حال، اگرچه VHH به اپیتوپ صحیح RBD متصل شد، حالت اتصال آن به طور قابل توجهی از مدل طراحی منحرف شد و در عوض یک تعامل عمدتاً با واسطه چارچوب را اتخاذ کرد که با پیشبینیهای گذشتهنگر AlphaFold3 مطابقت بیشتری داشت (شکل تکمیلی ۹ز،ح). به دلیل انحراف بین داک طراحیشده و داک تعیینشده تجربی، ما این مورد را به عنوان یک شکست در طراحی طبقهبندی کردیم.
طراحی scFvها با شش CDR طراحیشده
با توجه به موفقیت RFdiffusion در طراحی VHHها با سه CDR de novo، ما در مرحله بعد توانایی آن را برای طراحی هر دو زنجیره سنگین و سبک در قالب scFv آزمایش کردیم. از RFdiffusion برای تولید scFvهایی که سایتهای اپیتوپ خاصی را هدف قرار میدهند، با پیروی از استراتژی مشابه رویکرد طراحی VHH استفاده شد. با این حال، برخلاف VHHها که تنها سه CDR به صورت de novo ساخته میشدند، طراحی scFv شامل ساخت هر شش CDR بر روی هر دو زنجیره سنگین و سبک علاوه بر حالت داکینگ بود.
مشکل سنتز ژن برای scFvها بسیار بزرگتر از VHHها است، زیرا آنها برای مونتاژ ساده از جفتهای الیگونوکلئوتیدهای معمولی سنتز شده بر روی آرایههای الیگونوکلئوتیدی بیش از حد طولانی هستند و جفت کردن منحصر به فرد آنها به دلیل همولوژی توالی بالا بین scFvها چالشبرانگیز است. ما پروتکلهای مونتاژ مرحلهای را توسعه دادیم که امکان ساخت کتابخانههایی با زنجیرههای سنگین و سبک را فراهم میکند که یا به طور خاص مانند مدلهای طراحی جفت شدهاند (شکلهای تکمیلی ۱۰ و ۱۱) یا به صورت ترکیبی در زیرمجموعههایی از طراحیها با حالتهای اتصال به هدف مشابه مخلوط شدهاند (شکل تکمیلی ۱۲). رویکرد دوم به غلبه بر چالش بزرگتر طراحی دقیق شش CDR de novo کمک میکند، که امکان خطا را در مقایسه با مسئله VHH افزایش میدهد، زیرا تنها یک CDR نامطلوب میتواند اتصال را به خطر بیندازد. ما دریافتیم که با داشتن مجموعههایی از طراحیهای تقریباً منطبق بر هم که همان سایت را با همان حالت اتصال هدف قرار میدهند، scFvهای جدید تولید شده با ترکیب جفتهای زنجیرههای سنگین و سبک از طراحیهای مختلف، با فراوانی مشابهی نسبت به طراحیهای اصلی، با اطمینان پیشبینی میشوند که به سایت هدف در حالت اتصال طراحیشده متصل شوند (شکل دادههای گسترده ۷الف). در مقابل، جفتسازی تصادفی و بدون توجه به ساختار به ندرت به اتصالدهندههای پیشبینیشده منجر میشد (شکل دادههای گسترده ۷الف). از این رو، با مخلوط کردن CDRها از طراحیهای مختلفی که در یک جهتگیری یکسان متصل میشوند، میتوانیم به طور مؤثر بر شکستهای ناشی از CDRهای منفرد که به طور ناقص طراحی شدهاند، غلبه کنیم و در نتیجه یک راهحل ترکیبی برای یک مسئله پیچیدهتر ترکیبی (طراحی scFv دو زنجیرهای در مقابل طراحی VHH یک زنجیرهای) ارائه دهیم. این استراتژی یک مزیت کلیدی طراحی مبتنی بر ساختار را برجسته میکند: جفتسازی «هوشمندانه» زنجیرههای سنگین و سبک با یک مدل ساختاری از هر آنتیبادی امکانپذیر است و به کتابخانههای آنتیبادی طراحیشده de novo اجازه میدهد تا به مقیاسهای قابل دستیابی با روشهای سنتی مونتاژ کتابخانه برسند، علیرغم محدودیتهای فعلی در سنتز ژن.
ما موفق شدیم scFvهای اختصاصی برای اپیتوپ را از کتابخانههای ترکیبی سنگین-سبک (با پیچیدگی نظری حدود ۱۰ میلیون؛ شکل دادههای گسترده ۷ب،ج و ۸الف-ج) شناسایی کنیم، اما از کتابخانههای جفتسازی ثابت (شکل تکمیلی ۱۳) موفق نشدیم. پس از بیان و خالصسازی، تجزیه و تحلیل SPR شش scFv متمایز که از دو داک منحصر به فرد که اپیتوپ Frizzled TcdB را هدف قرار میدادند، طیفی از تمایلها را نشان داد (شکل ۴د-ح): اتصالدهنده با بالاترین تمایل، scFv6، دارای Kd ۷۲ نانومولار بود (شکل ۴ز). تبدیل scFv به یک IgG1 کامل، آنتیبادیهایی تولید کرد که با تمایل قابل مقایسه (۶۸ نانومولار) متصل میشوند، که نشان میدهد روش طراحی ما میتواند برای تولید آنتیبادیهای کامل استفاده شود (شکل ۴ط). هیچ آنتیبادی متصل به این اپیتوپ در PDB وجود ندارد، از این رو، این موفقیت را نمیتوان به یادآوری (memorization) نسبت داد. پیشبینی بعدی ساختار scFv با AlphaFold3 حالت اتصالی را نشان داد که با دو طراحی والد تقریباً منطبق بر هم که زنجیرههای سبک و سنگین را فراهم کرده بودند، یکسان بود (شکل تکمیلی ۱۶ج،د). رقابت با یک گیرنده شناختهشده، Frizzled-7، برای این اپیتوپ تأیید کرد که اتصال scFv5 در محل مورد نظر بوده است (شکل ۴ی). در مقابل، هیچ رقابتی در حضور CSPG4، یک گیرنده جایگزین که با اپیتوپی در هسته توکسین تعامل دارد، مشاهده نشد. بنابراین، scFvهایی که اپیتوپهای مشخصشده توسط کاربر را هدف قرار میدهند، میتوانند از کتابخانههای ترکیبی طراحیشده با آگاهی از ساختار شناسایی شوند.
الف، همترازی چند توالی از شش scFv که به TcdB متصل میشوند. scFvهای ۱-۵ از یک خوشه ساختاری یکسان سرچشمه میگیرند، در حالی که scFv6 از یک خوشه متمایز است. ب،ج، پیشبینیهای AlphaFold3 از scFv5 (ب) و scFv6 (ج) در کمپلکس با TcdB. پیشبینی میشود scFv5 و scFv6 به یک اپیتوپ مشابه اما نه یکسان متصل شوند. جهتگیری پیشبینیشده scFv6 نسبت به TcdB در مقایسه با scFv5 چرخیده است. د، تمایل scFv5 به TcdB با SPR ۴۶۰ نانومولار بود. هـ، پیشبینی محاسباتی فصل مشترک scFv5-TcdB برای VH (قطعه متغیر زنجیره سنگین؛ چپ) و VL (قطعه متغیر زنجیره سبک؛ راست). و، scFv5، هنگامی که به عنوان یک IgG1 کامل بیان میشود، تمایل اتصال ۳۸۰ نانومولار به TcdB را با SPR نشان میدهد. ز، تمایل scFv6 به TcdB با SPR ۷۲ نانومولار بود. ح، پیشبینی محاسباتی فصل مشترک scFv6-TcdB برای VH (چپ) و VL (راست). ط، scFv6، هنگامی که به عنوان یک IgG1 کامل بیان میشود، تمایل اتصال ۶۸ نانومولار به TcdB را با SPR نشان میدهد. ی، scFv5 با Frizzled-7 رقابت میکند و با CSPG4 رقابت نمیکند، که نشاندهنده اتصال در محل مورد نظر است. scFv5 به یک تراشه CM5 کونژوگه شد و TcdB RBD با غلظت ۵۰ نانومولار به تنهایی یا مخلوط با ۱ میکرومولار از Frizzled-7، CSPG4 یا scFv5 روی آن جریان داده شد. ک،ل، تجزیه و تحلیل مقایسهای SPR از اتصال B1.2.1 به C*07:02-PHOX2B در مقابل C*07:02-PHOX2B(R6A). scFv ایموبلایز شد و سپس اتصال در محل هدف و خارج از هدف در یک تیتراسیون هشت مرحلهای دو برابر با غلظت بالایی ۵ میکرومولار اندازهگیری شد. تجزیه و تحلیل سینتیک حالت پایدار (ک) و ردپای خام SPR (ل) از اتصال در محل هدف و خارج از هدف، اتصال اختصاصی به هدف مورد نظر را نشان میدهد. م، پیشبینیهای AlphaFold3 از HLA-C*07:02 با پپتید PHOX2B (چپ) و PHOX2B(R6A) (راست). پیشبینی میشود R6 از PHOX2B در معرض حلال باشد. ن، پیشبینی AlphaFold3 از scFv B1.2.1 در کمپلکس با C*07:02-PHOX2B (چپ). تماسهای قطبی پیشبینیشده با R6 پپتید PHOX2B (راست)، با واسطه CDRH3، CDRL1 و CDRL2 نیز نشان داده شده است. این شکل با استفاده از BioRender (http://biorender.com) ایجاد شده است.
در مرحله بعد، ما یک اپیتوپ مرتبط با بالین را هدف قرار دادیم: پپتید QYNPIRTTF مشتق از ژن وابستگی نوروبلاستوما و تنظیمکننده اصلی رونویسی PHOX2B در کمپلکس با آلوتیپ HLA-C*07:02 از مجموعه سازگاری بافتی اصلی (MHC) (ما در ادامه به این پپتید به سادگی PHOX2B میگوییم). پپتید PHOX2B در ابتدا از طریق ایمونوپپتیدومیکس نمونههای مشتق از بیمار نوروبلاستوما کشف شد و با گیرندههای آنتیژن کایمریک پپتید-محور (PC-CARs) برای درمان نوروبلاستومای پرخطر هدف قرار گرفته است. با این حال، PC-CARهای شناسایی شده قبلی محدود به تشخیص PHOX2B ارائهشده بر روی HLAهای گروه سرولوژیکی A9 هستند و آلوتیپ رایج HLA-C*07:02 را شامل نمیشوند (مرجع). هدف قرار دادن کمپلکس PHOX2B-HLA-C*07:02 میتواند جمعیت بیماران قابل درمان را به طور معناداری افزایش دهد و تمرکز توسعه درمانیهای جاری بوده است. اخیراً، اتصالدهندههای (غیر آنتیبادی) طراحیشده محاسباتی برای PHOX2B-HLA-C*07:02 با استفاده از سیستم TRACeR-I توسعه یافتهاند، در حالی که TCRهای با تمایل بالا برای هدف قرار دادن پپتیدها بر روی آلوتیپهای رایج HLA-C*08:02/HLA-C*05:01 شناسایی شدهاند. یکی از مزایای طراحی مبتنی بر ساختار، توانایی هدف قرار دادن اسیدهای آمینه پپتیدی خاص برای دستیابی به ویژگی اتصال است (به جای اتصال فقط به MHC)، و بنابراین ما از RFdiffusion برای هدف قرار دادن اسید آمینه R6 استفاده کردیم که مشخص شده است در اتصال PC-CAR مهم است. با توجه به پایداری پایین کمپلکس PHOX2B-HLA-C*07:02 (دمای ذوب Tm برابر با ۴۴.۲ درجه سانتیگراد)، ما از یک رویکرد تثبیتشده با پیوند دیسولفیدی برای تهیه یک فرم تثبیتشده از هدف pHLA استفاده کردیم. با استفاده از رویکرد مونتاژ ترکیبی که در بالا توضیح داده شد، ما اتصالدهندههای scFv با تمایل متوسط (۴۰۰ نانومولار اندازهگیری شده با SPR و ۱ میکرومولار اندازهگیری شده با کالریسنجی تیتراسیون ایزوترمال (ITC)؛ شکل ۴ک،ل و شکل دادههای گسترده ۸هـ-ز) را به PHOX2B-HLA-C*07:02 شناسایی کردیم. اتصال به پپتید اختصاصی بود و هیچ اتصال قابل تشخیصی به پپتید PHOX2B با جهش نقطهای R6A (PHOX2B(R6A)-HLA-C*07:02؛ شکل ۴ل) مشاهده نشد. تلاشهایی برای گنجاندن اتصالدهندههای scFv در یک 4-1BB-CAR انجام شد، اما سنجشهای سمیت سلولی سلولهای T هیچ کشتار قابل تشخیصی را در طیفی از ردههای سلولی نوروبلاستوما نشان نداد (شکل تکمیلی ۱۴)، احتمالاً به دلیل تمایل اتصال متوسط و/یا سطوح پایین چگالی آنتیژن بیانشده بر روی سلولهای تومور. اگرچه هنوز جای زیادی برای بهبود تمایل وجود دارد، این نشاندهنده توانایی طراحی آنتیبادی مبتنی بر ساختار، همراه با روشهای مونتاژ کتابخانه مناسب، برای طراحی اتصالدهندههای خاص به اپیتوپهای هدف چالشبرانگیز و مهم از نظر بالینی است.
طراحی scFv با دقت اتمی برای TcdB
برای ارزیابی دقت طراحی de novo scFv، ما ساختارهای cryo-EM دو scFv مونتاژ شده ترکیبی، scFv5 و scFv6 را که هر دو اپیتوپ Frizzled TcdB را هدف قرار میدادند، تعیین کردیم. تجزیه و تحلیل cryo-EM تأیید کرد که هر دو scFv همانطور که طراحی شده بودند به اپیتوپ Frizzled متصل میشوند (شکل ۵ و شکل دادههای گسترده ۹). میانگینهای کلاس دوبعدی با وضوح بالا از scFv6 چگالی واضحی را هم برای TcdB و هم برای scFv متصل شده نشان داد که با یک بازسازی سهبعدی ۳.۶ آنگسترومی بیشتر پشتیبانی شد (شکل ۵الف،ب و شکل دادههای گسترده ۹). ساختار حلشده نشان داد که scFv6 با جهتگیری اتصال پیشبینیشده با اپیتوپ Frizzled در امتداد دامنه DRBD خود درگیر میشود (شکل ۵د و جدول ۱۰ روشهای تکمیلی). انطباق ساختار cryo-EM با مدل طراحی، تطابق قابل توجهی را نشان داد و هر دو زنجیره سنگین و سبک همانطور که در نظر گرفته شده بود با اپیتوپ تعامل داشتند (شکل ۵ج و شکل تکمیلی ۱۶الف،ب). فولد کلی با طراحی، که یک مدل ترکیبی از دو زنجیره نشأت گرفته از طراحیهای متمایز اما از نظر ساختاری مشابه بود، مطابقت نزدیکی داشت (RMSD = ۰.۹ آنگستروم)، و هر یک از شش CDR دقت نزدیک به اتمی را نشان دادند (RMSDهای ستون فقرات: CDRH1 = ۰.۴ آنگستروم، CDRH2 = ۰.۳ آنگستروم، CDRH3 = ۰.۷ آنگستروم، CDRL1 = ۰.۲ آنگستروم، CDRL2 = ۱.۱ آنگستروم و CDRL3 = ۰.۲ آنگستروم؛ شکل ۵هـ،و). این تطابق به کانفورماسیونهای روتامری زنجیرههای جانبی CDR و تعاملات آنها با اپیتوپ Frizzled نیز گسترش یافت، که بر دقت RFdiffusion در طراحی تعاملات de novo scFv-هدف تأکید میکند (شکل ۵ز).
الف، میانگینهای کلاس دوبعدی cryo-EM برچسبگذاریشده از یک scFv طراحیشده، scFv6، متصل به TcdB. ب، یک بازسازی سهبعدی cryo-EM با وضوح ۳.۶ آنگستروم از کمپلکس نشان میدهد که scFv6 در امتداد اپیتوپ Frizzled به TcdB متصل شده است. ج، ساختار cryo-EM از scFv6 در کمپلکس با TcdB با مدل طراحی مطابقت نزدیکی دارد. د، ساختار cryo-EM از scFv6 متصل به TcdB. هـ، cryo-EM طراحی دقیق scFv6 با استفاده از RFdiffusion را آشکار میکند. و، انطباق هر یک از شش ساختار پیشبینیشده حلقه CDR scFv6 طراحیشده در مقایسه با ساختار cryo-EM ساختهشده. ز، مقایسه روتامرهای پیشبینیشده CDRH3 با ساختار cryo-EM ساختهشده با وضوح ۳.۶ آنگستروم. ح، میانگینهای کلاس دوبعدی cryo-EM برچسبگذاریشده از scFv طراحیشده، scFv5، متصل به TcdB کامل. ط، یک بازسازی سهبعدی cryo-EM با وضوح ۶.۱ آنگستروم از کمپلکس نشان میدهد که scFv5 همانطور که پیشبینی شده بود به اپیتوپ هدف متصل شده است. ی، به دلیل وضوح متوسط، ابتدا قطعهای از TcdB در نقشه چگالی cryo-EM داک شد و سپس مدل طراحی کامل—شامل قطعه TcdB و scFv طراحیشده—با قطعه TcdB از پیش جایگذاریشده، همتراز شد. این رویکرد نشان میدهد که طراحی پیشبینیشده با کمپلکس تعیینشده تجربی در ساختار، هدفگیری اپیتوپ و کانفورماسیون کلی مطابقت نزدیکی دارد. در مدلها، زرد نشاندهنده TcdB است؛ سرمهای نشاندهنده قطعه متغیر زنجیره سنگین (cryo-EM) است؛ صورتی نشاندهنده قطعه متغیر زنجیره سبک (cryo-EM) است؛ و خاکستری نشاندهنده پیشبینی طراحی محاسباتی است.
scFv5 برای اتصال به همان اپیتوپ اما با زاویه نزدیک شدن متمایز نسبت به scFv6 طراحی شده بود (شکل ۴ب،ج). یک بازسازی cryo-EM با وضوح ۶.۱ آنگستروم اتصال scFv5 را به اپیتوپ Frizzled TcdB تأیید کرد و میانگینهای کلاس دوبعدی چگالی واضحی را برای کمپلکس نشان داد (شکل ۵ح و شکل تکمیلی ۱۵). داکینگ جسم صلب مدل طراحی در چگالی cryo-EM تطابق نزدیکی را بین حالتهای اتصال پیشبینیشده و تعیینشده تجربی نشان داد (شکل ۵ط،ی).
اوراکلهای بهبودیافته نرخ موفقیت را افزایش میدهند
اگرچه نتایج ما نشان میدهد که طراحی de novo آنتیبادیها امکانپذیر است، نرخ موفقیت تجربی پایین باقی میماند. یک عامل کلیدی در موفقیتهای قبلی در طراحی اتصالدهندههای de novo، فیلترهای بهبود یافته بود (در درجه اول AlphaFold2 (مرجع))، که موفقیت تجربی را در زیرمجموعهای از طراحیهایی که به صورت تجربی آزمایش میشوند، غنیسازی کرد. در ابتدای این مطالعه، ما به دنبال ساخت چنین فیلتری با بهینهسازی RoseTTAFold2 بودیم (شکل دادههای گسترده ۲ و ۳)، اما قدرت فیلتر کردن این مدل محدود است (حداقل با تنظیمات استفاده شده؛ ارائه ۱۰۰٪ از «نقاط داغ» فصل مشترک). این احتمالاً دلیل نرخ پایین موفقیت تجربی و طراحی نادرست SARS-CoV-2 است، جایی که فولد کلی و هدفگیری اپیتوپ صحیح بود، اما جهتگیری اتصال صحیح نبود.
پس از کار طراحی در این مطالعه، AlphaFold3 (مرجع) منتشر شد و دقت پیشبینی ساختار آنتیبادی را، هم با حضور آنتیژن و هم بدون آن، بهبود بخشیده است. به صورت گذشتهنگر، میتوانیم ارزیابی کنیم که چگونه فیلتر کردن با AlphaFold3 نرخ موفقیت تجربی را بهبود میبخشید. اول، AlphaFold3 به طور دقیق ساختار تأیید شده تجربی VHH SARS-CoV-2 که به طور نادرست طراحی شده بود را پیشبینی میکند (شکل تکمیلی ۹). اگر از AlphaFold3 به عنوان یک فیلتر اولیه استفاده شده بود، این طراحی به دلیل اختلاف بین ساختارهای پیشبینیشده و مورد نظر رد میشد و در نتیجه از آزمایش تجربی آن جلوگیری میشد. دوم، ما ساختارهای طراحیهای VHH برای SARS-CoV-2، هماگلوتینین آنفولانزا، TcdB و IL-7Rα را با استفاده از AlphaFold3 با یک همترازی چند توالی (MSA) و الگوها برای هدف و تنها یک الگو برای VHH (از آنجا که CDRها de novo هستند، ما استدلال کردیم که MSA کاربرد محدودی خواهد داشت) پیشبینی کردیم. ما پیشبینیها را برای کتابخانههایی با حداقل یک VHH تأیید شده از نظر ساختاری (TcdB، هماگلوتینین آنفولانزا و SARS-CoV-2) تجزیه و تحلیل کردیم. این نتایج تحت سلطه VHHهای ضد هماگلوتینین هستند زیرا اکثر اتصالدهندههای موفق از این کتابخانه بودند. ما دریافتیم که امتیاز مدلسازی الگوی پیشبینیشده فصل مشترک (ipTM) AlphaFold3، که معیاری از اطمینان مدل در فصل مشترک است، پیشبینیکننده موفقیت اتصال است (مساحت زیر منحنی = ۰.۸۶؛ شکل دادههای گسترده ۱۰الف،ب). به طور کلی، تنها ۹٪ از طراحیهای VHH سفارش داده شده ما دارای ipTM > ۰.۶ هستند، که نشان میدهد نرخ موفقیت با گنجاندن یک فیلتر ipTM بهبود خواهد یافت. ما تجزیه و تحلیل مشابهی را برای کتابخانههای scFv مونتاژ شده ترکیبی انجام دادیم؛ ما ساختارهای طراحیهای scFv والد (قبل از مونتاژ ترکیبی) و طراحیهای scFv تأیید شده تجربی (مونتاژ شده ترکیبی) را با استفاده از AlphaFold3 با یک MSA برای توالی هدف و الگوها برای هدف و همچنین زنجیرههای سنگین و سبک، با در نظر گرفتن حداکثر امتیاز ipTM در ۱۰ تکرار (seed) پیشبینی کردیم. ما دریافتیم که طراحیهای موفق به امتیازهای ipTM AlphaFold3 بالاتری نسبت به طراحیهای والد خوشهبندی میشوند (شکل دادههای گسترده ۱۰ج). تنها ۴٪ از کتابخانه طراحی اولیه دارای ipTM > ۰.۸۵ است، در حالی که ۵ از ۶ طراحی تأیید شده تجربی از این آستانه عبور میکنند، که باز هم نشان میدهد فیلتر کردن با ipTM AlphaFold3 باید نرخ موفقیت را افزایش دهد (شکل دادههای گسترده ۱۰د).
بحث
نتایج ما نشان میدهد که طراحی de novo دامنههای آنتیبادی که اپیتوپهای خاصی را روی یک هدف هدف قرار میدهند، امکانپذیر است. دادههای ساختاری cryo-EM برای VHHهای طراحیشده برای هماگلوتینین آنفولانزا و TcdB تطابق بسیار نزدیکی با مدلهای طراحی محاسباتی را نشان میدهد، که نشان میدهد رویکرد ما میتواند کمپلکسهای VHH را با دقت اتمی—شامل حلقه H3 بسیار متغیر و جهتگیری کلی اتصال—طراحی کند که با هر ساختار شناختهشدهای در PDB بسیار متفاوت است. علاوه بر این، دادههای ساختاری cryo-EM از scFvهای طراحیشده متصل به TcdB، توانایی RFdiffusion را در طراحی دقیق scFvهای دو زنجیرهای نشان میدهد. تا آنجا که ما میدانیم، اینها اولین موارد تأیید شده از نظر ساختاری از آنتیبادیهای طراحیشده de novo هستند.
روش محاسباتی ما با رویکردهای غربالگری تجربی که برای بازیابی آنتیبادیها از کتابخانههای بزرگ تصادفی توسعه یافتهاند، به چندین روش همافزایی دارد. اول، روشهای انتخاب با نمایش سطحی مخمر که به طور گسترده برای غربالگری کتابخانه آنتیبادی استفاده میشوند، امکان بازیابی اتصالدهندههای با بالاترین تمایل را در میان مجموعههای بزرگ طراحیها فراهم میکنند، که در حال حاضر به دلیل نرخ موفقیت طراحی نسبتاً پایین ضروری است. دوم، غربالگری کتابخانههای ترکیبی که زنجیرههای سنگین و سبک را از طراحیهایی با حالتهای اتصال مشابه مخلوط میکنند، امکان شناسایی scFvهای متشکل از زنجیرههای سازگار از نظر ساختاری را که اپیتوپهای خاصی را هدف قرار میدهند، فراهم میکند، همانطور که در اینجا برای TcdB و MHC پپتید-PHOX2B نشان داده شد. سوم، بلوغ تمایل با استفاده از OrthoRep تمایل اندازهگیری شده طراحیهای اولیه VHH را تا محدوده نانومولار تکرقمی یا زیرنانومولار بهبود میبخشد، در حالی که حالت اتصال طراحیشده اصلی را حفظ میکند. از دیدگاه عملی، پیشرفت کلیدی این کار، توانایی تولید VHHها و scFvها در برابر یک هدف نیست—چیزی که اغلب از طریق روشهای صرفاً تجربی قابل دستیابی است—بلکه توانایی هدف قرار دادن دقیق اپیتوپهای اتصال خاص است. ویژگی اپیتوپ برای کاربردهای درمانی مانند آنتاگونیستهایی که تعاملات لیگاند-گیرنده را مسدود میکنند، آنتیبادیهایی که از رقابت با مولکولهای درونزا اجتناب میکنند، تعدیلکنندههایی که تغییرات کانفورماسیونی را برای فعال کردن سیگنالدهی القا میکنند، یا آنتیبادیهایی که اپیتوپهای ویروسی حفاظتشده یا محدود از نظر تکاملی را هدف قرار میدهند، حیاتی است.
هنوز جای زیادی برای بهبود وجود دارد. برای مرحله طراحی ستون فقرات، گنجاندن بهبودهای معماری اخیر و پیشرفتهای جدید در مدلسازی مولد ممکن است مدلهای طراحی با قابلیت طراحیپذیری و تنوع بالاتر به دست دهد. RoseTTAFold2 و RFdiffusion همچنین اخیراً برای مدلسازی تمام مولکولهای زیستی (به جای فقط پروتئینها) گسترش یافتهاند و گنجاندن این قابلیت در واریانت طراحی آنتیبادی RFdiffusion باید امکان طراحی دقیق آنتیبادیها را برای اپیتوپهای حاوی اتمهای غیرپروتئینی، مانند گلیکانها، فراهم کند. ProteinMPNN در این کار فعلی اصلاح نشد، اما طراحی توالیهایی که با توالیهای CDR انسانی مطابقت نزدیکتری دارند، انتظار میرود که پتانسیل ایمنیزایی آنتیبادیهای طراحیشده را کاهش دهد. در واقع، توالیهای طراحیشده در حال حاضر تا حدودی کمتر انسانی هستند (همانطور که با امتیاز OASis ارزیابی شده است) نسبت به CDRهای آنتیبادیهای درمانی (شکل تکمیلی ۱د). بهبودهای بیشتر در روشهای پیشبینی ساختار آنتیبادی باید بهینهسازی سریعتر روشهای طراحی بالادستی را امکانپذیر کرده و نرخ موفقیت تجربی را بهبود بخشد.
در نهایت، طراحی محاسباتی de novo آنتیبادیها با استفاده از RFdiffusion ما و رویکردهای مرتبط میتواند کشف و توسعه آنتیبادی را متحول کند. با بهبود روش و افزایش نرخ موفقیت، این پتانسیل را دارد که سریعتر و مقرونبهصرفهتر از ایمنسازی حیوانات یا غربالگری کتابخانههای تصادفی باشد. یک رویکرد مبتنی بر ساختار برای طراحی آنتیبادی همچنین باید به بهینهسازی ویژگیهای دارویی کلیدی، مانند تجمع، حلالیت و سطوح بیان (همه چالشهای عمده در توسعه آنتیبادی) به شیوهای آگاهانه از ساختار کمک کند. در مجموع، ما انتظار داریم که طراحی محاسباتی آنتیبادیها تعداد اهداف بالینی قابل دستیابی و بیماریهای قابل دسترس برای درمانهای آنتیبادی را افزایش دهد.
خلاصه گزارشدهی
اطلاعات بیشتر در مورد طراحی پژوهش در خلاصه گزارشدهی Nature Portfolio که به این مقاله پیوند داده شده است، موجود است.