مطالعات همبستگی سراسری ژنوم ساختارهای ژنتیکی متفاوت برای افسردگی زودگذر و دیرگذر را شناسایی میکنند
چکیده
اختلال افسردگی ماژور (MDD) یک بیماری شایع و متنوع است که علتهای پیچیدهای دارد. بررسی گروههای همگنتر که بر اساس ویژگیهای بالینی مانند سن شروع تفکیک میشوند، میتواند شناسایی علل ژنتیکی زیربنایی را بهبود بخشد و منجر به استراتژیهای درمانی هدفمندتر شود. ما از بانکهای زیستی نوردي که دارای سوابق طولی سلامت هستند، برای بررسی تفاوتهای ساختارهای ژنتیکی افسردگی زودگذر (eoMDD؛ n = 46,708 مورد) و افسردگی دیرگذر (loMDD؛ n = 37,168 مورد) استفاده کردیم. در مجموع 12 مکانومیک ژنومیک برای eoMDD و دو مکانومیک برای loMDD شناسایی شد. بهطور کلی، دو زیرنوع MDD همبستگی متوسطی داشتند (همبستگی ژنتیکی، rg = 0.58) و در همبستگیهای ژنتیکیشان با ویژگیهای مرتبط تفاوت نشان دادند. این نتایج نشان میدهند که eoMDD و loMDD دارای الگوهای ژنتیکی جزئی متفاوتی هستند که برای eoMDD یک امضای توسعهای مربوط به مغز مشاهده میشود. نکته مهم این است که نمرات خطر چندژنزی (PRS) برای eoMDD میتوانند پیشبینیکننده سعی در خودکشی در اولین 10 سال پس از تشخیص اولیه باشند: خطر مطلق سعی در خودکشی در دهکده بالایی PRS برابر ۲۶٪ بود، در حالی که در دهکده پایینی ۱۲٪ و در گروه میانی ۲۰٪ بود. در مجموع، یافتههای ما میتوانند راهکارهای روانپزشکی دقیق برای MDD را هدایت کنند.
موضوعات
- افسردگی
- ژنتیک جمعیتی
متن اصلی
مانند دیگر اختلالات پیچیده نظیر دیابت نوع ۲1 و صرع2، ناهمگونی بالینی مشاهدهشده در اختلال افسردگی ماژور (MDD) احتمالاً ناشی از ناهمگونی زیستی زمینهای است3,4,5. پیشرفتهای اخیر در مطالعات همبستگی سراسری ژنوم (GWAS) برای MDD، که با بهرهگیری از نمونههای بزرگ از کنسرسیوم ژنومیک روانپزشکی6,7، 23andMe8، برنامه یک میلیون کهنهسرباز9 و بانکهای زیستی جهانی10,11,12,13 صورت گرفته است، پیشرفت قابلتوجهی در شناسایی واریانتهای ژنتیکی مرتبط با MDD فراهم کرده و شواهدی از تفاوتهای ژنتیکی بین انواع بالینی مختلف ظاهر شدهاند3,7,13. علیرغم این تلاشها، جستوجوی نقاط ژنتیکی خاص برای زیرنوعهای MDD بهصورت آهسته پیش رفته است که درک ما از اتئولوژی پیچیده آن را محدود میکند.
در این مطالعه، منبع مهمی از ناهمگونی MDD که سن شروع (AAO) است را بررسی میکنیم؛ با تقسیم افراد به افسردگی زودگذر (eoMDD) و افسردگی دیرگزر (loMDD) و انجام یک متاآنالیز بزرگ GWAS برای دو زیرنوع در همکاری جاری “TRYGGVE” کشورهای نوردي14,15 (شکل 1). eoMDD با نتایج شدتتری از جمله علائم روانپریشی، رفتار خودکشی و بیماریهای همزمان با دیگر اختلالات روانی و بیماریهای جسمی16,17 مرتبط است، در حالی که loMDD تمایل به بروز کاهش شناختی و افزایش خطر بیماریهای قلبیعروقی دارد18. تلاشهای پیشین برای تفکیک MDD بر مبنای AAO به دلیل چالشهای روششناختی، از جمله تنوع زیاد AAO در نمونهها، تعصب حافظه و حجم نمونههای نسبتاً کوچک، محدود شده بودند17. برای غلبه بر این چالشها، ما از بانکهای زیستی نوردي استفاده کردیم و سوابق سلامت طولی را همسانسازی کردیم تا موارد MDD را بر اساس سن اولین تشخیص MDD تفکیک کنیم15. پژوهشهای پیشین نشان دادهاند که سن اولین تشخیص میتواند بهعنوان نمایهٔ مناسب برای AAO در نظر گرفته شود، چرا که همبستگی ژنتیکی بالایی (rg = 0.95) بین این دو پدیدار وجود دارد16.
پس از همساز کردن تعاریف پدیداری MDD و سن اولین تشخیص در نه کوهورت از پنج کشور نوردي (دانمارک، استونی، فنلاند، نروژ و سوئد؛ روشها)، 151,582 مورد MDD شناسایی شد که شامل 46,708 مورد eoMDD با سن اولین تشخیص کمتر از ۲۵ سال (تقریبی از صدک ۲۵ توزیع AAO ≤ 20–21؛ ارجاع 19؛ روشها) و 37,168 مورد loMDD با سن اولین تشخیص ۵۰ سال یا بالاتر (تقریبی از صدک ۷۵ توزیع AAO ≥ 44–45 سال؛ روشها) (جدول 1)19. تحلیلهای GWAS همساز برای eoMDD و loMDD با استفاده از کانتینرهای سینگلتی در هر کوهورت انجام شد20 و پس از آن متاآنالیز انجام گرفت. پس از همساز کردن پدیدارها، همبستگی ژنتیکی بالایی (rg = 0.7‑0.9) میان بزرگترین کوهورتهای نوردي (کنسرسیوم تحقیق یکپارچه روانپزشکی (iPSYCH)، بانک زیستی استونی (EstBB)، FinnGen) مشاهده شد (شکل تکمیلی 1). برای ارزیابی قابلیت تعمیم بهعلاوه بر کوهورتهای نوردي، دادههای بانک زیستی بریتانیا (UKB) که بر مبنای سن اولین تشخیص خودگزارششده است، بررسی شد و GWAS برای eoMDD و loMDD با همان آستانههای سنی انجام شد (شکل تکمیلی 1). با این حال، با در نظر گرفتن تفاوتهای عمده در نمونهها و پدیدارها، تحلیلهای اصلی بر پایه کوهورتهای نوردي افراد با نژاد اروپایی انجام شد و UKB بهعنوان کوهورت مقایسهای برای نقاط شناسایی شده بکار رفت.

EMR، پرونده پزشکی الکترونیکی.
ما 12 مکانومیک ژنومیک معنادار برای eoMDD و دو مکانومیک دیگر برای loMDD (P < 5 × 10−8) شناسایی کردیم (شکل 2). این مکانها نیز در GWAS تمام موارد MDD مشاهده شدند، جایی که 80 مکانومیک معنادار شناسایی شد (شکل تکمیلی 2 و جدول تکمیلی 1). تقریباً تمام این مکانهای MDD در مطالعات GWAS پیشین گزارش شدهاند13 (جدول تکمیلی 3)، که اعتبار تعاریف پدیداری همساز و GWAS ما را نشان میدهد. برای 17 ژن معناداری که در تحلیل eoMDD شناسایی شدند، BPTF21، PAX522، SDK123 و SORCS324 در توسعه عصبی یا سیگنالگیری سیناپسی نقش دارند (جدول تکمیلی 2). برای loMDD، چهار ژن معنادار شناسایی شد که BSN در فعالیت نوروشیمیایی سیناپسی مشارکت دارد25 (جدول تکمیلی 2). مکانهای برتر فقط بخشی در UKB تکرار شد؛ فقط یک مکان در کروموزوم 9 نشانگر معنیداری اسمی (P < 0.05) بود؛ با این حال، برای مکانهای سراسری معنادار در هر دو نمونه، همبستگی اندازه اثرها قابلتوجه بود (r = 0.84 برای eoMDD؛ شکل تکمیلی 3 و جدول تکمیلی 3‑5).

a,b, نمودارهای مانهاطن معکوس شده از نتایج GWAS برای کشورهای ترکیبی نوردي، با استفاده از متاآنالیز وزندار وارون‑واریانس و آستانه معنیداری سراسری P < 5 × 10−8 (نشاندادهشده با خط افقی نقطهدار)، برای eoMDD (a) و loMDD (b). c, غنیسازی علامتهای کروماتین باز در GWAS eoMDD و loMDD. خط نقطهدار آستانه یکطرفه بونفرونی تصحیحشده را نشان میدهد که بهصورت P = 0.05/102 = 0.0005 تنظیم شده است. d, وارثت مبتنی بر پلی‑نيوکلئوتید تک‑نقطهای (SNP) \(\left({h}_{{\rm{SNP}}}^{2}\right)\) در محدودهای از برآوردهای شیوع جمعیت، بهطوری که خطوط نقطهدار برچسبگذاری شده مقدار برآورد نقطهای شیوع جمعیت را نشان میدهند. e, همپوشانی ژنتیکی بین MDD کلی، eoMDD و loMDD، که مثلث بالایی حاوی خطاهای استاندارد و قطری شامل برآوردهای پلیژنیکیتی از SBayesS میباشد. * برای loMDD، الگوریتم بهتنهایی همگرا نشد و برآورد پلیژنیکیتی نامطمئن شد، هرچند بهطور مداوم بالاتر از eoMDD در اجراهای موفق بود.
با ادغام نتایج GWAS در اختلالات روانی با نشانههای کروماتین باز خاص بافتی از پروژه RoadMap Epigenomics26، پژوهشهای پیشین نقش تنظیم ژنها را در طول توسعه عصبی جنینی نشان دادند27. ما فرضیهٔ خاصی را آزمایش کردیم که GWAS برای eoMDD در مکانهای تنظیمی کروماتین فعال در مغز جنینی غنیسازی میشود. در واقع، سیگنالهای ژنتیکی eoMDD بهطور معناداری در بافتهای مغز جنینی غنیشده بودند، در حالی که در مغزهای بزرگسال هیچ غنیسازیای مشاهده نشد (شکل 2c و جدول تکمیلی 6a)، که نقش توسعه اولیه مغز در خطر eoMDD را نشان میدهد. برای loMDD، فقط غنیسازی یک علامت اپیژنتیکی در بافتهای جنینی مردانه شناسایی شد. غنیسازی معناداری در بافتهای مغزی Genotype‑Tissue Expression (GTEx)28 یا در انواع سلولی مغز بزرگسال انسانی29 یافت نشد، که ممکن است بهدلیل قدرت آماری نسبتاً پایین در این GWASهای خاص زیرنوع باشد (شکل تکمیلی 4 و جدول تکمیلی 6b,c).
برآوردهای وارثت مبتنی بر پلی‑نيوکلئوتید تک‑نقطهای (SNP) \(\left({h}_{{\rm{SNP}}}^{2}\right)\) برای eoMDD در بازهای از شیوع جمعیت، بالاتر از loMDD بودند (شکل 2d و جدول تکمیلی 7). با فرض شیوع جمعیت 6.2٪ (روشها)، وارثت \({h}_{{\rm{SNP}}}^{2}\) برای eoMDD حدود 11.2٪ برآورد شد (فاصله اطمینان 95٪ = 9.9–12.5٪؛ مقیاس مسئولیت)، که تقریباً دو برابر مقدار برای loMDD (6٪؛ فاصله اطمینان 95٪ = 4.3–6.3٪) در شیوع 3.2٪ بود (جدول تکمیلی 7). ما همچنین GWAS مورد‑به‑مورد (case–case) انجام دادیم تا بهطور مستقیم eoMDD را با loMDD مقایسه کنیم؛ با این حال، این مقایسه وارثت کمی (\({h}_{{\rm{SNP}}}^{2}\) = 2٪، s.e. = 0.74) نشان داد. بهجالبی، تحلیلهای معماری ژنتیکی با استفاده از SBayesS30 تخمین زدند که پلیژنیکیتی (یعنی درصد SNPهای با اثر غیر صفر) در eoMDD (4٪، s.e. = 0.7٪) بسیار کمتر از GWAS تمام موارد MDD (7٪، s.e. = 0.5٪) (شکل 2e) و برآورد گزارششده در جدیدترین GWAS کنسرسیوم ژنومیک روانپزشکی برای MDD (6٪)6 است، که نشان میدهد تعداد واریانتهای علّی کمتر زیرپایهٔ eoMDD هستند.
دو زیرنوع MDD بهطور متوسط همبستگی متوسطی داشتند (rg = 0.58، s.e. = 0.04) (شکل 2e و جدول تکمیلی 8) و در همبستگیهای ژنتیکیشان با سایر ویژگیها تفاوت نشان دادند (شکل 3a، شکل تکمیلی 5 و جدول تکمیلی 8). eoMDD بالاترین rg را با سعی در خودکشی داشت (rg = 0.89، s.e. = 0.05)، که بیش از دو برابر همبستگی rg بین loMDD و سعی در خودکشی بود (rg = 0.42، s.e. = 0.05) (مقایسه با rg در تمام موارد MDD در شکل تکمیلی 6 و جدول تکمیلی 8). بهطور مشابه، تفاوتهای قابلتوجهی در rg آنها با اختلال استرس پس از سانحه، سوءاستفاده در کودکی، اختلال کمتوجهی/بیشفعالی، اختلال طیف اوتیسم و اسکیزوفرنی مشاهده شد. برای پدیدارهای جسمی و سبک زندگی، همپوشانی با eoMDD بهطور معناداری برای نارسایی قلبی و شاخص توده بدنی قویتر بود (جدول تکمیلی 8). با توجه به rg بین دو زیرنوع MDD، اثرات ژنتیکی مستقل هر زیرنوع را در حالی که اثر دیگری را بهعنوان شرط در نظر میگیریم، با استفاده از مدل معادلات ساختاری ژنومی (SEM) بررسی کردیم (شکل 3b). به این ترتیب، میتوان همپوشانی منحصر بهفرد هر زیرنوع با سایر ویژگیها را ارزیابی کرد و درک کرد که تا چه حد همپوشانی با ویژگی دیگر ناشی از همپوشانی با زیرنوع دیگر است. پس از کنترل برای loMDD، ارتباطات ژنتیکی eoMDD با سایر ویژگیها تقریباً ثابت ماند، بهجز اینکه همبستگی منفی rg بین eoMDD و دستاورد آموزشی کاهش یافت (جدول تکمیلی 9). در طرف دیگر، پس از احتساب همپوشانی ژنتیکی با eoMDD، ارتباطات ژنتیکی loMDD برای بسیاری از ویژگیها بهطور چشمگیری کاهش یافت (بهعنوان مثال، سعی در خودکشی و مرگ ناشی از خودکشی)، که نشان میدهد rg مشاهدهشده بین loMDD و این ویژگیها ناشی از ژنتیک مشترک با eoMDD است. بهطور کلی، eoMDD همپوشانیهای ژنتیکی قویتری با ویژگیهای روانپزشکی و سلامت عمومی نسبت به loMDD داشت و تفاوت بارز در همبستگیهای ژنتیکی با سعی در خودکشی مشاهده شد.

ما این روابط را با استفاده از رندومسازی مندل دو‑نمونهای (MR) بررسی کردیم (شکل 4). با توجه به تفاوت واضح زمانی بین زیرنوعهای MDD، عمدتاً به نقش eoMDD بهعنوان عامل خطر برای نتایج کلی سلامت علاقهمند بودیم، در حالی که برآوردهای loMDD بهعنوان مقایسه ارائه شد و نقش ویژگیهای سلامت کلی با loMDD بهعنوان نتیجه بررسی شد. قابلتوجه است که eoMDD تأثیر بهمراتب بزرگتری بر سعی در خودکشی نسبت به loMDD داشت (β = 0.61، s.e. = 0.057؛ loMDD: β = 0.28، s.e. = 0.052)، در حالی که اندازه اثر بر مرگ ناشی از خودکشی بین دو زیرنوع مقایسی بود (β = 0.64، s.e. = 0.20 برای eoMDD؛ β = 0.55، s.e. = 0.21 برای loMDD). برای دستاورد آموزشی، نتایج ما با گزارش پیشین که دستاورد آموزشی پایینتر را بهعنوان یک عامل خطر علّی برای MDD پیشنهاد میکرد7، بهویژه برای loMDD (β = −0.23، s.e. = 0.049؛ اثر بر eoMDD پلئوتروپی بود) همخوانی داشت؛ افزون بر این، نشان دادیم که eoMDD اثر علّی محتملی بر کاهش دستاورد آموزشی دارد (β = −0.09، s.e. = 0.026). بهطور مشابه، تحلیلهای معماری ژنتیکی با استفاده از SBayesS30 برآورد کردند که پلیژنیکیتی (یعنی درصد SNPهای با اثر غیر صفر) در eoMDD (4٪، s.e. = 0.7٪) بسیار کمتر از GWAS تمام موارد MDD (7٪، s.e. = 0.5٪) (شکل 2e) و برآورد گزارششده در جدیدترین GWAS کنسرسیوم ژنومیک روانپزشکی برای MDD (6٪)6 است، که نشان میدهد تعداد واریانتهای علّی کمتر زیرپایهٔ eoMDD هستند.

برای بررسی اینکه آیا نمرات خطر چندژنزی (PRS) برای eoMDD و loMDD با نشانگرهای بالینی یا نتایج شدید مرتبط هستند، PRSها را با استفاده از آمارههای خلاصه GWAS خروج‑یکی‑بدون‑خروج (LOO) تولید کردیم و ارتباطات PRS با این نتایج استخراجشده از دادههای رجیست سلامت طولی در هر کوهورت آزمایش کردیم. در متاآنالیز و در میان کوهورتهای فردی، PRS eoMDD نسبت به PRS loMDD توضیحدهندهٔ درصد بیشتری از واریانس فنوتیپی برای تمام نتایج موردنظر بود (شکل 5a، شکل تکمیلی 7 و جدول تکمیلی 11). بهویژه، افزایش 1 انحراف معیار در PRS eoMDD با افزایش خطر ابتلا زودگذر (نسبت شانس (OR) = 1.26، 95% CI = 1.13–1.4، P = 1.8 × 10−5) و خطر مادامالعمر MDD (OR = 1.24، 95% CI = 1.17–1.31، P = 1.16 × 10−13) مقایسه با PRS loMDD برای ابتلا زودگذر (OR = 1.13، 95% CI = 1.08–1.17، P = 3.9 × 10−9) و خطر مادامالعمر MDD (OR = 1.13، 95% CI = 1.07–1.19، P = 1.4 × 10−5) همراه بود. بهطور مشابه، در مقایسه با PRS loMDD، PRS eoMDD ارتباط قویتری با سایر نتایج موردنظر داشت؛ اختلافات در برآوردها برای PRSهای eoMDD و loMDD بهویژه برای بستری شدن در بیمارستان و تبدیل تشخیصی به اختلال دوقطبی و اسکیزوفرنی برجسته بود.

برای درک نحوهٔ ارتباط تمایلات ژنتیکی زیرپایهٔ دو زیرنوع با بیماریهای همزمان، یک مطالعهٔ ارتباط همگانی مبتنی بر PRS (PheWAS) را با استفاده از سوابق پزشکی EstBB از مراقبتهای اولیه و تخصصی (تشخیص بر پایهٔ کدهای 1,428 طبقهبندی بیماریهای بینالمللی، نسخهٔ دهم (ICD‑10)) انجام دادیم. پس از اصلاح برای آزمونهای متعدد (تصحیح بونفرونی، آستانهٔ P = 0.05/1,428)، ارتباطات مشترک و منحصر بهفردی برای هر زیرنوع شناسایی شد (شکل 5c و شکل تکمیلی 8a,b). بهطور قابل توجه، PRS eoMDD ارتباطات منحصر بهفردی با شرایط روانپزشکی همچون اختلال رفتار (کد ICD‑10: F91) و اختلال اسکیزوئیدال (F21)، سعی در خودکشی/آسیبدستی عمدی (X78) و مشکلات مرتبط با رویدادهای منفی در کودکی (Z61) یا سایر مشکلات مرتبط با تربیت (Z62) نشان داد. در مقابل، PRS loMDD بیشتر با اختلالات روانی و رفتاری ناشی از مصرف مسکن یا خوابآور (F13) و اختلال اضطراب وسواسی (F42) ارتباط داشت (شکل 5b و جدول تکمیلی 12).
روشها
جامعهٔ مورد مطالعه
برای انجام یک GWAS بزرگ از زیرنوعهای MDD مبتنی بر سن آغاز (AAO) با تعاریف پدیداری سازگار، نه کوهورت در پنج کشور نوردي (دانمارک، سوئد، نروژ، فنلاند و استونی) شناسایی کردیم، بههمچنین یک کوهورت مقایسهای از یک کشور غیر نوردي (انگلستان: UKB). بسیاری از این کوهورتها بانکهای زیستی بزرگ هستند که با سوابق پزشکی طولانیمدت در رجیستهای بیمارستانی ملی مرتبطاند؛ شامل iPSYCH، FinnGen، مطالعهٔ مادر، پدر و کودک نروژی (MoBa)، UKB و EstBB (جزئیات کوهورت در روشهای تکمیلی). این مطالعه توسط مرجع نظارت اخلاقی سوئد (شماره پرونده 2023‑03073) تأیید شد و هر کوهورت توسط هیئتهای نظارت مؤسسهای مربوطه تصویب شد.
پدیدارها
ما تلاش قبلی خود برای همساز کردن پدیدارهای ثبتمحور MDD، سن شروع و پیامدهای آن را در سه کشور اسکاندیناوی به سایر کشورهای نوردي که دارای سجلات مشابه هستند، گسترش دادیم15. با استفاده از رجیستهای بیمارستانی ملی، ابتدا اطلاعات مربوط به تشخیصهای MDD بیماران را با کدهای ICD‑10 F32 (اپیزود افسردگی) یا F33 (افسردگی مکرر) استخراج کردیم، بههمچنین معیار حذف شامل تشخیص مادامالعمر اختلال دوقطبی یا اسکیزوفرنی (کدهای ICD‑10: F30/F31/F32/F33، F20/F23.1/F23.2/F25) بود (جدول تکمیلی 14)، که منجر به مجموع 151,582 مورد MDD در کشورهای نوردي شد (n = 151,582). پژوهش قبلی ما همبستگی ژنتیکی بالایی (rg ≈ 0.95) بین AAO و سن اولین تشخیص MDD نشان داد16، و این که بهطور متوسط شروع بیماری 5 سال پیش از اولین تشخیص است16. بنابراین، سن اولین تشخیص را برای جمعیت بیماران MDD استخراج کردیم و آن را بهعنوان نمایهای برای AAO جهت تعریف eoMDD و loMDD بهکار بردیم. مقادیر مرزی بر پایهٔ بررسی دقیق ادبیات و دادههای تجربی رجیست سوئد انتخاب شد. متاآنالیز پیشین گزارش داد که میانهٔ AAO برای اختلال افسردگی حدود 30 سال است، در حالی که صدکهای 25 و 75 به ترتیب در سنین 21 و 44 سال قرار دارند15,19؛ دادههای رجیست سوئد ما نشان داد که برای اولین تشخیص تخصصی MDD، صدکهای 25 و 75 به ترتیب در سنین 25 و 45 سال بودند15. بنابراین، افرادی که اولین تماس درمانی تخصصی برای MDD آنها در سن ≤ 25 سال بود (تقریباً صدک 25 توزیع AAO ≤ 20–21) بهعنوان موارد eoMDD در نظر گرفته شدند (n = 46,708)؛ موارد loMDD افرادی بودند که اولین تماس درمانی تخصصی برای MDD در سن ≥ 50 سال بود (تقریباً صدک 75 توزیع AAO ≥ 44–45 سال؛ روشها) (جدول 1)19. کنترلها افراد بدون تشخیص ثبتشده MDD، اختلال دوقطبی یا اسکیزوفرنی بودند. بهدلیل تفاوت در طراحی کوهورتها، برای کوهورتهای مبتنی بر جمعیت EstBB، FinnGen، MoBa و UKB، کنترلها با موارد مطابقت داده شدند. کوهورتهای دانمارکی و سوئدی که از طرحهای مورد‑کوهورت و مورد‑کنترل استفاده میکردند، نیازی به مطابقت کنترل نداشتند.
محفظههای نرمافزاری برای تحلیلهای توزیعی
بهمنظور تضمین شفافیت و قابلیت بازتولید تحلیلهای دادهها در سطوح مختلف، ما محفظههای نرمافزاری و کدهای همراه برای پردازش و تجزیه و تحلیل دادهها (مانند GWAS، PRS، LDSC) توسعه دادیم و این محفظهها را در میان مراکز مطالعه توزیع کردیم. بهطور خلاصه، ابزارهای نرمافزاری اصلی و وابستگیهای آنها در ماشینهای مجازی مبتنی بر سیستمعامل لینوکس Ubuntu 20.04 LTS از طریق Docker (https://docker.com) نصب شد و با استفاده از قالب Singularity Image File (https://sylabs.io) برای توزیع محفظهسازی شد20. تمام کدهای منبع و فایلها بهصورت عمومی از طریق GitHub در دسترس هستند و تحت مجوز GNU General Public License (GPL v.3.0) منتشر شدند. ابزارهایی که تحت مجوزهای دیگر منتشر میشوند، مجوزهای اصلی خود را حفظ میکنند.
GWAS و متاآنالیز
GWAS افراد با نژاد اروپایی در هر کوهورت با استفاده از بستهٔ نرمافزاری REGENIE37 که در محفظههای نرمافزاری موجود است، انجام شد20. تحلیلها با در نظر گرفتن اولین ده مؤلفهٔ اصلی (PCها)، سن و جنس تنظیم شدند. آمارههای خلاصهٔ هر کوهورت در یک متاآنالیز اثر ثابت در METAL38 با دستور ‘SCHEME STDERR’ و استفاده از وزن وارون واریانس خطاهای استاندارد مربوطه برای تمامی پدیدارهای مورد مطالعه گنجانده شد، که منجر به 151,582 مورد و 362,873 کنترل برای همه MDD، 46,708 مورد و 106,824 کنترل برای eoMDD و 37,168 مورد و 121,420 کنترل برای loMDD شد. فیلترهای اضافی برای واریانتها اعمال گردید: نمره INFO > 0.8، فراوانی آللهای جزئی ≥ 1٪ و n > 10,000. پس از این فیلترینگ، تعداد مارکرها برای تجزیه و تحلیل نهایی METAL به ترتیب 8,910,578 برای MDD کلی، 8,848,589 برای eoMDD و 8,820,060 برای loMDD بود. سطح معنیداری سراسری بر P < 5 × 10−8 تنظیم شد. مکانهای سراسری بر پایهٔ SNPهای معنادار با استفاده از PLINK (دستور –clump) شناسایی شدند. سپس فهرستی از ژنها بر مبنای همپوشانی فیزیکی ژنها با این مکانها ایجاد شد (جدول تکمیلی 2). یک GWAS مورد‑به‑مورد (case–case) اضافی برای مقایسه موارد eoMDD با loMDD با استفاده از کوهورتهای EstBB و FinnGen انجام شد، چرا که هر دو دارای موارد eoMDD و loMDD در بانک زیستی خود هستند. در مجموع، 32,060 نمونه از FinnGen و 23,447 نمونه از EstBB بهصورت متاآنالیز در METAL ترکیب شدند؛ وارثت \(\left({h}_{{\rm{SNP}}}^{2}\right)\) با استفاده از LDSC39,40 برآورد شد.
آزمایشهای مبتنی بر ژن
ما از MAGMA41 نسخه 1.08 برای آزمون ارتباط جمعی واریانتها با انتساب SNPها به ژنها استفاده کردیم. مرزهای ژنها بهطور پیشفرض 35 kb به سمت بالادست و 10 kb به سمت پاییندست گسترش یافت تا پروموترها و تقویتکنندههای cis‑دربرگیرند. بهعنوان دادهٔ مرجع، توالیگذاری عمیق تمامی ژنوم پروژه 1000 Genomes (زیرمجموعه اروپایی) بهروز شده استفاده شد42، که از آدرس http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20220422_3202_phased_SNV_INDEL_SV/ دانلود گردید.
تقویت نوع بافت و سلول برای وارثت SNP با استفاده از LDSC لایه‑بندی شده
ما از LDSC لایه‑بندی شده39 برای انجام تجزیه و تحلیلهای غنیسازی در سطوح بافتی استفاده کردیم.