دکتر «جیان ژو» استادیار بخش بیوانفورماتیک دانشگاه تگزاس (UTSW) میگوید: تنها حدود یک درصد از دیانای انسان دستوراتی برای ساخت پروتئین صادر میکند. تحقیقات در دهههای اخیر نشان داده است که بخش زیادی از مواد ژنتیکی باقی مانده دربردارنده عناصر تنظیم کننده است که چگونگی بیان دیانای کدگذاری کننده را تعیین میکنند. اینکه زنجیره چگونه عملکرد این عناصر تنظیمکننده را کنترل میکند تا امروز به خوبی شناخته نشده است.
او و همکارانش در دانشگاه پرینستون و موسسه «فلاریتون» برای شناخت بهتر این اجزای تنظیم کننده، یک مدل یادگیری عمقی به نام «سی» (Sei) تولید کردند که این بخشهای غیرکدگذاری کننده در دیانای را به ۴۰ «دسته زنجیرهای» (sequence class) تقسیم بندی میکند. این ۴۰ دسته بر اساس نزدیک به ۲۲ هزار مجموعه داده جمعآوری شده از مطالعات پیشین تهیه شدهاند و بیش از ۹۷ درصد از ژنوم انسان را پوشش میدهند.
این محققان از طریق کاربرد مدل «سی» درباره دادههای ژنتیکی انسان قادر شدند ساختار تنظیمکنندگی ۴۷ مورد ویژگی (trait) و بیماری در پایگاه داده «بیوبانک» انگلیس مشخص سازند و توضیح دهند که چگونه جهش در عناصر تنظیمکننده موجب پاتولوژیهای خاص میشود.
چنین قابلیتهایی میتواند به درک و شناخت نظاممندتری از این مساله منجر شود که تغییرات در زنجیره ژنوم چگونه با بیماریها مرتبط است.
دکتر ژو در ماه مه نیز طراحی یک ابزار دیگر موسوم به «اورکا» (Orca) را اعلام کرده بود که ساختار سهبعدی دیانای در کروموزومها را بر اساس زنجیره آن پیشبینی میکند. دکتر ژو میگوید که او و همکارانش قصد دارند از «سی» و «اورکا» برای تحقیق بیشتر درباره نقش جهش ژنتیکی در ایجاد نمودهای مولکولی و فیزیکی بیماریها استفاده کنند که این تحقیقات میتواند به یافتن راههای جدیدی برای درمان بیماریها منجر شود.