دانشمندان دانشکده پزشکی هاروارد و دانشگاه استنفورد یک ابزار تشخیصی هوش مصنوعی ایجاد کردهاند که میتواند بیماریها را بر روی اشعه ایکس قفسه سینه مستقیما از توضیحات زبان طبیعی موجود در گزارشهای بالینی همراه تشخیص دهد.
این مرحله به عنوان یک پیشرفت بزرگ در طراحی هوش مصنوعی بالینی تلقی میشود، زیرا اکثر مدلهای هوش مصنوعی فعلی نیاز به حاشیهنویسی پر زحمت انسانی از مجموعههای وسیعی از دادهها دارند، قبل از اینکه دادههای برچسبگذاریشده به مدل داده شوند تا آنها را آموزش دهد.
نتایج این مطالعه، نشان میدهد که این مدل که CheXzero نام دارد، در توانایی تشخیص آسیبشناسی در اشعه ایکس قفسه سینه با رادیولوژیستهای انسانی برابری میکند.
اکثر مدلهای هوش مصنوعی در طول آموزش خود به مجموعه دادههای برچسبگذاری شده نیاز دارند تا بتوانند آسیبشناسی را به درستی شناسایی کنند. این فرآیند به ویژه برای وظایف تفسیر تصویر پزشکی سنگین است، زیرا شامل حاشیه نویسی در مقیاس بزرگ توسط پزشکان انسانی است که اغلب گران و زمان بر است، به عنوان مثال، برای برچسب گذاری مجموعه دادههای اشعه ایکس قفسه سینه، رادیولوژیستهای متخصص باید صدها هزار تصویر اشعه ایکس را یک به یک نگاه کنند و به صراحت هر کدام را با شرایط شناسایی شده حاشیه نویسی کنند. در حالی که مدلهای جدید هوش مصنوعی سعی کردهاند با یادگیری از دادههای بدون برچسب در مرحله «پیشآموزشی»، این مشکل برچسبگذاری را برطرف کنند، در نهایت برای دستیابی به عملکرد بالا، نیاز به تنظیم دقیق دادههای برچسبگذاری شده دارند.
در مقابل، مدل جدید خود نظارت است، به این معنا که به طور مستقل بیشتر یاد میگیرد، بدون نیاز به دادههای برچسبگذاری شده دستی قبل یا بعد از آموزش. این مدل تنها به عکسبرداری از قفسه سینه و یادداشتهای انگلیسی زبان موجود در گزارشهای همراه با اشعه ایکس متکی است.
پراناو راجپورکار، محقق ارشد این مطالعه، میگوید: ما در روزهای اولیه نسل بعدی مدلهای هوش مصنوعی پزشکی هستیم که میتوانند وظایف انعطافپذیری را با یادگیری مستقیم از متن انجام دهند. تاکنون، اکثر مدلهای هوش مصنوعی برای دستیابی به عملکرد بالا به حاشیه نویسی دستی حجم عظیمی از دادهها (در حد ۱۰۰۰۰۰ تصویر) متکی بودهاند. روش ما به چنین حاشیه نویسی مخصوص بیماری نیاز ندارد.
با CheXzero، میتوان به سادگی یک عکس رادیولوژی قفسه سینه و گزارش رادیولوژی مربوطه را به مدل داده و با آن آموزش داد که تصویر و متن در گزارش باید مشابه در نظر گرفته شوند، به عبارت دیگر، میآموزد که با X قفسه سینه مطابقت داشته باشد.
راجپورکار میافزاید: اشعه با گزارش همراه خود این مدل میتواند در نهایت بیاموزد که چگونه مفاهیم موجود در متن بدون ساختار با الگوهای بصری در تصویر مطابقت دارند.
این مدل بر روی یک مجموعه داده در دسترس عموم شامل بیش از ۳۷۷۰۰۰ عکس با اشعه ایکس قفسه سینه و بیش از ۲۲۷۰۰۰ یادداشت بالینی مربوطه آموزش داده شد، سپس عملکرد آن روی دو مجموعه داده جداگانه از اشعه ایکس قفسه سینه و یادداشتهای مربوطه جمعآوریشده از دو مؤسسه مختلف که یکی از آنها در کشور دیگری بود، آزمایش شد. این تنوع مجموعه دادهها برای اطمینان از این بود که مدل در مواجهه با یادداشتهای بالینی که ممکن است از اصطلاحات متفاوتی برای توصیف همان یافته استفاده کند، به همان اندازه خوب عمل میکند.
بیشتر بخوانید
پس از آزمایش، CheXzero با موفقیت آسیبهایی را شناسایی کرد که به صراحت توسط پزشکان انسانی شرح داده نشده بودند. این ابزار بهتر از سایر ابزارهای هوش مصنوعی تحت نظارت خود و با دقتی مشابه رادیولوژیستهای انسانی عمل کرد.
به گفته محققان، این رویکرد در نهایت میتواند برای روشهای تصویربرداری بسیار فراتر از اشعه ایکس، از جمله سی تی اسکن، MRI و اکوکاردیوگرام به کار رود.
اکین تیو، یکی دیگر از محققان این مطالعه، میگوید: CheXzero نشان میدهد که دقت تفسیر تصویر پزشکی پیچیده دیگر نیازی به تحتالشعاع قرار دادن مجموعه دادههای بزرگ برچسبگذاری شده ندارد. ما از اشعه ایکس قفسه سینه به عنوان نمونه رانندگی استفاده میکنیم، اما در واقع قابلیت CheXzero به مجموعه وسیعی از تنظیمات پزشکی که در آن دادههای بدون ساختار معمول است، قابل تعمیم است، و دقیقا وعده دور زدن گلوگاه برچسب گذاری در مقیاس بزرگ را نشان میدهد که گریبانگیر جامعه شده است.
منبع: مدیکال اکسپرس