باشگاه خبرنگاران جوان وب‌گردی وبگردی

هوش مصنوعی چگونه دنیای عکاسی را دگرگون کرده است

نظر دادن

دانلود PDF

۱۵:۲۵ - ۱۶ اسفند ۱۳۹۸

۷۲۵۷۸۵۹

۱۵:۲۵ - ۱۶ اسفند ۱۳۹۸

۷۲۵۷۸۵۹

نظر دادن

دانلود PDF

باشگاه خبرنگاران جوان وب‌گردی وبگردی

هوش مصنوعی چگونه دنیای عکاسی را دگرگون کرده است

نظر دادن

دانلود PDF

دوربین گوشی‌های هوشمند در طی یکی دو سال اخیر با رشد چشم گیری روبرو شده اند و در حال حاضر بسیاری از عکاسان حرفه‌ای ترجیح می‌دهند به دلیل قابلیت حمل و نقل بالا از این دستگاه‌ها برای ثبت تصاویر خود استفاده کنند، اما باید توجه داشت که بخش قابل توجهی از این رشد و ارتقا را ممنون هوش مصنوعی هستیم و نه سنسور‌ها و لنز‌های جدید.

به گزارش گروه وبگردی باشگاه خبرنگاران جوان، این روز‌ها اگر قصد دارید از قدرت دوربین موجود در گوشی‌های هوشمند آگاهی پیدا کنید باید به قابلیت‌ها و ویژگی‌های آن در بخش هوش مصنوعی توجه داشته باشید. فارغ از تمامی بزرگ نمایی‌ها و حقه‌های تبلیغاتی، این فناوری سبب شده است که در طی سال‌های اخیر، رشد قابل توجهی در حوزه عکاسی توسط گوشی‌های هوشمند رخ دهد و در حال حاضر دلیلی وجود ندارد که سرعت این رشد را در سال‌های آینده، کُند پیش بینی کنیم.

گوگل، باعث و بانی ورود هوش مصنوعی به حوزه تصاویر در دنیای موبایل
بدون شک بخش اعظمی از پیشرفت‌های صورت گرفته در بخش دوربین گوشی‌های هوشمند به دلیل رشد و ارتقا فناوری هوش مصنوعی و نرم افزار‌ها و همچنین تراشه‌های پشتیبان از آن رخ داده است. اگرچه در طی این سال‌ها نمی‌توان رشد سنسور‌ها و لنز‌های عکاسی را نادیده گرفت، اما باید هوش مصنوعی را به عنوان مهم‌ترین عاملی که سبب شده است دوربین موجود در گوشی‌های هوشمند پیشرفت کند، معرفی کنیم. این دوربین‌ها امروزه به لطف هوش مصنوعی می‌توانند تشخیص دهند که کاربران در حال ثبت تصویر از چه منظره یا صحنه‌ای هستند.

برنامه Google Photos که برای اولین بار در سال ۲۰۱۵ منتشر شد نخستین بار نشان داد که هوش مصنوعی قادر است در دنیای عکاسی چقدر قدرتمند ظاهر شود. تا پیش از این سال، گوگل برای مدت‌ها به منظور شناسایی تصاویر از یکدیگر از الگوریتم‌های یادگیری زبان ماشین استفاده می‌کرد؛ اما انتشار برنامه Google Photos سبب شد که قابلیت‌های مبتنی بر هوش مصنوعی برای اولین بار در قالب یک رابط کاربری در دسترس افراد قرار بگیرد.

هوش مصنوعی به شناخت بیشتر و بهتر سلائق و تمایلات کاربران کمک می‌کند
این اتفاق تا پیش از سال ۲۰۱۵ برای بسیاری باورکردنی نبود. برنامه Google Photos سبب شد که یک شبه، گالری تصاویر بهم ریخته کاربران، به یک پایگاه داده قابل جستجو تبدیل شود. گوگل در حال حاضر به لطف برنامه Google Photos می‌داند که کاربران در انتخاب لباس‌های خود به چه رنگ‌هایی علاقه بیشتری دارند.

گوگل بکارگیری هوش مصنوعی در حوزه عکاسی را در سال ۲۰۱۳ و پس از تصاحب شرکت DNNresearch آغاز کرد. برنامه تولید شده توسط این شرکت از یک الگوریتم شبکه عصبی عمیق (Deep Neural Network) برای شناسایی تصاویر از یکدیگر استفاده می‌کرد که قادر بود با استفاده از اطلاعاتی که توسط انسان‌ها فراهم می‌شود خود را قوی‌تر کند.

این سری از الگوریتم‌ها که با عنوان Supervised Learning نیز شناسایی می‌شوند، شامل یک سری فرآیند پردازشی هستند که می‌توانند با استفاده از میلیون‌ها تصویر، در طول زمان عملکرد خود را ارتقا ببخشند. این الگوریتم پس از بررسی رنگ و نحوه چینش پیکسل‌ها در کنار یکدیگر، به شناسایی الگو‌های مشابه در دیگر تصاویر می‌پردازد.

به عنوان مثال این الگوریتم قادر است عکس یک پاندا را شناسایی کند؛ چرا که دارای الگو‌هایی است که در گذشته توانسته توسط آن‌ها عکس یک پاندا را به درستی شناسایی کند. این الگوریتم با بررسی تصاویر مربوط به یک پاندا، یاد گرفته است که چگونه پیکسل‌های سفید و سیاه در کنار یکدیگر طرح پوست آن را تشکیل می‌دهند. از سوی دیگر این الگوریتم به گونه‌ای طراحی شده است که بتواند تفاوت یک پاندا و یک گاو را از نظر شباهت ظاهری متوجه شود.

الگوریتم هوش مصنوعی می‌تواند تصاویر مشابه با هم، ولی با ذات متفاوت را شناسایی کند
با رشد و ارتقا این الگوریتم در طول زمان، امکان شناسایی کلی‌تر تصاویر نیز ممکن خواهد بود. به عنوان مثال می‌توان با استفاده از کلماتی نظیر Animal، تمامی تصاویر مربوط به حیوانات را جستجو کرد. اگرچه این تصاویر دارای یک مشخصه واحد و ثابت نیستند و شناسایی آن‌ها توسط یک الگوریتم مصنوعی به سختی امکان پذیر است، اما انسان‌ها می‌توانند به سادگی آن‌ها را از یکدیگر تشخیص دهند.

مطمئنا رشد و ارتقا چنین الگوریتمی کار بسیار سختی است و به زمان زیادی نیز نیاز دارد؛ اما اگر بتوان آن را بر روی دیتاسنتر‌ها پیاده سازی کرد، امکان اجرای آن بر روی گوشی‌های هوشمند که دارای قدرت پردازشی بسیار کمتری هستند، چندان مشکل نخواهد بود. در حال حاضر سخت‌ترین مرحله از این کار توسط گوگل انجام شده است؛ به این معنی که اگر تصاویر بر روی دیتاسنتر آن آپلود شوند، این شرکت می‌تواند با استفاده از این الگوریتم آن‌ها را بررسی و برچسب گذاری کند.

نزدیک به یکسال پس از اینکه برنامه Google Photos منتشر شد، اپل یک قابلیت جستجوی تصویر را به دستگاه‌های خود آورد که آن هم از یک شبکه عصبی برای شناسایی تصاویر استفاده می‌کند؛ اما به دلیل اینکه حریم امن این شرکت اجازه نمی‌دهد که تصاویر به مکان دیگری ارسال شوند، بررسی و شناسایی آن‌ها تنها با استفاده از پردازنده موجود در گوشی‌های هوشمند صورت می‌گیرد. این موضوع سبب می‌شود که این فرآیند یک تا دو روز به طول بی انجامد.

نرم افزار هوشمند برای مدیریت تصاویر ثبت شده، تنها یک وجه از استفاده از هوش مصنوعی در دوربین‌های عکاسی است؛ مطمئناً کاربرد این فناوری در هنگام ثبت تصاویر از اهمیت بسیار بیشتری برخوردار است. لنز‌های موجود در دوربین گوشی‌های هوشمند هر روزه سریع‌تر می‌شوند و سنسور موجود در آن‌ها نیز ابعاد بزرگ تری به خود می‌گیرد؛ اما آنچه این روز‌ها سبب شده است نتوان قدرت سخت افزاری این دوربین‌ها را افزایش داد محدودیت‌های فیزیکی است که اجازه نمی‌دهد ضخامت و ابعاد گوشی‌های هوشمند از حدی فراتر رود.

چرا هوش مصنوعی در عکاسی موبایل تا این حد مهم است؟
بدنه نازک و کم ضخامت گوشی‌های هوشمند قادر نیست که یک سیستم اپتیکی قدرتمند را در خود جای دهد. این موضوع سبب شده است که در حال حاضر نتوان با گوشی‌های هوشمند تصاویری را به ثبت رساند که کیفیت آن‌ها بهتر از تصاویر خروجی بسیاری از دوربین‌های حرفه‌ای باشد. این موضوع حداقل پیش از پردازش تصاویر توسط گوشی‌های هوشمند صادق است.

اما به لطف قطعات سخت افزاری قدرتمند نظیر تراشه ها، که یک واحد پردازشی را در خود جای داده اند، پردازنده سیگنال تصاویر و از آن‌ها مهم‌تر واحد پردازش عصبی (NPU)، با وجود تمامی این محدودیت‌های فیزیکی، فاصله میان تصاویر ثبت شده توسط گوشی‌های هوشمند و تصاویر خروجی دوربین‌های حرفه‌ای روز به روز در حال کاهش است.

به طور کلی فرآیند‌ها و پردازش‌هایی که توسط این اجزای سخت افزاری صورت می‌گیرد تحت عنوان «عکاسی محاسباتی» معرفی می‌شود. واژه گسترده‌ای که از افکت‌های مصنوعی عمق میدان گرفته تا مد‌های پرتره و الگوریتم‌هایی که گوشی‌های پیکسل با استفاده از آن‌ها تصاویر شگفت انگیزی را به ثبت می‌رسانند شامل می‌شود. عکاسی محاسباتی تنها به هوش مصنوعی محدود نمی‌شود، اما هوش مصنوعی بخش اعظمی از آن را تشکیل می‌دهد.

این روز‌ها همه شرکت‌ها از هوش مصنوعی برای پشتیبانی از دوربین‌های دوگانه موجود در دستگاه‌های خود استفاده می‌کنند و توانسته‌اند به وسیله این فناوری، مد پرتره را به نرم‌افزار گوشی‌های خود اضافه کنند. پردازنده سیگنال عکس از راه کار‌های مبتنی بر یادگیری زبان ماشین استفاده می‌کند تا با استفاده از یک سنسور، افراد حاضر در عکس را شناسایی کند. به صورت همزمان سنسور دوم یک نقشه عمقی را فراهم می‌آورد تا ترکیب این دو تصویر، شامل نگاره‌ای از فرد موردنظر و یک پس زمینه مات باشد.

سنسور عمق میدان می‌تواند علی‌رغم عملکرد ساده خود، دقت و کیفیت خروجی عکس را دوچندان کند
در این زمان ایده اینکه با استفاده از یادگیری زبان ماشین، تصویر افراد از پس زمینه تمیز داده شود چیز جدیدی نبود. تا پیش از سال ۲۰۱۶ که مد‌های پرتره معرفی شوند، این قابلیت توسط نرم افزار‌های مدیریت عکس برای شناسایی و برچسب گذاری تصاویر به کار گرفته می‌شد. با این وجود، طراحی این قابلیت برای اینکه بتواند در دوربین گوشی‌های هوشمند به کار گرفته شود و با سرعت بالا و در مدت زمان کم عمل کند، چالش بزرگی به شمار می‌رفت.

به نظر می‌رسد گوگل قرار است در حوزه عکاسی محاسباتی برای سال‌های آینده نیز به عنوان پیشرو معرفی شود. عملکرد عالی سه نسل مختلف از گوشی‌های پیکسل، می‌تواند یک گواه بر این ادعا باشد. HDR+ که مد پیش فرض عکاسی در این گوشی‌های هوشمند است از الگوریتم‌های پیچیده و پیشرفته‌ای استفاده می‌کند تا تصاویر ثبت شده در زمان‌های نوردهی مختلف را با یکدیگر ترکیب کند.

بنا به گفته Marc Levoy، مدیر بخش عکاسی محاسباتی گوگل، یادگیری زبان ماشین که در نرم افزار عکاسی این شرکت به کار گرفته شده است به آن کمک می‌کند که با گذشت زمان عملکرد بهتری داشته باشد. گوگل اعلام کرده است که الگوریتم‌های هوش مصنوعی موجود در نرم افزار‌های گوناگون خود از جمله Google Photos را توسط انبوهی از تصاویر برچسب گذاری شده تمرین داده و این موضوع سبب شده است که گوشی‌های او در ثبت تصاویر قدرت بالایی داشته باشند.

اگرچه چند سالی از معرفی و عرضه گوشی پیکسل ۲ می‌گذرد، اما هنوز هم بسیاری از عکاسان حرفه‌ای به دلیل کیفیت بالای عکس‌های خروجی، از این گوشی برای ثبت تصاویر خود استفاده می‌کنند.‌ای عملکرد عالی بعد‌ها در سری گوگل پیکسل ۳ به اوج خود رسید و امروز شاهد بهترین عملکرد هوش مصنوعی در نرم‌افزار عکاسی این گوشی هستیم.

جهش سخت‌افزاری با ارائه پردازنده عصبی و سنسور‌های ۴۸، ۶۴ و ۱۰۸ مگاپیکسلی
Night Sight که چندی پیش به گوشی‌های این شرکت اضافه شد هم اکنون به عنوان یکی از مهم‌ترین قابلیت‌های برنامه عکاسی آن‌ها شناخته می‌شود. گوشی‌های پیکسل می‌توانند به لطف این قابلیت در زمان‌های نوردهی مختلف، تصاویر گوناگونی را به ثبت برسانند. در گام بعدی الگوریتم‌های زبان ماشین به کمک آن‌ها خواهد آمد تا بتوانند شدت نور در محیط و همچنین میزان رنگ‌ها را محاسبه و بر روی تصاویر پیاده سازی کنند. استفاده از این قابلیت برای ثبت تصویر از موقعیت‌های تاریک نتایج خیره‌ای کننده‌ای را به دنبال داشته است.

قابلیت Night Sight بهترین نتایج خود را در گوشی‌های پیکسل ۳ به نمایش می‌گذارد؛ چرا که گوگل الگوریتم‌های آن را برای اجرا بر روی نسل جدیدی از تراشه‌ها پی ریزی کرده است. با وجود این، کاربران دیگر اسمارت فون‌های این شرکت، حتی نسل اول از گوشی‌های پیکسل، نیز در حال حاضر امکان دسترسی به آن را دارند. نخستین رده از گوشی‌های پیکسل فاقد سیستم لرزش گیر اپتیکی هستند، اما بازهم استفاده از قابلیت Night Sight در آن‌ها نتایج مناسبی را فراهم می‌کند. این موضوع به خوبی نشان می‌دهد که امروزه در حوزه عکاسی با گوشی‌های هوشمند، نرم افزار اهمیت بیشتری از سخت افزار پیدا کرده است.

با وجود این هنوز هم می‌توان با ارتقا قطعات سخت افزاری، کیفیت تصاویر خروجی توسط این دوربین‌ها را افزایش داد. بخشی از تولید کنندگان این دستگاه‌ها در نظر دارند در آینده نزدیک محصولات خود را به دوربین‌های قدرتمند ۶۴ مگاپیکسلی مجهز کنند. علاوه بر این، چندی پیش بود که سامسونگ سنسور‌های عکاسی ۱۰۸ مگاپیکسلی را معرفی کرد که به گفته این شرکت قرار است در گوشی‌های هوشمند به کار گرفته شده و عملکرد سخت‌افزار را یک سطح بالاتر ببرد.

دو گوشی Nova ۴ و Honor View ۲۰، به عنوان اولین محصولاتی شناخته می‌شوند که از سنسور قدرتمند Sony IMX۵۸۶ بهره می‌برند. این سنسور از بسیاری از نمونه‌های مشابه خود بزرگ‌تر است و قادر است وضوح ۴۸ مگاپیکسلی را به گوشی‌های هوشمند بیاورد. این وضوح عالی، سنسور IMX۵۸۶ را وادار کرده است که انبوهی از پیکسل‌ها را در فضایی کوچک جای دهد.

این موضوع می‌تواند حداقل بر روی کاغذ به منزله کاهش کیفیت تصاویر خروجی تلقی شود؛ اما گوشی View ۲۰، دارای یک مد کاری با عنوان AI Ultra Clarity است که با استفاده از هوش مصنوعی به این سنسور اجازه می‌دهد حداکثر وضوح ممکن را فراهم و جزییات متعددی را به تصاویر اضافه کند. استفاده از این مد سبب می‌شود که در پایان تصاویر چشم نوازی در دسترس قرار بگیرد که امکان بزرگ نمایی آن‌ها در چند مرحله وجود دارد.

اگرچه نحوه عملکرد دوربین گوشی‌های هوشمند وابستگی شدیدی به پردازنده سیگنال عکس آن‌ها دارد، اما باید گفت در طی یکی دو سال اخیر نقش واحد‌های پردازش عصبی (NPU) در حوزه عکاسی محاسباتی بسیار پررنگ‌تر از قبل شده است. هواوی اولین شرکتی بود که تراشه‌ای مجهز به یک جز سخت افزاری مربوط به هوش مصنوعی عرضه کرد، اما این تراشه A۱۱ Bionic اپل بود که ضمن بهره مندی از این پردازنده، حتی سریع‌تر از تراشه Kirin ۹۷۰ به دست کاربران رسید.

کوالکام بزرگ‌ترین تولید کننده تراشه‌های سازگار با سیستم عامل اندروید، هنوز بر روی تولید یک جز سخت افزاری ویژه برای پردازش فرآیند‌های مبتنی بر هوش مصنوعی متمرکز نشده؛ اما گوگل در این بخش یک تراشه اختصاصی با عنوان Pixel Visual Core را تولید کرده است که به صورت اختصاصی به پردازش فرآیند‌های مبتنی بر هوش مصنوعی در هنگام عکاسی می‌پردازد.

جدیدترین SoC اپل یعنی A۱۲ Bionic نیز دارای یک پردازنده عصبی هشت هسته‌ای است که می‌تواند در فریم ورک یادگیری زبان ماشین اپل، با عنوان Core ML، تا ۹ برابر سریع‌تر از تراشه A۱۱ عمل کند. این پردازنده همچنین برای اولین بار در تراشه A۱۲ Bionic به صورت مستقیم به پردازنده سیگنال عکس متصل شده است. اپل اعلام کرده است این موضوع سبب می‌شود که سنسور‌های دوربین بتوانند صفحه کانونی را بهتر درک کنند و در نتیجه عمق میدان واقعی تری را فراهم آورند.

مطمئناً برای اینکه دستگاه‌های هوشمند نظیر اسمارت فون‌ها بتوانند از پس پردازش‌های مبتنی بر هوش مصنوعی برآیند به NPU‌ها نیاز خواهند داشت. باید توجه داشت که الگوریتم‌های پیچیده‌ای که از برنامه‌هایی نظیر Google Photos پشتیبانی می‌کنند پیش از آنکه راهی گوشی‌ها یا دیگر دستگاه‌های هوشمند شوند توسط کامپیوتر‌های قدرتمند و مجهز به هسته‌های گرافیکی پرقدرت تمرین داده شده اند. به این ترتیب بخش اعظمی از پرداز ش‌ها دیگر به اجرای دوباره بر روی دستگاه‌های هوشمند نیازی ندارند؛ با وجود این، هنوز هم برای اینکه بتوان پردازش‌های باقی مانده را به صورت در لحظه توسط این دستگاه‌ها انجام داد کار دشواری پیش رو است.

اگرچه تراشه‌ها روز به روز در حال سریع‌تر شدن هستند، اما گوگل چندی پیش اعلام کرد مشغول کار بر روی راهکار‌های جدیدی است که در هنگام پردازش فرآیند‌های مبتنی بر هوش مصنوعی، وظایف کمتری را به دستگاه‌های هوشمند محول می‌کند. با وجود اینکه عکاسی محاسباتی این روز‌ها در مراحل اولیه خود قرار دارد، اما دوربین‌هایی که با استفاده از یادگیری زبان ماشین یا هوش مصنوعی طراحی شده اند نسبت به محصولات دیگر، دارای انبوهی از مزایا و امکانات مضاعف هستند.

در طی سال‌های اخیر، هوش مصنوعی بار‌ها و بار‌ها در حقه‌های تبلیغاتی متعدد به کار گرفته شده است؛ اما عکاسی یکی از معدود حوزه‌هایی است که شاهد تبدیل شدن آن از حالت بالقوه به حالت بالفعل هستیم. بدون شک دوربین یکی از مهم‌ترین و حیاتی‌ترین قابلیت‌های یک گوشی هوشمند است و در حال حاضر هوش مصنوعی بهترین ابزار برای ارتقا آن به شمار می‌رود.

منبع: شهر سخت افزار

انتهای پیام/