به گزارش گروه وبگردی باشگاه خبرنگاران جوان، این روزها اگر قصد دارید از قدرت دوربین موجود در گوشیهای هوشمند آگاهی پیدا کنید باید به قابلیتها و ویژگیهای آن در بخش هوش مصنوعی توجه داشته باشید. فارغ از تمامی بزرگ نماییها و حقههای تبلیغاتی، این فناوری سبب شده است که در طی سالهای اخیر، رشد قابل توجهی در حوزه عکاسی توسط گوشیهای هوشمند رخ دهد و در حال حاضر دلیلی وجود ندارد که سرعت این رشد را در سالهای آینده، کُند پیش بینی کنیم.
گوگل، باعث و بانی ورود هوش مصنوعی به حوزه تصاویر در دنیای موبایل
بدون شک بخش اعظمی از پیشرفتهای صورت گرفته در بخش دوربین گوشیهای هوشمند به دلیل رشد و ارتقا فناوری هوش مصنوعی و نرم افزارها و همچنین تراشههای پشتیبان از آن رخ داده است. اگرچه در طی این سالها نمیتوان رشد سنسورها و لنزهای عکاسی را نادیده گرفت، اما باید هوش مصنوعی را به عنوان مهمترین عاملی که سبب شده است دوربین موجود در گوشیهای هوشمند پیشرفت کند، معرفی کنیم. این دوربینها امروزه به لطف هوش مصنوعی میتوانند تشخیص دهند که کاربران در حال ثبت تصویر از چه منظره یا صحنهای هستند.
برنامه Google Photos که برای اولین بار در سال ۲۰۱۵ منتشر شد نخستین بار نشان داد که هوش مصنوعی قادر است در دنیای عکاسی چقدر قدرتمند ظاهر شود. تا پیش از این سال، گوگل برای مدتها به منظور شناسایی تصاویر از یکدیگر از الگوریتمهای یادگیری زبان ماشین استفاده میکرد؛ اما انتشار برنامه Google Photos سبب شد که قابلیتهای مبتنی بر هوش مصنوعی برای اولین بار در قالب یک رابط کاربری در دسترس افراد قرار بگیرد.
هوش مصنوعی به شناخت بیشتر و بهتر سلائق و تمایلات کاربران کمک میکند
این اتفاق تا پیش از سال ۲۰۱۵ برای بسیاری باورکردنی نبود. برنامه Google Photos سبب شد که یک شبه، گالری تصاویر بهم ریخته کاربران، به یک پایگاه داده قابل جستجو تبدیل شود. گوگل در حال حاضر به لطف برنامه Google Photos میداند که کاربران در انتخاب لباسهای خود به چه رنگهایی علاقه بیشتری دارند.
گوگل بکارگیری هوش مصنوعی در حوزه عکاسی را در سال ۲۰۱۳ و پس از تصاحب شرکت DNNresearch آغاز کرد. برنامه تولید شده توسط این شرکت از یک الگوریتم شبکه عصبی عمیق (Deep Neural Network) برای شناسایی تصاویر از یکدیگر استفاده میکرد که قادر بود با استفاده از اطلاعاتی که توسط انسانها فراهم میشود خود را قویتر کند.
این سری از الگوریتمها که با عنوان Supervised Learning نیز شناسایی میشوند، شامل یک سری فرآیند پردازشی هستند که میتوانند با استفاده از میلیونها تصویر، در طول زمان عملکرد خود را ارتقا ببخشند. این الگوریتم پس از بررسی رنگ و نحوه چینش پیکسلها در کنار یکدیگر، به شناسایی الگوهای مشابه در دیگر تصاویر میپردازد.
به عنوان مثال این الگوریتم قادر است عکس یک پاندا را شناسایی کند؛ چرا که دارای الگوهایی است که در گذشته توانسته توسط آنها عکس یک پاندا را به درستی شناسایی کند. این الگوریتم با بررسی تصاویر مربوط به یک پاندا، یاد گرفته است که چگونه پیکسلهای سفید و سیاه در کنار یکدیگر طرح پوست آن را تشکیل میدهند. از سوی دیگر این الگوریتم به گونهای طراحی شده است که بتواند تفاوت یک پاندا و یک گاو را از نظر شباهت ظاهری متوجه شود.
الگوریتم هوش مصنوعی میتواند تصاویر مشابه با هم، ولی با ذات متفاوت را شناسایی کند
با رشد و ارتقا این الگوریتم در طول زمان، امکان شناسایی کلیتر تصاویر نیز ممکن خواهد بود. به عنوان مثال میتوان با استفاده از کلماتی نظیر Animal، تمامی تصاویر مربوط به حیوانات را جستجو کرد. اگرچه این تصاویر دارای یک مشخصه واحد و ثابت نیستند و شناسایی آنها توسط یک الگوریتم مصنوعی به سختی امکان پذیر است، اما انسانها میتوانند به سادگی آنها را از یکدیگر تشخیص دهند.
مطمئنا رشد و ارتقا چنین الگوریتمی کار بسیار سختی است و به زمان زیادی نیز نیاز دارد؛ اما اگر بتوان آن را بر روی دیتاسنترها پیاده سازی کرد، امکان اجرای آن بر روی گوشیهای هوشمند که دارای قدرت پردازشی بسیار کمتری هستند، چندان مشکل نخواهد بود. در حال حاضر سختترین مرحله از این کار توسط گوگل انجام شده است؛ به این معنی که اگر تصاویر بر روی دیتاسنتر آن آپلود شوند، این شرکت میتواند با استفاده از این الگوریتم آنها را بررسی و برچسب گذاری کند.
نزدیک به یکسال پس از اینکه برنامه Google Photos منتشر شد، اپل یک قابلیت جستجوی تصویر را به دستگاههای خود آورد که آن هم از یک شبکه عصبی برای شناسایی تصاویر استفاده میکند؛ اما به دلیل اینکه حریم امن این شرکت اجازه نمیدهد که تصاویر به مکان دیگری ارسال شوند، بررسی و شناسایی آنها تنها با استفاده از پردازنده موجود در گوشیهای هوشمند صورت میگیرد. این موضوع سبب میشود که این فرآیند یک تا دو روز به طول بی انجامد.
نرم افزار هوشمند برای مدیریت تصاویر ثبت شده، تنها یک وجه از استفاده از هوش مصنوعی در دوربینهای عکاسی است؛ مطمئناً کاربرد این فناوری در هنگام ثبت تصاویر از اهمیت بسیار بیشتری برخوردار است. لنزهای موجود در دوربین گوشیهای هوشمند هر روزه سریعتر میشوند و سنسور موجود در آنها نیز ابعاد بزرگ تری به خود میگیرد؛ اما آنچه این روزها سبب شده است نتوان قدرت سخت افزاری این دوربینها را افزایش داد محدودیتهای فیزیکی است که اجازه نمیدهد ضخامت و ابعاد گوشیهای هوشمند از حدی فراتر رود.
چرا هوش مصنوعی در عکاسی موبایل تا این حد مهم است؟
بدنه نازک و کم ضخامت گوشیهای هوشمند قادر نیست که یک سیستم اپتیکی قدرتمند را در خود جای دهد. این موضوع سبب شده است که در حال حاضر نتوان با گوشیهای هوشمند تصاویری را به ثبت رساند که کیفیت آنها بهتر از تصاویر خروجی بسیاری از دوربینهای حرفهای باشد. این موضوع حداقل پیش از پردازش تصاویر توسط گوشیهای هوشمند صادق است.
اما به لطف قطعات سخت افزاری قدرتمند نظیر تراشه ها، که یک واحد پردازشی را در خود جای داده اند، پردازنده سیگنال تصاویر و از آنها مهمتر واحد پردازش عصبی (NPU)، با وجود تمامی این محدودیتهای فیزیکی، فاصله میان تصاویر ثبت شده توسط گوشیهای هوشمند و تصاویر خروجی دوربینهای حرفهای روز به روز در حال کاهش است.
به طور کلی فرآیندها و پردازشهایی که توسط این اجزای سخت افزاری صورت میگیرد تحت عنوان «عکاسی محاسباتی» معرفی میشود. واژه گستردهای که از افکتهای مصنوعی عمق میدان گرفته تا مدهای پرتره و الگوریتمهایی که گوشیهای پیکسل با استفاده از آنها تصاویر شگفت انگیزی را به ثبت میرسانند شامل میشود. عکاسی محاسباتی تنها به هوش مصنوعی محدود نمیشود، اما هوش مصنوعی بخش اعظمی از آن را تشکیل میدهد.
این روزها همه شرکتها از هوش مصنوعی برای پشتیبانی از دوربینهای دوگانه موجود در دستگاههای خود استفاده میکنند و توانستهاند به وسیله این فناوری، مد پرتره را به نرمافزار گوشیهای خود اضافه کنند. پردازنده سیگنال عکس از راه کارهای مبتنی بر یادگیری زبان ماشین استفاده میکند تا با استفاده از یک سنسور، افراد حاضر در عکس را شناسایی کند. به صورت همزمان سنسور دوم یک نقشه عمقی را فراهم میآورد تا ترکیب این دو تصویر، شامل نگارهای از فرد موردنظر و یک پس زمینه مات باشد.
سنسور عمق میدان میتواند علیرغم عملکرد ساده خود، دقت و کیفیت خروجی عکس را دوچندان کند
در این زمان ایده اینکه با استفاده از یادگیری زبان ماشین، تصویر افراد از پس زمینه تمیز داده شود چیز جدیدی نبود. تا پیش از سال ۲۰۱۶ که مدهای پرتره معرفی شوند، این قابلیت توسط نرم افزارهای مدیریت عکس برای شناسایی و برچسب گذاری تصاویر به کار گرفته میشد. با این وجود، طراحی این قابلیت برای اینکه بتواند در دوربین گوشیهای هوشمند به کار گرفته شود و با سرعت بالا و در مدت زمان کم عمل کند، چالش بزرگی به شمار میرفت.
به نظر میرسد گوگل قرار است در حوزه عکاسی محاسباتی برای سالهای آینده نیز به عنوان پیشرو معرفی شود. عملکرد عالی سه نسل مختلف از گوشیهای پیکسل، میتواند یک گواه بر این ادعا باشد. HDR+ که مد پیش فرض عکاسی در این گوشیهای هوشمند است از الگوریتمهای پیچیده و پیشرفتهای استفاده میکند تا تصاویر ثبت شده در زمانهای نوردهی مختلف را با یکدیگر ترکیب کند.
بنا به گفته Marc Levoy، مدیر بخش عکاسی محاسباتی گوگل، یادگیری زبان ماشین که در نرم افزار عکاسی این شرکت به کار گرفته شده است به آن کمک میکند که با گذشت زمان عملکرد بهتری داشته باشد. گوگل اعلام کرده است که الگوریتمهای هوش مصنوعی موجود در نرم افزارهای گوناگون خود از جمله Google Photos را توسط انبوهی از تصاویر برچسب گذاری شده تمرین داده و این موضوع سبب شده است که گوشیهای او در ثبت تصاویر قدرت بالایی داشته باشند.
اگرچه چند سالی از معرفی و عرضه گوشی پیکسل ۲ میگذرد، اما هنوز هم بسیاری از عکاسان حرفهای به دلیل کیفیت بالای عکسهای خروجی، از این گوشی برای ثبت تصاویر خود استفاده میکنند.ای عملکرد عالی بعدها در سری گوگل پیکسل ۳ به اوج خود رسید و امروز شاهد بهترین عملکرد هوش مصنوعی در نرمافزار عکاسی این گوشی هستیم.
جهش سختافزاری با ارائه پردازنده عصبی و سنسورهای ۴۸، ۶۴ و ۱۰۸ مگاپیکسلی
Night Sight که چندی پیش به گوشیهای این شرکت اضافه شد هم اکنون به عنوان یکی از مهمترین قابلیتهای برنامه عکاسی آنها شناخته میشود. گوشیهای پیکسل میتوانند به لطف این قابلیت در زمانهای نوردهی مختلف، تصاویر گوناگونی را به ثبت برسانند. در گام بعدی الگوریتمهای زبان ماشین به کمک آنها خواهد آمد تا بتوانند شدت نور در محیط و همچنین میزان رنگها را محاسبه و بر روی تصاویر پیاده سازی کنند. استفاده از این قابلیت برای ثبت تصویر از موقعیتهای تاریک نتایج خیرهای کنندهای را به دنبال داشته است.
قابلیت Night Sight بهترین نتایج خود را در گوشیهای پیکسل ۳ به نمایش میگذارد؛ چرا که گوگل الگوریتمهای آن را برای اجرا بر روی نسل جدیدی از تراشهها پی ریزی کرده است. با وجود این، کاربران دیگر اسمارت فونهای این شرکت، حتی نسل اول از گوشیهای پیکسل، نیز در حال حاضر امکان دسترسی به آن را دارند. نخستین رده از گوشیهای پیکسل فاقد سیستم لرزش گیر اپتیکی هستند، اما بازهم استفاده از قابلیت Night Sight در آنها نتایج مناسبی را فراهم میکند. این موضوع به خوبی نشان میدهد که امروزه در حوزه عکاسی با گوشیهای هوشمند، نرم افزار اهمیت بیشتری از سخت افزار پیدا کرده است.
با وجود این هنوز هم میتوان با ارتقا قطعات سخت افزاری، کیفیت تصاویر خروجی توسط این دوربینها را افزایش داد. بخشی از تولید کنندگان این دستگاهها در نظر دارند در آینده نزدیک محصولات خود را به دوربینهای قدرتمند ۶۴ مگاپیکسلی مجهز کنند. علاوه بر این، چندی پیش بود که سامسونگ سنسورهای عکاسی ۱۰۸ مگاپیکسلی را معرفی کرد که به گفته این شرکت قرار است در گوشیهای هوشمند به کار گرفته شده و عملکرد سختافزار را یک سطح بالاتر ببرد.
دو گوشی Nova ۴ و Honor View ۲۰، به عنوان اولین محصولاتی شناخته میشوند که از سنسور قدرتمند Sony IMX۵۸۶ بهره میبرند. این سنسور از بسیاری از نمونههای مشابه خود بزرگتر است و قادر است وضوح ۴۸ مگاپیکسلی را به گوشیهای هوشمند بیاورد. این وضوح عالی، سنسور IMX۵۸۶ را وادار کرده است که انبوهی از پیکسلها را در فضایی کوچک جای دهد.
این موضوع میتواند حداقل بر روی کاغذ به منزله کاهش کیفیت تصاویر خروجی تلقی شود؛ اما گوشی View ۲۰، دارای یک مد کاری با عنوان AI Ultra Clarity است که با استفاده از هوش مصنوعی به این سنسور اجازه میدهد حداکثر وضوح ممکن را فراهم و جزییات متعددی را به تصاویر اضافه کند. استفاده از این مد سبب میشود که در پایان تصاویر چشم نوازی در دسترس قرار بگیرد که امکان بزرگ نمایی آنها در چند مرحله وجود دارد.
اگرچه نحوه عملکرد دوربین گوشیهای هوشمند وابستگی شدیدی به پردازنده سیگنال عکس آنها دارد، اما باید گفت در طی یکی دو سال اخیر نقش واحدهای پردازش عصبی (NPU) در حوزه عکاسی محاسباتی بسیار پررنگتر از قبل شده است. هواوی اولین شرکتی بود که تراشهای مجهز به یک جز سخت افزاری مربوط به هوش مصنوعی عرضه کرد، اما این تراشه A۱۱ Bionic اپل بود که ضمن بهره مندی از این پردازنده، حتی سریعتر از تراشه Kirin ۹۷۰ به دست کاربران رسید.
کوالکام بزرگترین تولید کننده تراشههای سازگار با سیستم عامل اندروید، هنوز بر روی تولید یک جز سخت افزاری ویژه برای پردازش فرآیندهای مبتنی بر هوش مصنوعی متمرکز نشده؛ اما گوگل در این بخش یک تراشه اختصاصی با عنوان Pixel Visual Core را تولید کرده است که به صورت اختصاصی به پردازش فرآیندهای مبتنی بر هوش مصنوعی در هنگام عکاسی میپردازد.
جدیدترین SoC اپل یعنی A۱۲ Bionic نیز دارای یک پردازنده عصبی هشت هستهای است که میتواند در فریم ورک یادگیری زبان ماشین اپل، با عنوان Core ML، تا ۹ برابر سریعتر از تراشه A۱۱ عمل کند. این پردازنده همچنین برای اولین بار در تراشه A۱۲ Bionic به صورت مستقیم به پردازنده سیگنال عکس متصل شده است. اپل اعلام کرده است این موضوع سبب میشود که سنسورهای دوربین بتوانند صفحه کانونی را بهتر درک کنند و در نتیجه عمق میدان واقعی تری را فراهم آورند.
مطمئناً برای اینکه دستگاههای هوشمند نظیر اسمارت فونها بتوانند از پس پردازشهای مبتنی بر هوش مصنوعی برآیند به NPUها نیاز خواهند داشت. باید توجه داشت که الگوریتمهای پیچیدهای که از برنامههایی نظیر Google Photos پشتیبانی میکنند پیش از آنکه راهی گوشیها یا دیگر دستگاههای هوشمند شوند توسط کامپیوترهای قدرتمند و مجهز به هستههای گرافیکی پرقدرت تمرین داده شده اند. به این ترتیب بخش اعظمی از پرداز شها دیگر به اجرای دوباره بر روی دستگاههای هوشمند نیازی ندارند؛ با وجود این، هنوز هم برای اینکه بتوان پردازشهای باقی مانده را به صورت در لحظه توسط این دستگاهها انجام داد کار دشواری پیش رو است.
اگرچه تراشهها روز به روز در حال سریعتر شدن هستند، اما گوگل چندی پیش اعلام کرد مشغول کار بر روی راهکارهای جدیدی است که در هنگام پردازش فرآیندهای مبتنی بر هوش مصنوعی، وظایف کمتری را به دستگاههای هوشمند محول میکند. با وجود اینکه عکاسی محاسباتی این روزها در مراحل اولیه خود قرار دارد، اما دوربینهایی که با استفاده از یادگیری زبان ماشین یا هوش مصنوعی طراحی شده اند نسبت به محصولات دیگر، دارای انبوهی از مزایا و امکانات مضاعف هستند.
در طی سالهای اخیر، هوش مصنوعی بارها و بارها در حقههای تبلیغاتی متعدد به کار گرفته شده است؛ اما عکاسی یکی از معدود حوزههایی است که شاهد تبدیل شدن آن از حالت بالقوه به حالت بالفعل هستیم. بدون شک دوربین یکی از مهمترین و حیاتیترین قابلیتهای یک گوشی هوشمند است و در حال حاضر هوش مصنوعی بهترین ابزار برای ارتقا آن به شمار میرود.
منبع: شهر سخت افزار
انتهای پیام/