در این گزارش مهمترین ابزارهای هوش مصنوعی معرفی شده است که میتوان از آنها برای ایجاد تصاویر یا آثار هنری استفاده کرد:
ابزار DALL-E ۲
DALL-E اصلی توسط OpenAll ساخته شد و در ژانویه ۲۰۲۱ قبل از اینکه شرکت DALL-E ۲ ارتقا یافته را در سال جاری منتشر کرد، منتشر شد. آخرین نسخه تصاویری با وضوح ۴ برابر بالاتر تولید میکند و همچنین وضوح بسیار بالاتری را دارد. در حالی که این ابزار در ابتدا تنها به ۲۰۰ آزمایش کننده بتا محدود بود، در ماه سپتامبر در دسترس همه قرار گرفت.
DALL-E ۲ بر روی نسخه اصلاح شده GPT-۳ (Generative Transformer Pre-Trained ۳) ساخته شده است. از GPT-۳ اصلی برای متن استفاده شد، اما نسخه اصلاح شده استفاده شده توسط DALL-E برای تولید تصاویر از طریق تکنیکی به نام مدلسازی انتشار استفاده میشود.
ابزار میانه سفر
این ابزار در حال حاضر تحت آزمایش است و هدف آن گسترش قدرت تخیل گونه انسان است. این خالق عکس در حال حاضر خاص است. اما از طریق ربات Discord قابل دسترسی است. شما باید یک حساب Discord داشته باشید، پس از آن باید به سرور Discord در Midjourney بپیوندید. بر خلاف DALL-E ۲ که به نظر میرسد بر اساس ورودی شما بر روی واقعیات نوری تمرکز میکند، خروجی در اینجا بیشتر از نوع هنری به نظر میرسد. شما میتوانید ۲۵ تصویر اول خود را به صورت رایگان ایجاد کنید، اما میتوانید با یک اشتراک اولیه عضویت، محدودیت را تا ۲۰۰ افزایش دهید.
ابزار StarryAI
StarryAI به لطف رابط کاربر پسند خود به عنوان یکی از کاربرپسندترین مدلهای تصویر هوش مصنوعی ظاهر شده است. این ابزار یک رویکرد کمی متفاوت دارد، زیرا به شما امکان میدهد نوع خروجی مورد نظر خود را بر اساس تنظیمات از پیش تعیین شده انتخاب کنید.
StarryAI همچنین به شما این امکان را میدهد که اگر چیزی خاص در ذهن دارید، یک تصویر سفارشی را برای پایه گذاری هنر خود آپلود کنید. یکی دیگر از ویژگیهای منحصربهفرد این مدل هوش مصنوعی این است که دارای برنامههای اختصاصی برای اندروید و iOS است، بنابراین میتوانید در حال حرکت، هنر ایجاد کرده و به اشتراک بگذارید. به خاطر داشته باشید که شما فقط دو بار در روز میتوانید تصاویر ایجاد کنید و اگر میخواهید بیشتر تولید کنید، باید اعتبار بیشتری خریداری کنید.
ابزار مداد رنگی
Craiyon که قبلاً DALL-E Mini نامیده میشد، نسخه منبع باز نرم افزار بزرگتر و قدرتمندتر DALL-E است. Craiyon برای اولین بار در آوریل ۲۰۲۲ راه اندازی شد، زاییده فکر بوریس دایما، مهندس یادگیری ماشین مستقر در هیوستون است. این ابزار به دلیل توانایی در تولید تصاویر کارتونی قابل تماشا بسیار محبوب شده است.
ابزار انتشار پایدار
Stable Diffusion شکل دیگری از تبدیل متن به تصویر است. این ابزار از EleutherAI و LAION پشتیبانی میکند. در حالی که متوجه مقداری اعوجاج خواهید شد، مانند هر ژنراتور موجود در این لیست، خروجی Stable Diffusion واقع بینانهتر از بسیاری از ژنراتورها است. قسمت جلویی سازنده تصویر DreamStudio است که به راحتی قابل استفاده است.
ابزار Imagen
گوگل در حال کار بر روی مدل خود به نام Imagen است. در حالی که خروجی آن مشابه DALL-E ۲ و Stable Diffusion است، هنوز در دسترس عموم قرار نگرفته است. این احتمالاً به این زودیها تغییر نخواهد کرد. این شرکت همچنین نسخه ویدئویی از مدل هوش مصنوعی را بر اساس نسخه تصویری توسعه داده است که با ارتقاء مقیاس و پیش بینی فریمهای اضافی کار میکند.