دال-ای 2 چیست؟ تبدیل متن به تصویر با یک کلیک! + تصاویر نمونههای جالب
دال-ای 2 (DALL·E 2) نام برنامه ساخته شده در شرکت تحقیقاتی OpenAI است. این برنامه میتواند دستورالعملهای متنی ساده را به تصاویری باکیفیت تبدیل کند! به نظرتان فوق العاده نیست؟
این برنامه از هوش مصنوعی (AI) برای تهیه تصاویر یا آثار هنری واقع گرایانه از روی توضیحات متنی نوشته شده به زبان طبیعی، استفاده میکند. این پروژه میلیارد دلاری، بر اساس پردازش 12 میلیارد پارامتر، روی صدها میلیون تصویر انجام میگیرد.
میتوان از توصیفهای کاملاً پیچیده شامل اعمال، سبکهای هنری و موضوعات متعدد استفاده کرد. برخی از نمونههای موجود در بلاگ OpenAI عبارتند از: «فضانوردی که در استراحتگاه گرمسیری فضایی به سبک ویپوروِیو در حال استراحت است» و «خرسهای عروسکی که زیر آب»، روی تحقیقات جدید هوش مصنوعی با فناوری دهه 1990 کار میکنند».
برنامه دال-ای 2 به هر چیزی یک داستان میدهد
دال-ای 2 تصویر فوق را در پاسخ به این متن ساخته است:«خرسهای عروسکی مثل دانشمندانی دیوانه در حال مخلوط کردن مواد شیمیایی درخشان به سبک استیم پانک هستند».
برنامه دال-ای 2 بر اساس ابزار قبلی OpenAI، یعنی DALL-E، ساخته شد که در ژانویه 2021 عرضه شده بود. نسخه جدید به لطف تصاویری با وضوح بالاتر، درک متن بیشتر، پردازش سریع تر و برخی قابلیتهای جدید، نتایج شگفت انگیزتری را به همراه دارد.
دال ای به نام ربات پیکسار یعنی WALL-E و سالوادور دالی نامگذاری شد. این برنامه یک نوع شبکه عصبی است. این سیستم محاسباتی، به طور آزادانه روی نورونهای درون یک مغز بیولوژیکی، مدلسازی شده است.
شبکه عصبی در مورد تصاویر و توضیحات متنی آنها آموزش دیده تا رابطه بین اشیا را درک کند.
تصویر فوق مربوط به «کاسه سوپ شبیه به هیولای بافته شده از پشم» است.
به نقل از شرکتOpenAI: «یادگیری عمیق، اشیایی مانند خرسهای کوالا و موتورسیکلتها را درک میکند و روابط بین اشیا را هم میشناسد.»
«وقتی تصویری از یک خرس کوالا در حال موتورسواری را از DALL-E میخواهید، میداند که چگونه آن تصویر یا هر چیز دیگری را در ارتباط با شی یا عمل دیگری خلق کند.»
قابلیتهای هوش مصنوعی در شرکت OpenAI
دال-ای 2 چندین تصویر جایگزین برای هر پیام متنی دارد. قابلیت اضافه شده به برنامه جدید شامل استفاده از همان توضیحات زبان طبیعی برای ویرایش و روتوش عکسهای موجود است.
این ویژگی که OpenAI آن را «in-painting» مینامد، مانند نسخه پیچیدهتری از «content-aware fill» فتوشاپ عمل میکند و به طور واقعی با در نظر گرفتن سایهها، بازتابها و بافتها، اجزایی را از قسمت انتخابی در تصویر، حذف کرده یا به آن اضافه میکند.
در تصویر فوق «عکسی از یک فروشگاه گل فروشی جذاب با نمای سبز پاستلی و سفید خالص» خواسته شد.
به عنوان مثال، نمونههای موجود در بلاگ OpenAI، کاناپههای اضافه شده به نقاط مختلف عکسی از یک اتاق خالی را نشان میدهد.
به گفته OpenAI پروژه DALL-E نه تنها به افراد اجازه میدهد تا افکارشان را به صورت بصری، ابراز کنند، بلکه به محققان کمک میکند تا بفهمند سیستمهای پیشرفته هوش مصنوعی چگونه دنیای ما را میبینند و درک میکنند.
شرکت OpenAI معتقد است: «این پروژه بخش مهمی از توسعه هوش مصنوعی مفید و ایمن است».
این شرکت در ابتدا به عنوان یک سازمان غیرانتفاعی توسط چهرههای برجسته فناوری از جمله ایلان ماسک تأسیس شد. همچنین این پروژه به توسعه هوش مصنوعی در جهت ایجاد اثرات مثبت و بلندمدت انسانی و مهار خطرات بالقوه آن اختصاص پیدا کرد.
از این رو DALL-E 2 در حال حاضر در دسترس عموم مردم قرار نمیگیرد. به اعتقاد شرکت سازنده، اگر از این برنامه برای ایجاد محتوای فریبنده و مشابه «دیپ فیک» فعلی یا تصاویر مضر دیگر استفاده شود، میتواند خطرناک شود.
مطلب پیشنهادی: آیا هوش مصنوعی میتواند جایگزین نویسندهها شود؟
مثالهای جالب DALL-E 2
ترسیم زندگی حیوانات با دال-ای 2
سگ خوشتیپ
تصویر فوق از متن «سگ شیبا اینو با کلاه برت و یقه اسکی مشکی» ساخته شده است.
هوش مصنوعی با کمی سوگیری باعث تقویت کلیشههای اجتماعی میشود. شرکت OpenAI اقدامات ایمنی را رعایت میکند، ولی DALL-E را برای آزمایش کردن در اختیار تعداد کمی از کاربران منتخب قرار داده است. در حال حاضر، یک سیاست محتوایی برای منع کاربران از ایجاد هرگونه تصویر خشونتآمیز یا نفرتانگیز و محتوای سیاسی وجود دارد.
این کار توسط فیلترها و سیستمهای نظارت خودکار و انسانی انجام میشود.
خرسهای عروسکی
برداشت دال-ای 2 از متن «خرسهای عروسکی در حال خرید مواد غذایی به سبک ukiyo-e» به شکل فوق است.
توانایی DALL-E برای تولید چنین تصاویری، محدود است. تمام محتوای زننده یا خشونتآمیز از دادههای آموزشی آن حذف شده است؛ بنابراین به طرز خوشایندی با این مفاهیم متنی مواجه میشود.
شرکت OpenAI توسط ماسک، سام آلتمن از شرکت Y Combinator و سایر حامیان در اواخر سال 2015 راه اندازی شد. بعد از آن ماسک، از هیئت مدیره استعفا داد. این شرکت در سال 2019، ظاهراً برای تأمین بودجه بیشتر، به یک شرکت انتفاعی تبدیل شد، اگرچه شرکت مادر همچنان یک شرکت غیرانتفاعی است.
یکی دیگر از پروژههای OpenAI، به نام Dactyl شامل آموزش یک دست رباتی برای دستکاری سریع اجسام با استفاده از حرکات انسان مانند و خود آموخته بود.
در ادامه تصاویر بیشتری را از زندگی حیوانات مشاهده میکنید.
«راکونی که سر کلاس برنامه نویسی گیج شده است»:
فضانورد
این اسب، فضانورد و ستارهها در دنیای واقعی وجود ندارند. همگی اختراع یک مدل کامپیوتری به نام دال-ای 2 هستند. بنابراین این مدل یاد گرفته تا بین کلمات و تصاویر درون پایگاه داده حاوی صدها میلیون عکس و برچسبهای محتوایی ارتباط برقرار کند. اگر یک عبارت ساده مانند «عکسی از یک فضانورد سوار بر اسب» را تایپ کنید، DALL-E 2 بر اساس درک خودش از معنای «فضانورد»، «سواری» و «اسب» تصویری را تولید خواهد کرد. حتی جزئیات را بر اساس توانایی خودش در برقراری ارتباط مفاهیم مرتبط، پر میکند. به عنوان مثال، فضانوردان معمولاً در پس زمینهای از ستارهها دیده میشوند.
جان دادن به غذاها با دال-ای 2
شرکت OpenAI امیدوار است که مردم از ابزارهایی مانند دال-ای 2 به روشهای عجیب و خلاقانه، مانند «تصویر یک شب دلپذیر برای یک جفت آووکادو در مهمانی» یا «کلم بروکلی در حال شکایت از آب و هوا» استفاده کنند.
تهیه آثار هنری با دال-ای 2
«نقاشی رافائل از پیتزا خوردن مدونا در کنار یک کودک»:
تصویری از «خرابی وای فای در قرون وسطا»:
«دو شخصیت از نقاشی مصری که در حال بحث بر سر بیرون گذاشتن زباله هستند»:
«نقاشی سبک گوتیک از فضانورد و زنش»:
«دختر رباتی با گوشوارههای مروارید»:
«لئوناردو وارد متاورس شده» :
سرگرمی و انیمیشن
«تصویر رادیولوژی مینیونها»:
«نقاشی باستانی از بانی خرگوشه»:
«شکایت یودا بابت سقوط ارزش سهام»:
«خانه واقع گرای باب اسفنجی»:
در نهایت…
شرکت OpenAI در گذشته، پروژههای مشابهی را توسعه داده و آنها را برای عموم منتشر کرده است. هر کسی میتواند از آخرین مدل زبان OpenAI، یعنی GPT-3 برای تولید داستان، مقاله و شعر بر اساس توضیحات ساده استفاده کند. با کمی تخصص در کدنویسی، میتوانید از Jukebox برای اختراع آهنگهای عالی با سبکهای شعری مختلف استفاده کنید. دال-ای 2 هنوز در مرحله آزمایشی بتا است، اما میتوانید برای استفاده از آن در لیست انتظار ثبت نام کنید. این شرکت هر هفته برای حدود 1000 نفر دعوت نامه ارسال میکند. در حال حاضر، نمونههای مختلفی از تصاویر دال-ای 2 در شبکههای اجتماعی منتشر شده و همگی کاملاً ایمن هستند.
در صورتی که شما هم میخواهید دال-ای 2 را تست کنید و متن های ساختگی خود را تبدیل به عکس کنید، میتوانید در حال حاضر از این لینک، از نسخه رایگان و محدود که دال-ای مینی (DALL·E mini) نام دارد، استفاده کنید.
منابع
OpenAI’s DALL-E 2 generates illustrations from written descriptions
https://qz.com/2176389/the-best-examples-of-dall-e-2s-strange-beautiful-ai-art
2 دیدگاه
-
25 تیر 1401
برگاااااااااااااااااااام 😳😳😳 جدی جهان داره به کجا میره
-
21 آذر 1401
چه باحال بود
من که لذت بردم
دمتون گرم. بازم مطالب تکنولوژی بذارید
دیدگاه شما