Al Generative Art نوعی هنر است، در بیشتر موارد بصری، که مبتنی بر همکاری بین یک انسان و یک سیستم خودمختار است. یک "سیستم خودگردان" به عنوان یک تعریف می شود هوش مصنوعی نرم افزار، الگوریتم یا مدلی که قادر به انجام عملیات پیچیده بدون نیاز به دخالت برنامه نویس است.
از کنار هم قرار دادن عجیب تصاویر ایجاد شده توسط Dall-E Mini به NFT در بازار، تصاویر تولید شده توسط الگوریتم های هوش مصنوعی به طور فزاینده ای وارد تصورات اصلی می شوند. در واقع دو پروژه مهم در این زمینه که شایسته تحلیل هستند عبارتند از: میانه سفر و DALL-E2.
البته این خبر به توییتر هم راه پیدا کرده است. از جمله چارلز هاسکینسون که در مورد آن اظهار نظر می کند:
هوش مصنوعی هنری ایجاد کرد. من فقط در چند دقیقه تونستم این عکس رو بسازم. من نمی توانم تصور کنم که این فناوری تا 3 سال دیگر چقدر قابل توجه خواهد بود pic.twitter.com/jOToCZj7ki
- چارلز Hoskinson (IOHK_Charles) فوریه 1، 2023
Al Generative Art: آزمایشها و ویژگیهای اولیه
با درک اینکه هنر مولد چیست، مهم است که بر یکی از اصول بنیادین آن تأکید کنیم: تصادفی بودن. که یکی از ویژگی های اساسی هنر زایشی است.
در واقع، بسته به نوع نرم افزار، سیستم خودمختار قادر است نتایجی را پردازش کند که در هر بار اجرای دستور تولید، همیشه متفاوت و منحصر به فرد هستند، یا می تواند تعداد متغیری از نتایج را در پاسخ به ورودی کاربر برگرداند.
اولین آزمایشها در هنر زایشی به دهه 1960 با آزمایشهایی برمیگردد هارولد کوهن و او آرون برنامه کوهن برای اولین بار از نرم افزار مستقل برای تولید آثار هنری انتزاعی با الهام از صفحات ابریشمی پاپ آرت استفاده کرد. آثار کوهن اکنون در گالری تیت لندن به نمایش گذاشته شده است.
یکی دیگر از ویژگیهای هنر مولد، اما یکی از ویژگیهایی که کمتر و کمتر به آن اختصاص دارد، تکرار الگوها یا عناصر انتزاعی است که توسط برنامهنویس ارائه شده و در کد نرمافزار پیادهسازی میشود.
علاوه بر این، توسعه شبکههای عصبی پیچیدهتر که بر روی تداعی متن-تصویر کار میکنند، توسعه مدلهای مولد را قادر به ایجاد تصاویر واقعی و دقیق میسازد. شناخته شده ترین نمونه از این دسته از هنر زایشی است دال-ای.
Dall-E یک شبکه عصبی چندوجهی است که بر اساس GPT-3 مدل یادگیری عمیق از OpenAI، همان شرکتی که اخیراً توسعه یافته است GPT چت، ربات چت در نوامبر 2022 راه اندازی شد و با آن بهینه شد "نظارت شده" و تکنیک های یادگیری تقویتی
با بازگشت به Dall-E، می بینیم که این سیستم قادر به تولید تصاویر از یک توصیف متنی است که به نام "سریع،" بر اساس مجموعه داده ای از جفت متن-تصویر.
اولین نسخه Dall-E که در ژانویه 2021 به عموم ارائه شد و در انحصار تعداد کمی از متخصصان این حوزه باقی ماند، انقلابی واقعی را از نظر این نوع مدل تولیدی نشان داد که از نوآوری های GPT- پیشی گرفت. 3 خود.
همچنین این واقعیت حائز اهمیت است که دقت نتایج پردازش شده توسط Dall-E میدان عالی برای راه حل OpenAI دیگر است: کلیپ (پیش آموزش زبان متضاد-تصویر).
یک شبکه عصبی طبقهبندی و رتبهبندی تصویر که بر اساس تداعی متن-تصویر، مانند زیرنویسهای موجود در اینترنت، آموزش داده میشود. با تشکر از مداخله CLIP، که تعداد نتایج پیشنهادی به کاربر در هر درخواست را به 32 کاهش میدهد، Dall-E در اکثر موارد تصاویر رضایتبخشی را نشان میدهد.
Midjourney: طراحی، زیرساخت های انسانی و هوش مصنوعی
همانطور که پیش بینی می شد، میانه سفر پروژه مهمی است که بخشی از مفهوم Al Generative Art در حال ظهور است. به طور خاص، Midjourney یک آزمایشگاه تحقیقاتی مستقل است که ابزارهای جدید تفکر را بررسی می کند و قدرت تخیل گونه انسان را گسترش می دهد.
استفاده از آن ساده است: ابتدا باید یک حساب کاربری در آن ایجاد شود اختلاف، پلتفرمی که میزبان جوامع مختلفی است که Midjourney یکی از آنهاست. در داخل برنامه چت روم های مختلفی وجود دارد که در آنها می توان به طور فعال در بحث ها شرکت کرد یا خیر.
ذکر این نکته ضروری است که برای استفاده از هوش مصنوعی برای اولین بار باید به این مطلب مراجعه کنید "تازه کارها" کانال ها، جایی که 25 رندر رایگان در دسترس هستند.
یک رندر مربوط به تولید چهار نوع مختلف تولید شده از یک ورودی متنی است.
بنابراین، 25 رندر به 25 کار پردازشی انجام شده توسط ربات Midjourney اشاره دارد. در نتیجه، تولید تصویر نیاز به تعامل با ربات Midjourney از طریق یک پیام متنی به نام "اعلان" دارد، که در آن کلمات کلیدی برای توصیف تصویری که کاربر در ذهن دارد وجود دارد.
شما می توانید هر تعداد جزئیات را که می خواهید اضافه کنید، مهم این است که کلمات کلیدی را با کاما تقسیم کنید. پس از اتمام رندر، رایانه چهار تصویر مختلف را بر اساس توضیحاتی که باید انتخاب کنید، برمی گرداند.
علاوه بر این، پس از اتمام رندر شدن برنامه، میتوانید اولویتهای خود را بر اساس تصاویر به اشتراک بگذارید و در صورت تمایل، دوباره چهار نسخه دیگر تولید کنید.
DALL-E 2: سیستم هوش مصنوعی جدید برای آثار هنری
علاوه بر Midjourney، DALL-E 2 همچنین یک سیستم هوش مصنوعی جدید است که می تواند تصاویر و آثار هنری واقع گرایانه را از توصیف زبان طبیعی ایجاد کند. نه تنها این، DALL-E 2 همچنین می تواند مفاهیم، ویژگی ها و سبک ها را ترکیب کند.
قدرت سیستم هوش مصنوعی جدید همچنین در توانایی گسترش تصاویر فراتر از آنچه در بوم اصلی وجود دارد و ایجاد ترکیبات گسترده جدید. علاوه بر این، میتواند تغییرات واقعی را در تصاویر موجود از زیرنویس زبان طبیعی ایجاد کند و میتواند عناصر را با در نظر گرفتن سایهها، بازتابها و بافتها اضافه و حذف کند.
قابلیتهای DALL-E 2 همچنین شامل گرفتن یک تصویر و ایجاد چندین گونه از آن با الهام از نسخه اصلی است. DALL-E 2 رابطه بین تصاویر و متن مورد استفاده برای توصیف آنها را آموخته است.
از فرآیندی به نام استفاده می کند "نشر،" که با الگویی از نقاط تصادفی شروع می شود و زمانی که جنبه های خاصی از آن تصویر را تشخیص می دهد، به تدریج آن الگو را به سمت یک تصویر تغییر می دهد.
بنابراین، پس از معرفی OpenAI DALL-E در ژانویه 2021، اکنون جدیدترین سیستم، DALL-E 2، تصاویر واقعی تر و دقیق تر با وضوح چهار برابر تولید می کند.
DALL-E 2 به عنوان یک پروژه تحقیقاتی آغاز شد و اکنون به عنوان یک در دسترس است نسخه بتا. کاهشهای امنیتی که این سیستم توسعه داده و همچنان در حال بهبود است عبارتند از: محدود کردن توانایی سیستم برای تولید تصاویر خشونتآمیز، نفرت یا بزرگسالان، و استقرار مرحلهای مبتنی بر یادگیری.
منبع: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/