نگاهی به هنر جدید Al Generative

Al Generative Art نوعی هنر است، در بیشتر موارد بصری، که مبتنی بر همکاری بین یک انسان و یک سیستم خودمختار است. یک "سیستم خودگردان" به عنوان یک تعریف می شود هوش مصنوعی نرم افزار، الگوریتم یا مدلی که قادر به انجام عملیات پیچیده بدون نیاز به دخالت برنامه نویس است.

از کنار هم قرار دادن عجیب تصاویر ایجاد شده توسط Dall-E Mini به NFT در بازار، تصاویر تولید شده توسط الگوریتم های هوش مصنوعی به طور فزاینده ای وارد تصورات اصلی می شوند. در واقع دو پروژه مهم در این زمینه که شایسته تحلیل هستند عبارتند از: میانه سفر و DALL-E2.

البته این خبر به توییتر هم راه پیدا کرده است. از جمله چارلز هاسکینسون که در مورد آن اظهار نظر می کند:

هوش مصنوعی هنری ایجاد کرد. من فقط در چند دقیقه تونستم این عکس رو بسازم. من نمی توانم تصور کنم که این فناوری تا 3 سال دیگر چقدر قابل توجه خواهد بود pic.twitter.com/jOToCZj7ki
- چارلز Hoskinson (IOHK_Charles) فوریه 1، 2023

Al Generative Art: آزمایش‌ها و ویژگی‌های اولیه

با درک اینکه هنر مولد چیست، مهم است که بر یکی از اصول بنیادین آن تأکید کنیم: تصادفی بودن. که یکی از ویژگی های اساسی هنر زایشی است.

در واقع، بسته به نوع نرم افزار، سیستم خودمختار قادر است نتایجی را پردازش کند که در هر بار اجرای دستور تولید، همیشه متفاوت و منحصر به فرد هستند، یا می تواند تعداد متغیری از نتایج را در پاسخ به ورودی کاربر برگرداند.

اولین آزمایش‌ها در هنر زایشی به دهه 1960 با آزمایش‌هایی برمی‌گردد هارولد کوهن و او آرون برنامه کوهن برای اولین بار از نرم افزار مستقل برای تولید آثار هنری انتزاعی با الهام از صفحات ابریشمی پاپ آرت استفاده کرد. آثار کوهن اکنون در گالری تیت لندن به نمایش گذاشته شده است.

یکی دیگر از ویژگی‌های هنر مولد، اما یکی از ویژگی‌هایی که کمتر و کمتر به آن اختصاص دارد، تکرار الگوها یا عناصر انتزاعی است که توسط برنامه‌نویس ارائه شده و در کد نرم‌افزار پیاده‌سازی می‌شود.

علاوه بر این، توسعه شبکه‌های عصبی پیچیده‌تر که بر روی تداعی متن-تصویر کار می‌کنند، توسعه مدل‌های مولد را قادر به ایجاد تصاویر واقعی و دقیق می‌سازد. شناخته شده ترین نمونه از این دسته از هنر زایشی است دال-ای.

Dall-E یک شبکه عصبی چندوجهی است که بر اساس GPT-3 مدل یادگیری عمیق از OpenAI، همان شرکتی که اخیراً توسعه یافته است GPT چت، ربات چت در نوامبر 2022 راه اندازی شد و با آن بهینه شد "نظارت شده" و تکنیک های یادگیری تقویتی

با بازگشت به Dall-E، می بینیم که این سیستم قادر به تولید تصاویر از یک توصیف متنی است که به نام "سریع،" بر اساس مجموعه داده ای از جفت متن-تصویر.

اولین نسخه Dall-E که در ژانویه 2021 به عموم ارائه شد و در انحصار تعداد کمی از متخصصان این حوزه باقی ماند، انقلابی واقعی را از نظر این نوع مدل تولیدی نشان داد که از نوآوری های GPT- پیشی گرفت. 3 خود.

همچنین این واقعیت حائز اهمیت است که دقت نتایج پردازش شده توسط Dall-E میدان عالی برای راه حل OpenAI دیگر است: کلیپ (پیش آموزش زبان متضاد-تصویر).

یک شبکه عصبی طبقه‌بندی و رتبه‌بندی تصویر که بر اساس تداعی متن-تصویر، مانند زیرنویس‌های موجود در اینترنت، آموزش داده می‌شود. با تشکر از مداخله CLIP، که تعداد نتایج پیشنهادی به کاربر در هر درخواست را به 32 کاهش می‌دهد، Dall-E در اکثر موارد تصاویر رضایت‌بخشی را نشان می‌دهد.

Midjourney: طراحی، زیرساخت های انسانی و هوش مصنوعی

همانطور که پیش بینی می شد، میانه سفر پروژه مهمی است که بخشی از مفهوم Al Generative Art در حال ظهور است. به طور خاص، Midjourney یک آزمایشگاه تحقیقاتی مستقل است که ابزارهای جدید تفکر را بررسی می کند و قدرت تخیل گونه انسان را گسترش می دهد.

استفاده از آن ساده است: ابتدا باید یک حساب کاربری در آن ایجاد شود اختلاف، پلتفرمی که میزبان جوامع مختلفی است که Midjourney یکی از آنهاست. در داخل برنامه چت روم های مختلفی وجود دارد که در آنها می توان به طور فعال در بحث ها شرکت کرد یا خیر.

ذکر این نکته ضروری است که برای استفاده از هوش مصنوعی برای اولین بار باید به این مطلب مراجعه کنید "تازه کارها" کانال ها، جایی که 25 رندر رایگان در دسترس هستند.

یک رندر مربوط به تولید چهار نوع مختلف تولید شده از یک ورودی متنی است.

بنابراین، 25 رندر به 25 کار پردازشی انجام شده توسط ربات Midjourney اشاره دارد. در نتیجه، تولید تصویر نیاز به تعامل با ربات Midjourney از طریق یک پیام متنی به نام "اعلان" دارد، که در آن کلمات کلیدی برای توصیف تصویری که کاربر در ذهن دارد وجود دارد.

شما می توانید هر تعداد جزئیات را که می خواهید اضافه کنید، مهم این است که کلمات کلیدی را با کاما تقسیم کنید. پس از اتمام رندر، رایانه چهار تصویر مختلف را بر اساس توضیحاتی که باید انتخاب کنید، برمی گرداند.

علاوه بر این، پس از اتمام رندر شدن برنامه، می‌توانید اولویت‌های خود را بر اساس تصاویر به اشتراک بگذارید و در صورت تمایل، دوباره چهار نسخه دیگر تولید کنید.

DALL-E 2: سیستم هوش مصنوعی جدید برای آثار هنری

علاوه بر Midjourney، DALL-E 2 همچنین یک سیستم هوش مصنوعی جدید است که می تواند تصاویر و آثار هنری واقع گرایانه را از توصیف زبان طبیعی ایجاد کند. نه تنها این، DALL-E 2 همچنین می تواند مفاهیم، ویژگی ها و سبک ها را ترکیب کند.

قدرت سیستم هوش مصنوعی جدید همچنین در توانایی گسترش تصاویر فراتر از آنچه در بوم اصلی وجود دارد و ایجاد ترکیبات گسترده جدید. علاوه بر این، می‌تواند تغییرات واقعی را در تصاویر موجود از زیرنویس زبان طبیعی ایجاد کند و می‌تواند عناصر را با در نظر گرفتن سایه‌ها، بازتاب‌ها و بافت‌ها اضافه و حذف کند.

قابلیت‌های DALL-E 2 همچنین شامل گرفتن یک تصویر و ایجاد چندین گونه از آن با الهام از نسخه اصلی است. DALL-E 2 رابطه بین تصاویر و متن مورد استفاده برای توصیف آنها را آموخته است.

از فرآیندی به نام استفاده می کند "نشر،" که با الگویی از نقاط تصادفی شروع می شود و زمانی که جنبه های خاصی از آن تصویر را تشخیص می دهد، به تدریج آن الگو را به سمت یک تصویر تغییر می دهد.

بنابراین، پس از معرفی OpenAI DALL-E در ژانویه 2021، اکنون جدیدترین سیستم، DALL-E 2، تصاویر واقعی تر و دقیق تر با وضوح چهار برابر تولید می کند.

DALL-E 2 به عنوان یک پروژه تحقیقاتی آغاز شد و اکنون به عنوان یک در دسترس است نسخه بتا. کاهش‌های امنیتی که این سیستم توسعه داده و همچنان در حال بهبود است عبارتند از: محدود کردن توانایی سیستم برای تولید تصاویر خشونت‌آمیز، نفرت یا بزرگسالان، و استقرار مرحله‌ای مبتنی بر یادگیری.

منبع: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/