دیوید هولز، بنیانگذار Midjourney درباره تاثیر هوش مصنوعی بر هنر، تخیل و اقتصاد خلاق

میانه سفر یکی از محرک‌های پیشرو در فناوری نوظهور استفاده از هوش مصنوعی (AI) برای ایجاد تصاویر بصری از پیام‌های متنی است. این استارت آپ مستقر در سانفرانسیسکو اخیراً به عنوان موتور پشت سر اثر هنری که در یک رقابت منصفانه ایالت کلرادو برنده جایزه شد، خبرساز شد و بعید است که این آخرین مشکل پیچیده ای باشد که هنر هوش مصنوعی در سال های آینده با آن مواجه خواهد شد.

Midjourney با تأکید بر زیبایی شناسی نقاشی در تصاویری که تولید می کند، از دیگران در فضا متمایز می شود. این پلتفرم سعی نمی‌کند تصاویر واقعی واقعی ایجاد کند که بتوان آن‌ها را با عکس اشتباه گرفت، و مدیر اجرایی دیوید هولز می‌گوید که شخصاً از کیفیت عجیب دیپ‌فیک‌ها و سایر کارهایی که واقعیت را خیلی نزدیک شبیه‌سازی می‌کنند، بسیار ناراحت است. در عوض، هولز می‌گوید Midjourney برای باز کردن خلاقیت افراد عادی با دادن ابزارهایی به آنها برای ایجاد تصاویر زیبا فقط با توصیف آنها طراحی شده است.

اما علیرغم تمرکز اومانیستی و مصرف‌گرای شرکت، سوالات اجتناب‌ناپذیری در مورد پیامدهای هنر تجاری و هنرمندان حرفه‌ای وجود دارد. من با هولز مصاحبه کردم بخش وسیع تری در مورد اختلالات احتمالی که هنر هوش مصنوعی احتمالاً در تولید تصاویر ایجاد می کند برای سرگرمی، بازی های ویدیویی و انتشار. در اینجا گزیده‌ای طولانی‌تر از مکالمه ما است که در آن هولز با پرداختن به این موضوعات و تشریح دیدگاه خود برای شرکت، صنعت و فناوری، عمق و زمینه بیشتری را ارائه می‌دهد. مصاحبه برای طولانی بودن و وضوح ویرایش شده است.

راب سالکوویتز، همکار فوربس: نقش و عنوان شما چیست؟

دیوید هولز، Midjourney. من بنیانگذار و مدیرعامل هستم. من معمولاً ترجیح می‌دهم من را موسس خطاب کنند، زیرا مدیرعامل به نظر بسیار کاسبکار است و ما چندان اهل تجارت نیستیم. ما یک آزمایشگاه تحقیقات کاربردی هستیم که محصولات تولید می کنیم.

ماموریت Midjourney چیست؟

ما دوست داریم بگوییم که در حال تلاش برای گسترش قدرت تخیل نوع بشر هستیم. هدف این است که انسان ها را تخیل تر کنیم، نه ماشین های تخیلی، که به نظر من تمایز مهمی است.

آیا می توانید تاریخچه مختصری از شرکت تا به امروز ارائه دهید؟

ما حدود یک سال و نیم پیش کار روی بخش تخیل شرکتمان را شروع کردیم. پیشرفت‌هایی در مدل‌های انتشار، افرادی که کلیپ‌ها را می‌فهمند، openAI، و چیزهایی از این دست، وجود داشت. تقریباً همه کسانی که در این امر دخیل هستند سانفرانسیسکو هستند و همه ما متوجه شدیم که این موضوع جدی خواهد شد، که با بسیاری از چیزهای دیگر متفاوت است.

Midjourney چه فایده ای از این فناوری متن به تصویر برای تجارت و جامعه می بیند؟

من قطعاً بیشتر نگران جامعه هستم تا تجارت. ما یک محصول مصرفی هستیم، اما شاید 30 تا 50 درصد از کاربران ما در حال حاضر حرفه ای باشند. اکثریت نیستند. هنرمندان روی پلتفرم به ما می گویند که این اجازه می دهد تا در ابتدا خلاقیت و کاوش بیشتری داشته باشند و در مدت زمان کوتاهی ایده های زیادی را ارائه دهند.

در حال حاضر، کاربران حرفه ای ما از این پلت فرم برای مفهوم استفاده می کنند. سخت ترین بخش [یک پروژه هنری تجاری] اغلب در آغاز است، زمانی که ذینفعان نمی دانند چه می خواهند و باید ایده هایی را ببینند تا به آنها واکنش نشان دهند. Midjourney می‌تواند به افراد کمک کند تا خیلی سریع‌تر به ایده‌ای که می‌خواهند همگرا شوند، زیرا تکرار آن مفاهیم بسیار پر زحمت است.

مزیت دیگر برای هنرمندان این است که به مردم در زمینه هایی که اعتماد به نفس ندارند اعتماد می کند. اکثر هنرمندان، اگر نه همه، احساس می کنند بخشی از هنر وجود دارد که نمی توانند به خوبی انجام دهند. ممکن است رنگ، ترکیب، پس زمینه باشد. ما یک طراح شخصیت معروف داریم که از محصول ما استفاده می‌کند و مردم از او می‌پرسند چرا از هوش مصنوعی استفاده می‌کنی، زیرا از قبل خیلی خوب هستی. و او گفت: «خب، من فقط در قسمت شخصیت خوب هستم. این به من در مورد بقیه، جهان، پس‌زمینه، طرح‌های رنگی کمک می‌کند.»

حدودا چند نفر از این محصول استفاده می کنند؟

میلیون ها نفر از آن استفاده می کنند. اختلاف ما بیش از دو میلیون است. این بزرگترین سرور Discord فعال تا کنون است.

آیا مجوز Midjourney اجازه استفاده تجاری از تصاویر تولید شده توسط این پلتفرم را می دهد؟

آره. اما اگر برای شرکتی بیشتر از یک میلیون دلار درآمد سالانه کار می‌کنید، از شما می‌خواهیم که مجوز شرکت بخرید.

مجموعه داده چگونه ساخته شد؟

این فقط یک خراش بزرگ از اینترنت است. ما از مجموعه داده‌های باز منتشر شده استفاده می‌کنیم و در آن‌ها آموزش می‌دهیم. و من می توانم بگویم که این چیزی است که 100٪ مردم انجام می دهند. ما سختگیر نبودیم علم واقعاً به سرعت در حال تکامل است از نظر میزان داده ای که واقعاً نیاز دارید، در مقابل کیفیت مدل. چند سال طول می‌کشد تا واقعاً همه چیز را بفهمید، و تا آن زمان، ممکن است مدل‌هایی داشته باشید که تقریباً با هیچ چیز تمرین نمی‌کنید. هیچ کس واقعا نمی داند چه کاری می تواند انجام دهد.

آیا از هنرمندان زنده درخواست رضایت دادید یا هنوز تحت کپی رایت کار می کنید؟

نه. واقعاً راهی برای دریافت صد میلیون تصویر و دانستن اینکه آنها از کجا می آیند وجود ندارد. اگر تصاویر متادیتا در مورد مالک حق چاپ یا چیز دیگری در آنها تعبیه شده بود بسیار جالب بود. اما این یک چیز نیست. رجیستری وجود ندارد هیچ راهی برای پیدا کردن یک عکس در اینترنت وجود ندارد، و سپس به طور خودکار آن را به یک مالک ردیابی کنید و سپس هر کاری برای احراز هویت آن انجام دهید.

آیا هنرمندان می توانند از قرار گرفتن در مدل آموزش داده شما صرف نظر کنند؟

ما در حال بررسی آن هستیم. اکنون چالش این است که بفهمیم قوانین چیست و چگونه بفهمیم که آیا یک شخص واقعاً هنرمند یک اثر خاص است یا فقط نام خود را روی آن گذاشته است. ما با کسی برخورد نکرده‌ایم که بخواهد نامش از مجموعه داده‌ها خارج شود.

آیا هنرمندان می توانند از نام بردن در درخواست ها منصرف شوند؟

الان نه. ما در حال بررسی آن هستیم. باز هم، ما باید راهی برای احراز هویت آن درخواست ها پیدا کنیم، که ممکن است پیچیده شود.

به هنرمندان تجاری چه می گویید که این امر باعث از بین رفتن معیشت آنها می شود؟ در یک نقطه خاص، چرا یک کارگردان هنری یک تصویرگر را برای تولید آثاری مانند هنر مفهومی، طراحی تولید، پس‌زمینه‌ها - از این قبیل چیزها - استخدام می‌کند، در حالی که آنها می‌توانند سریع‌تر و با هزینه کمتر خروجی مفیدی را وارد کنند؟

هنوز خیلی کار است. این فقط این نیست که «من را یک پس‌زمینه بساز». ممکن است ده برابر کار کمتری باشد، اما بسیار بیشتر از کاری است که یک مدیر انجام دهد.

من فکر می‌کنم این کار به دو صورت وجود دارد. یک راه این است که سعی کنید همان سطح محتوایی را که مردم مصرف می کنند با قیمت کمتری ارائه کنید، درست است؟ و راه دیگر این است که محتوای بسیار بهتری را با قیمت هایی بسازیم که از قبل مایل به خرج کردن آن هستیم. من متوجه شدم که اکثر مردم، اگر در حال حاضر پول خرج می‌کنند، و شما بین محتوای بسیار بهتر یا محتوای ارزان‌تر انتخاب دارید، در واقع محتوای بسیار بهتری را انتخاب می‌کنید. بازار قبلاً قیمتی را تعیین کرده است که مردم مایل به پرداخت آن هستند.

من فکر می کنم که عده ای سعی می کنند هنرمندان را حذف کنند. آنها سعی می کنند با هزینه کمتر چیزی مشابه بسازند و به نظر من در بازار شکست خواهند خورد. من فکر می کنم بازار به سمت کیفیت بالاتر، خلاقیت بیشتر و محتوای بسیار پیچیده تر، متنوع تر و عمیق تر خواهد رفت. و افرادی که واقعاً قادر به استفاده از هنرمندان هستند و از ابزارهایی برای انجام این کار استفاده می کنند، برنده خواهند شد.

این فناوری ها در واقع قدردانی و سواد بسیار عمیق تری را در رسانه بصری ایجاد می کنند. ممکن است واقعاً تقاضا داشته باشید، از توانایی تولید در آن سطح پیشی بگیرید، و سپس شاید واقعاً دستمزد هنرمندان را افزایش دهید. ممکن است عجیب باشد، اما این چیزی است که قرار است اتفاق بیفتد. سرعت این افزایش تقاضا برای کیفیت و تنوع منجر به انجام پروژه‌های شگفت‌انگیز و غیرمنتظره می‌شود.

نسلی از دانش‌آموزان از مدارس هنر فارغ‌التحصیل شدند، بسیاری از آنها بدهی زیادی داشتند و روی مشاغل نسبتاً خوب در تولید سرگرمی، تولید بازی‌های ویدیویی، هنر تجاری و غیره حساب می‌کردند. ظهور پلتفرم‌های تبدیل متن به تصویر هوش مصنوعی چه تأثیری بر آینده آنها دارد؟

من فکر می‌کنم برخی از مردم تلاش می‌کنند هزینه‌ها را کاهش دهند و برخی تلاش خواهند کرد تا جاه‌طلبی‌ها را گسترش دهند. فکر می‌کنم افرادی که جاه‌طلبی‌ها را گسترش می‌دهند، همچنان همان حقوق‌ها را پرداخت خواهند کرد، و افرادی که سعی در کاهش هزینه‌ها دارند، فکر می‌کنم شکست خواهند خورد.

هوش مصنوعی معمولاً در مقیاس برای مواردی مانند مراکز تماس یا چک کردن چمدان ها در فرودگاه ها و کارهایی که مردم واقعاً به انجام آن اهمیتی نمی دهند استفاده می شود. و گزاره ارزش این است که افراد را آزاد می‌کند تا کارهای مفیدتر و جالب‌تری را انجام دهند. اما مشاغل هنری با ارزش و جالب هستند. مردم تمام زندگی خود را کار می کنند و مهارت های خود را برای به دست آوردن این نوع مشاغل توسعه می دهند. چرا این فناوری را در آن سطح از اقتصاد به عنوان یک نوع تمرکز تجاری و اولویت برای کارهایی که انجام می دهید معرفی می کنید؟

من شخصا نیستم. چیزهای من برای هنرمندان حرفه ای ساخته نشده است. اگر دوست دارند از آن استفاده کنند، عالی است. وسایل من برای افرادی ساخته شده است که، مثلاً، این زن در هنگ کنگ است، و او به سراغ من آمد، و او می گوید: "تنها چیزی در هنگ کنگ که والدین شما هرگز نمی خواهند شما یک هنرمند باشید، و من" من الان یک بانکدار هستم من زندگی بانکی خوبی دارم. اما با Midjourney در حال حاضر من در واقع شروع به چشیدن طعم این تجربه می کنم که کسی هستم که واقعاً می خواستم باشم." یا مردی در ایستگاه کامیون که فقط برای سرگرمی، کارت های بیسبال خود را با تصاویر وحشی درست می کند. این برای آن افراد ساخته شده است، زیرا مانند بسیاری از مردم، آنها هرگز نمی توانند این کارها را انجام دهند.

مهم است که تأکید کنیم که این مربوط به هنر نیست. این در مورد تخیل است. تخیل گاهی اوقات برای هنر استفاده می شود، اما اغلب اینطور نیست. بسیاری از تصاویر ایجاد شده در Midjourney به طور حرفه ای استفاده نمی شوند. آنها حتی به اشتراک گذاشته نمی شوند. آنها فقط برای این اهداف دیگر، همین نیازهای انسانی استفاده می شوند.

با این وجود، خروجی محصول شما تصویرسازی است که علاوه بر تمام ویژگی های دیگر، در زمینه حرفه ای ارزش تجاری نیز دارد. و این بسیار مخل اقتصاد است.

فکر می‌کنم مثل این است که ما داریم یک قایق می‌سازیم، و کسی می‌تواند با قایق مسابقه دهد، اما این بدان معنا نیست که قایق برای مسابقه است. اگر از قایق برای مسابقه استفاده می کنید، احتمالاً، بله، مطمئناً. در آن لحظه است. اما جنبه انسانی واقعا مهم است، و من فکر می کنم که ما اینطور نیستیم... ما می خواهیم عکس ها را زیبا جلوه دهیم. ما خودمان را در تلاش برای خلق هنر به عنوان بخشی از چیز خود نمی بینیم. ما می خواهیم دنیا تخیلی تر باشد. ما ترجیح می دهیم چیزهای زیبا بسازیم تا چیزهای زشت.

آیا شما معتقدید که هیچ نهاد دولتی صلاحیت یا اختیاری برای تنظیم این فناوری دارد؟ و اگر چنین است، به نظر شما آنها باید؟

من نمی دانم. مقررات جالب است. شما باید بین آزادی انجام کاری و آزادی محافظت از شما تعادل برقرار کنید. خود فناوری مشکلی نیست. مثل آب است. آب می تواند خطرناک باشد، می توانید در آن غرق شوید. اما این نیز ضروری است. ما نمی خواهیم فقط برای جلوگیری از قسمت های خطرناک آب را ممنوع کنیم.

خوب، ما می خواهیم مطمئن شویم که آب ما تمیز است.

بله ، درست است

منبع: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- اقتصاد خلاق/