TL؛ دکتر: هوش مصنوعی مولد با سرعتی هیجان انگیز در حال تکامل است. جدیدترین الگوریتم انویدیا دو برابر سریعتر از پروژههایی که به سختی 3 ماه پیش منتشر شده بودند، متن را به مش سه بعدی تبدیل میکند. این بدان معناست که قابلیت های فنی اکنون از توانایی ما برای کار با آنها فراتر رفته است.
هفته های گذشته مقاله توسط دانشمندان Nvidia سرعت تصاعدی که در آن فضای مولد AI در حال تکامل است را نشان دادند. این انفجار فعالیت - به ویژه در 9 ماه گذشته قابل مشاهده است - بر هر بخش از زندگی تأثیر خواهد گذاشت، به ویژه در طراحی، مهندسی و تولید محصول. این تغییرات صنعت را از محدودیتهای ساختاری در نحوه انتقال ایدهها باز میدارد، چرخههای نوآوری سریعتر را توانمند میسازد و در نهایت به آن اجازه میدهد تا وعدههای پایداری خود را انجام دهد.
با توجه به اینکه برای سالها گفته میشد که هوش مصنوعی اساساً روش کار ما را متحول میکند، کمتر کسی انتظار داشت که بخش خلاق جزو اولین قربانیان آن باشد. ظهور مولد متن انسانمانند GPT-3 در سال 2020، این امکانات را به وضوح بیشتر کرد. از آن زمان به بعد، این یک سواری وحشیانه بوده است: DALL-E (متن به تصویر)، Whisper (تشخیص گفتار) و اخیراً Stable Diffusion (متن به تصویر) نه تنها قابلیتهای گفتار و ابزارهای بصری هوش مصنوعی را افزایش دادند، بلکه همچنین منابع مورد نیاز برای استفاده از آنها را کاهش داد (از 175 میلیارد پارامتر برای GPT-3 به 900 میلیون برای انتشار پایدار).
اندازه Stable Diffusion به معنای کمتر از 5 گیگ فضای دیسک است - قابل اجرا بر روی هر لپ تاپ. نه تنها که؛ بر خلاف OpenAI (که عمدتاً توسط مایکروسافت تأمین مالی می شود و GPT-3، DALL-E و Whisper را منتشر می کند)، Stable Diffusion منبع باز است، به این معنی که دیگران می توانند با سهولت بیشتری بر روی آموخته های آن کار کنند. این بدان معناست که ما فقط شروع چرخه نوآوری را می بینیم - همانطور که مقاله انویدیا اکنون نشان می دهد، چیزهای بیشتری در راه است.
حامیان Stable Diffusion (stability.ai) با ارائه کمک های مالی و تکنولوژیکی به تیم های دیگر که اکتشاف را در جهت های جدید می برند، این روند را بیشتر توربوشارژ می کنند. علاوه بر این، پروژههای متعددی ابزارها را در دسترس طیف وسیعتری از کاربران قرار میدهند. از جمله پلاگین هایی برای Blender، یک ابزار طراحی منبع باز، و معادل اختصاصی فتوشاپ Adobe. دسترسی کامل API به ابزارها با دلارهای سرمایه گذاری بزرگ تامین می شود، به این معنی که صدها میلیون توسعه دهنده نرم افزار، نه تنها چند صد هزار مهندس داده، اکنون ابزارهای خود را بر روی این الگوریتم ها ایجاد خواهند کرد.
گفتار، تصاویر و متن جزو اولین عمودهایی هستند که توسط این فناوری ها مختل می شوند. اما سه بعدی فاصله چندانی با هم ندارد. فراتر از هنر مولد طاقچه، کارتون اولین نقطه کاربرد آشکار است. در حال حاضر یک ژنراتور پوکمون مبتنی بر Stable Diffusion وجود دارد. جلوه های بصری و فیلم ها در رتبه های بعدی قرار دارند. اما بسیاری از بخشهای دیگر احتمالاً دچار اختلال میشوند – از جمله طراحی داخلی که Interiorai.com پیشتاز این هزینه است.
در تمام این هیجان، بکارگیری نوآوری ها در طراحی و مهندسی مانند یک فکر بعدی به نظر می رسد. با این حال احتمالاً منطقه ای است که در نهایت بیشترین تأثیر را داشته است. البته، چالشهای اولیه وجود دارد: یکی، Stable Diffusion و هموطنان آن هنوز خیلی دقیق نیستند. این مشکلی برای کارتون ها نیست، اما برای هر تلاشی برای تبدیل متن به هندسه های سه بعدی کامل مورد استفاده در زمینه های صنعتی، یک چالش بزرگ است. این منطقه ای است که مورد علاقه نوپایی بوده است (پروژه ای به نام Bits3 در سال 101 در اسرائیل راه اندازی شد). این ممکن است جام مقدس صنعت باشد، اما بسیاری از چالش های میانی وجود دارد که ممکن است حل آنها بسیار آسان تر باشد. اینها شامل تشخیص شی بهبود یافته است (الگوریتم Yolo در حال حاضر با تأثیرات زیادی استفاده می شود)، که منجر به بهبود نقل قول و حاشیه نویسی - بهبود کیفیت و کاهش اشتباهات می شود. افزونهها همچنین باید استفاده از هوش مصنوعی Generative را برای توسعه طرحهای اولیه (Primitives) آسانتر کنند، که سپس میتوان آنها را در ابزارهای طراحی برای بهبود تحمل مطابق با نیاز ویرایش کرد. این رویکردی است که قبلاً در Altair's Inspire استفاده شده بود، که از تحلیل المان محدود برای انجام همین کار استفاده می کرد. این Primitives همچنین می توانند به عنوان پایگاه داده مصنوعی از مدل های حاشیه نویسی استفاده کنند که در صنعت 2015D CAD کمبود وجود دارد. مدیرعامل و موسس فیسنا در مقاله ای به این موضوع اشاره می کند جزئیات تلاشهای خود برای استفاده از این روشهای جدید برای ایجاد طرحهای سهبعدی دقیق، که همچنین تعدادی از مشکلات در استفاده از دادههای مصنوعی برای هدایت این الگوریتمها را برجسته میکند. کتابخانه سایش ابزار برای تعیین بهترین استراتژی های ماشینکاری.
این چالش ها برای خود و برای خود مهم و سودآور هستند. با این حال تأثیر اصلی آنها کمک به تکامل مسیر ایده به طراحی با در نهایت کاهش اتکا به طرحهای سه بعدی برای برقراری ارتباط با هدف خواهد بود. طرحها، چه دو بعدی یا سه بعدی، به عنوان ابزار اصلی برای ترجمه نیازهای مشتریان به محصولات نهایی عمل کردهاند. این صنعت را محدود می کند زیرا این طرح ها به عنوان یک جعبه سیاه عمل می کنند که در آن همه آن بینش های ارزشمند مشتری، محدودیت های تولید و اهداف شرکت ذخیره می شوند و نمی توانند از هم جدا شوند و در عین حال به تنهایی شناسایی شوند. این بدان معنی است که وقتی چیزی تغییر می کند، تنظیم طرح به سادگی غیرممکن است. به همین دلیل است که نوآوریهای تولیدی مانند پرینت سه بعدی زمان زیادی طول میکشد تا سرمایهگذاران کوتاهمدت را ناامید کنند. اجزای سازنده یک هواپیما، علیرغم عمر مفید بیش از 3 سال، از همان لحظه طراحی «تنظیم» می شوند. تقریباً هیچ دامنه نوآوری وجود ندارد - اینها باید منتظر راه اندازی نسل بعدی باشند.
توانایی تغییر یک محدودیت واحد و اجازه دادن به الگوریتمی مانند Stable Diffusion برای بازسازی پارامترهای طراحی و تولید، سرعت پذیرش نوآوریهای جدید را به میزان قابل توجهی افزایش میدهد و به ما امکان میدهد محصولات سبکتر و با عملکرد بهتر و سریعتر بسازیم. همانطور که در فرمول 1 یا طراحی سیستمها انجام میدهند، مهندسان آینده بهعنوان مدیران محدودیتها عمل خواهند کرد که بتوانند اهداف و محدودیتهای محصول را با کلمات و با ارجاع به منابع داده بیان کنند.
بدون تسریع فرآیند مهندسی برای محصولات جدید و موجود به این روش، تقریباً هیچ وسیله ای برای دستیابی به اهداف بلندپروازانه پایداری که باید برای خود تعیین کنیم، نداریم. برای انجام این کار، ابتدا باید روی زبانی توافق کنیم که بتوانیم از آن برای برقراری ارتباط فراتر از طراحی ها استفاده کنیم. این مدل معنایی جدید شکاف آشکار در نوآوری های ذکر شده در بالا است. تعدادی از شرکت ها قبلاً شروع به آزمایش با آن کرده اند، مانند nتوپولوژی با مفاهیم فیلدها. و با این حال، بر خلاف الگوریتم هایی که مدل معنایی تغذیه می کند، سرعت تغییر کند است. الگوریتم جدید انویدیا بیش از دو برابر سریعتر از آن گزارش شده است DreamFusion، کمتر از 2 ماه پیش منتشر شد. شرکتهای تولیدی و مهندسی باید در حال حاضر روی ایدههای خود به روشهای جدید و سازگار با آینده کار کنند تا از فرصتهایی که این انفجار هوش مصنوعی مولد دارد، حداکثر استفاده را ببرند. سرعت تغییر در الگوریتمها بار دیگر نشان داد که قانون مورس در همه جا که ابزارها دیجیتالی میشوند، اعمال میشود. چالش همچنان ناتوانی انسانی ما در پذیرش این تغییر و به کارگیری روشهای ارتباطی جدید است که قادر به باز کردن پتانسیل آنها هستند، علیرغم فوریت این کار.
منبع: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/