معنای جدید تبدیل متن به سه بعدی انویدیا برای مهندسی و طراحی محصول چیست؟

TL؛ دکتر: هوش مصنوعی مولد با سرعتی هیجان انگیز در حال تکامل است. جدیدترین الگوریتم انویدیا دو برابر سریع‌تر از پروژه‌هایی که به سختی 3 ماه پیش منتشر شده بودند، متن را به مش سه بعدی تبدیل می‌کند. این بدان معناست که قابلیت های فنی اکنون از توانایی ما برای کار با آنها فراتر رفته است.

هفته های گذشته مقاله توسط دانشمندان Nvidia سرعت تصاعدی که در آن فضای مولد AI در حال تکامل است را نشان دادند. این انفجار فعالیت - به ویژه در 9 ماه گذشته قابل مشاهده است - بر هر بخش از زندگی تأثیر خواهد گذاشت، به ویژه در طراحی، مهندسی و تولید محصول. این تغییرات صنعت را از محدودیت‌های ساختاری در نحوه انتقال ایده‌ها باز می‌دارد، چرخه‌های نوآوری سریع‌تر را توانمند می‌سازد و در نهایت به آن اجازه می‌دهد تا وعده‌های پایداری خود را انجام دهد.

مش های نمونه از الگوریتم های سه بعدی جادویی Nvidia Research، با اعلان های مورد استفاده برای تولید آنها.

تحقیقات تخیل عمیق انویدیا

با توجه به اینکه برای سال‌ها گفته می‌شد که هوش مصنوعی اساساً روش کار ما را متحول می‌کند، کمتر کسی انتظار داشت که بخش خلاق جزو اولین قربانیان آن باشد. ظهور مولد متن انسان‌مانند GPT-3 در سال 2020، این امکانات را به وضوح بیشتر کرد. از آن زمان به بعد، این یک سواری وحشیانه بوده است: DALL-E (متن به تصویر)، Whisper (تشخیص گفتار) و اخیراً Stable Diffusion (متن به تصویر) نه تنها قابلیت‌های گفتار و ابزارهای بصری هوش مصنوعی را افزایش دادند، بلکه همچنین منابع مورد نیاز برای استفاده از آنها را کاهش داد (از 175 میلیارد پارامتر برای GPT-3 به 900 میلیون برای انتشار پایدار).

اندازه Stable Diffusion به معنای کمتر از 5 گیگ فضای دیسک است - قابل اجرا بر روی هر لپ تاپ. نه تنها که؛ بر خلاف OpenAI (که عمدتاً توسط مایکروسافت تأمین مالی می شود و GPT-3، DALL-E و Whisper را منتشر می کند)، Stable Diffusion منبع باز است، به این معنی که دیگران می توانند با سهولت بیشتری بر روی آموخته های آن کار کنند. این بدان معناست که ما فقط شروع چرخه نوآوری را می بینیم - همانطور که مقاله انویدیا اکنون نشان می دهد، چیزهای بیشتری در راه است.

حامیان Stable Diffusion (stability.ai) با ارائه کمک های مالی و تکنولوژیکی به تیم های دیگر که اکتشاف را در جهت های جدید می برند، این روند را بیشتر توربوشارژ می کنند. علاوه بر این، پروژه‌های متعددی ابزارها را در دسترس طیف وسیع‌تری از کاربران قرار می‌دهند. از جمله پلاگین هایی برای Blender، یک ابزار طراحی منبع باز، و معادل اختصاصی فتوشاپ Adobe. دسترسی کامل API به ابزارها با دلارهای سرمایه گذاری بزرگ تامین می شود، به این معنی که صدها میلیون توسعه دهنده نرم افزار، نه تنها چند صد هزار مهندس داده، اکنون ابزارهای خود را بر روی این الگوریتم ها ایجاد خواهند کرد.

گفتار، تصاویر و متن جزو اولین عمودهایی هستند که توسط این فناوری ها مختل می شوند. اما سه بعدی فاصله چندانی با هم ندارد. فراتر از هنر مولد طاقچه، کارتون اولین نقطه کاربرد آشکار است. در حال حاضر یک ژنراتور پوکمون مبتنی بر Stable Diffusion وجود دارد. جلوه های بصری و فیلم ها در رتبه های بعدی قرار دارند. اما بسیاری از بخش‌های دیگر احتمالاً دچار اختلال می‌شوند – از جمله طراحی داخلی که Interiorai.com پیشتاز این هزینه است.

در تمام این هیجان، بکارگیری نوآوری ها در طراحی و مهندسی مانند یک فکر بعدی به نظر می رسد. با این حال احتمالاً منطقه ای است که در نهایت بیشترین تأثیر را داشته است. البته، چالش‌های اولیه وجود دارد: یکی، Stable Diffusion و هموطنان آن هنوز خیلی دقیق نیستند. این مشکلی برای کارتون ها نیست، اما برای هر تلاشی برای تبدیل متن به هندسه های سه بعدی کامل مورد استفاده در زمینه های صنعتی، یک چالش بزرگ است. این منطقه ای است که مورد علاقه نوپایی بوده است (پروژه ای به نام Bits3 در سال 101 در اسرائیل راه اندازی شد). این ممکن است جام مقدس صنعت باشد، اما بسیاری از چالش های میانی وجود دارد که ممکن است حل آنها بسیار آسان تر باشد. اینها شامل تشخیص شی بهبود یافته است (الگوریتم Yolo در حال حاضر با تأثیرات زیادی استفاده می شود)، که منجر به بهبود نقل قول و حاشیه نویسی - بهبود کیفیت و کاهش اشتباهات می شود. افزونه‌ها همچنین باید استفاده از هوش مصنوعی Generative را برای توسعه طرح‌های اولیه (Primitives) آسان‌تر کنند، که سپس می‌توان آن‌ها را در ابزارهای طراحی برای بهبود تحمل مطابق با نیاز ویرایش کرد. این رویکردی است که قبلاً در Altair's Inspire استفاده شده بود، که از تحلیل المان محدود برای انجام همین کار استفاده می کرد. این Primitives همچنین می توانند به عنوان پایگاه داده مصنوعی از مدل های حاشیه نویسی استفاده کنند که در صنعت 2015D CAD کمبود وجود دارد. مدیرعامل و موسس فیسنا در مقاله ای به این موضوع اشاره می کند جزئیات تلاش‌های خود برای استفاده از این روش‌های جدید برای ایجاد طرح‌های سه‌بعدی دقیق، که همچنین تعدادی از مشکلات در استفاده از داده‌های مصنوعی برای هدایت این الگوریتم‌ها را برجسته می‌کند. کتابخانه سایش ابزار برای تعیین بهترین استراتژی های ماشینکاری.

این چالش ها برای خود و برای خود مهم و سودآور هستند. با این حال تأثیر اصلی آنها کمک به تکامل مسیر ایده به طراحی با در نهایت کاهش اتکا به طرح‌های سه بعدی برای برقراری ارتباط با هدف خواهد بود. طرح‌ها، چه دو بعدی یا سه بعدی، به عنوان ابزار اصلی برای ترجمه نیازهای مشتریان به محصولات نهایی عمل کرده‌اند. این صنعت را محدود می کند زیرا این طرح ها به عنوان یک جعبه سیاه عمل می کنند که در آن همه آن بینش های ارزشمند مشتری، محدودیت های تولید و اهداف شرکت ذخیره می شوند و نمی توانند از هم جدا شوند و در عین حال به تنهایی شناسایی شوند. این بدان معنی است که وقتی چیزی تغییر می کند، تنظیم طرح به سادگی غیرممکن است. به همین دلیل است که نوآوری‌های تولیدی مانند پرینت سه بعدی زمان زیادی طول می‌کشد تا سرمایه‌گذاران کوتاه‌مدت را ناامید کنند. اجزای سازنده یک هواپیما، علیرغم عمر مفید بیش از 3 سال، از همان لحظه طراحی «تنظیم» می شوند. تقریباً هیچ دامنه نوآوری وجود ندارد - اینها باید منتظر راه اندازی نسل بعدی باشند.

توانایی تغییر یک محدودیت واحد و اجازه دادن به الگوریتمی مانند Stable Diffusion برای بازسازی پارامترهای طراحی و تولید، سرعت پذیرش نوآوری‌های جدید را به میزان قابل توجهی افزایش می‌دهد و به ما امکان می‌دهد محصولات سبک‌تر و با عملکرد بهتر و سریع‌تر بسازیم. همانطور که در فرمول 1 یا طراحی سیستم‌ها انجام می‌دهند، مهندسان آینده به‌عنوان مدیران محدودیت‌ها عمل خواهند کرد که بتوانند اهداف و محدودیت‌های محصول را با کلمات و با ارجاع به منابع داده بیان کنند.

بدون تسریع فرآیند مهندسی برای محصولات جدید و موجود به این روش، تقریباً هیچ وسیله ای برای دستیابی به اهداف بلندپروازانه پایداری که باید برای خود تعیین کنیم، نداریم. برای انجام این کار، ابتدا باید روی زبانی توافق کنیم که بتوانیم از آن برای برقراری ارتباط فراتر از طراحی ها استفاده کنیم. این مدل معنایی جدید شکاف آشکار در نوآوری های ذکر شده در بالا است. تعدادی از شرکت ها قبلاً شروع به آزمایش با آن کرده اند، مانند nتوپولوژی با مفاهیم فیلدها. و با این حال، بر خلاف الگوریتم هایی که مدل معنایی تغذیه می کند، سرعت تغییر کند است. الگوریتم جدید انویدیا بیش از دو برابر سریعتر از آن گزارش شده است DreamFusion، کمتر از 2 ماه پیش منتشر شد. شرکت‌های تولیدی و مهندسی باید در حال حاضر روی ایده‌های خود به روش‌های جدید و سازگار با آینده کار کنند تا از فرصت‌هایی که این انفجار هوش مصنوعی مولد دارد، حداکثر استفاده را ببرند. سرعت تغییر در الگوریتم‌ها بار دیگر نشان داد که قانون مورس در همه جا که ابزارها دیجیتالی می‌شوند، اعمال می‌شود. چالش همچنان ناتوانی انسانی ما در پذیرش این تغییر و به کارگیری روش‌های ارتباطی جدید است که قادر به باز کردن پتانسیل آن‌ها هستند، علی‌رغم فوریت این کار.

منبع: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/