هوش مصنوعی جدید صدای خودرو ممکن است بیش از آهنگسازی بهبود یابد

هالیوود همواره هوش مصنوعی (AI) را به عنوان لایه عملیاتی ربات‌های دیستوپیایی که جایگزین انسان‌های ناآگاه می‌شوند و درگیری مرکزی رو به افزایش را ایجاد می‌کنند، به تصویر می‌کشد. در بهترین حالت، می‌توانید هیلی جوئل اوسمنت جوانی را تصور کنید که نقش دیوید، بچه‌ی خودآگاه و مصنوعی را در دنیای شهرهای ساحلی اسپیلبرگ با کلاهک‌های قطبی، ذوب‌شده و سیل‌زده بازی می‌کند (آشنایی به نظر می‌رسد؟) هوش مصنوعی: هوش مصنوعی که (هشدار اسپویلر) فقط خودش را می کشد. یا شاید صدای رابین ویلیامز را به خاطر بیاورید مرد دوساله که یک بار دیگر، یک ربات خودآگاه است که در تلاش برای پیشرفت است و (یک بار دیگر در هشدار اسپویلر)، در نهایت تنها قربانی او می شود. و البته، اشاره تقریباً کلیشه ای به آن وجود دارد فسخ کننده و دنیای پسا آخرالزمانی آن با ماشین‌هایی که تلاش می‌کنند انسان‌ها را از بین ببرند و خب، (هشدار نه چندان خراب‌کننده) قربانیان زیادی را طی چند دهه. با این حال، در هیچ یک از این سناریوها، انسان ها با زندگی بهتر همزیستی نمی کنند، چه رسد به افزایش سرگرمی و ایمنی.

با این حال، این واقعیت جدید است. الگوریتم‌های هوش مصنوعی را می‌توان در طرح‌های صوتی گنجاند و به طور مداوم از طریق به‌روزرسانی‌های هوایی بهبود داد تا تجربه رانندگی را بهبود بخشد. و در تضاد مستقیم با این نمونه های هالیوودی، چنین هوش مصنوعی ممکن است در واقع احتمال زنده ماندن انسان را افزایش دهد.

فقط برای لذت

تا همین اواخر، تمام رابط کاربری (UI) از جمله توسعه صدا به برنامه نویسی پیچیده توسط کدگذاران خبره در طول سی و شش (36) ماه استاندارد یک برنامه وسیله نقلیه نیاز داشت. یک ظاهر طراحی ورق فلزی و جعبه های الکترونیکی به طور موازی فقط برای کالیبره کردن عناصر منفرد در اواخر توسعه مشخص، منبع و توسعه یافته اند. صداهای مارک دار امضاهای صوتی همه ابتکارات مجزا در همان طراحی سیستم کم خونی که دارد میلیاردها دلار برای تولیدکنندگان هزینه کرد.

اما هوش مصنوعی روشی بسیار انعطاف‌پذیرتر و کارآمدتر را برای نزدیک شدن به طراحی تجربه صوتی امکان پذیر کرده است. جاش موریس، مدیر مهندسی یادگیری ماشین DSP Concept می‌گوید: «آنچه می‌بینیم همگرایی روندها است. "صوت در حال تبدیل شدن به یک ویژگی غالب در خودرو است، اما در عین حال شما شاهد قوی تر شدن پردازنده های مدرن با حافظه و قابلیت های بیشتر هستید."

و در نتیجه، با استفاده از یک پلتفرم توسعه متمرکز بر سیستم، هوش مصنوعی و این پردازنده‌های قوی‌تر، سطح جدیدی از پاسخ‌دهی تطبیقی ​​و بلادرنگ را در اختیار رانندگان و مسافران قرار می‌دهد. . استیو ارنست، رئیس توسعه کسب‌وکار خودرو در DSP می‌گوید: «به‌جای نیاز تاریخی به نوشتن مجموعه‌ای از کد برای هر سناریوی قابل تصور، هوش مصنوعی پاسخگویی سیستم را بر اساس آگاهی آموخته‌شده از شرایط و رویدادهای محیطی هدایت می‌کند.

راه بسیار واضح برای استفاده از چنین سیستم یادگیری، «صدا زدایی» خودرو است تا بتوان صدای ممتاز را با وجود تعویض تایرهای زمستانی یا سایر تغییرات محیطی، تنظیم و بهبود بخشید. ولی LG Electronics الگوریتم هایی را توسعه داده است که در Audio Weaver در مفهوم DSP اجرا می شوند پلت فرمی که امکان بهبود صدای دیالوگ فیلم را در حین سرگرمی های صندلی عقب فراهم می کند تا آن را در مقابل انفجارهای داخل فیلم برجسته کند و در نتیجه به مسافر امکان می دهد محتوای انتقادی را بهتر بشنود.

یکی دیگر از جنبه های غیر آشکار این است که چگونه صداهای صوتی مارک دار در میان نویزهای دیگر هماهنگ می شوند. آیا این وسیله نقلیه خاص برای پخش در حالی که صداهای دیگر مانند رادیو و زنگ‌های زنگ به طور خودکار خاموش می‌شوند، به دنباله راه‌اندازی در حال افزایش نیاز دارد؟ هر تجربه قابل تنظیم است.

احتمال رشد بیشتر

از آنجایی که جهان در حال رقابت با خودروهای الکتریکی و رانندگی خودران است، فرکانس و نیازهای هشدارهای صوتی احتمالاً به شدت تغییر خواهد کرد. به عنوان مثال، مهندس ایمنی یک تاکسی خودران نمی‌تواند تصور کند که مسافران در نزدیکی یک نمایشگر بصری هستند، وقتی هشدار به موقع لازم است. و این هشدار چقدر شنیدنی است نزدیک به 25 میلیون آمریکایی دارای معلولیت وسایل نقلیه خودران باید برای چه کسانی امکانات جدید حرکتی را باز کنند؟ ارنست می گوید: «صوت اکنون فقط برای گوش دادن به آهنگ مورد علاقه شما نیست. در رانندگی خودران، انواع هشدارهایی وجود دارد که برای درگیر نگه داشتن راننده یا هشدار دادن به راننده غیر درگیر در مورد اتفاقاتی که در اطراف آنها می گذرد، لازم است.

آدام لونسون، رئیس بازاریابی DSP Concepts، می گوید: «و آنچه که آن را چالش برانگیزتر می کند، همه مواردی هستند که به طور همزمان در داخل خودرو مدیریت می شوند: تلفن، صدای فراگیر یا فضایی، صدای موتور، صدای جاده، سیستم های هشدار صوتی خودرو، سیستم های صوتی و غیره ما دوست داریم بگوییم پیچیده ترین محصول صوتی ماشین است.

به عنوان مثال، سناریویی را تصور کنید که در آن یک راننده حالت رانندگی خودکار را در بزرگراه فعال کرده است، آهنگ های خود را بلند کرده است و به طرز خوشایندی نسبت به نزدیک شدن وسیله نقلیه اضطراری ناآگاه است. خودرو با چه دقت (و فاصله) تشخیص آژیر با استفاده از میکروفون(های) خودرو به راننده شبه حواس پرت خود هشدار می دهد؟ چگونه باید این هشدار ارائه شود تا بر سر و صدای محیط غلبه کند، توجه کافی را ارائه دهد اما راننده را بیهوده مبهوت نکند؟ همه این‌ها را می‌توان از طریق مدل‌های از پیش توسعه‌یافته، آموزش مقدماتی با آژیرهای مختلف و متعاقباً تنظیم مبتنی بر ابر تنظیم کرد. موریس توضیح می دهد: «این جایی است که ارکستراسیون کلی واقعاً مهم می شود. ما می توانیم خروجی مدل [تشخیص هوش مصنوعی] را گرفته و آن را به مکان های مختلف خودرو هدایت کنیم. ممکن است صدا را کم کنید، یک سیگنال هشدار صوتی را فعال کنید و چیزی را روی داشبورد فلش بزنید تا راننده توجه کند."

همین امر در مورد هشدارهای خارجی نیز صادق است. به عنوان مثال، وسیله نقلیه برقی آرام ممکن است برای عابران پیاده زنگ هشدار تنظیم کرده باشد. و بنابراین کالیبراسیون های جدید را می توان به صورت آفلاین ایجاد کرد و به عنوان به روز رسانی نرم افزار بر اساس نوآوری فعال شده در وسایل نقلیه بارگیری کرد.

نوآوری در همه جا. و هوش مصنوعی به جای ایجاد دنیای دیستوپیایی هالیوود، تجربه اتوپیایی را تغذیه می کند.

پیش بینی نویسنده

در اینجا پیش بینی من از هفته (و فقط سه شنبه است، دوستان): تکامل بعدی صدا باید شامل یک حلقه بازخورد کامل و آنی از جمله لذت ظریف و لحظه ای کاربران باشد. بله، بسیاری از طراحی فعلی احتمالاً تجربه را بهبود می بخشد، اما کالیبراسیون مداوم طراحی کاربر محور (UCD) ممکن است علاوه بر این بر اساس عبارات، زبان بدن و نظرات مسافران بهبود یابد، و بدین ترتیب رضایت فردی در زمان واقعی تنظیم شود. همه توانمندسازها همه وجود دارند: دوربین، هوش مصنوعی، پردازنده ها و یک پلت فرم تطبیقی.

بله، قبلاً شنیده بودیم نورپردازی خلق و خوی تطبیقی و تشخیص از راه دور خستگی، استرس، و غیره برای بهبود ایمنی، اما هیچ چیزی که تجربه ترکیبی را بر اساس الگوریتم‌های یادگیری بی‌درنگ تمام حسگرهای کاربر افزایش دهد.

شاید من بیش از حد برون یابی می کنم. اما درست مانند شخصیت رابین ویلیامز، من دو قرن را در برگرفته ام... پس شاید من نیز فقط نسبت به آنچه ممکن است انسان ها بخواهند حساس باشم.

منبع: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/