اینتل و AMD در کنفرانس بینالمللی مدارهای حالت جامد این هفته درباره برخی از پیشرفتهترین طراحیهای تراشه خود بحث کردند و نقش بستهبندی پیشرفته را در محصولات تراشههای پیشرفته آینده خود برجسته کردند. در هر دو مورد، قابلیتهای عملکرد چشمگیر جدید ناشی از رویکردهای مدولار است که بلوکهای ساختمانی ساخته شده در کارخانههای مختلف با استفاده از فرآیندهای تولید متفاوت را ترکیب میکند. این پتانسیل گسترده بسته بندی تراشه در آینده نوآوری نیمه هادی ها را نشان می دهد.
بازار هدف اینتل برای Ponte Vecchio به عنوان یک ماژول با کارایی بالا است که در سیستم های مرکز داده بزرگ ساخته می شود. این یک واحد پردازش گرافیکی (GPU) است و برای کاربردهای هوش مصنوعی، یادگیری ماشین و گرافیک کامپیوتری طراحی شده است. نام این پل سنگی قرون وسطایی است که پیازا دلا سیگنوریا را در یک طرف رودخانه آرنو در فلورانس ایتالیا به پالازو پیتی در طرف دیگر متصل می کند. یکی از نکات برجسته طراحی این است که چگونه تعداد زیادی از تراشه های تخصصی را به هم متصل می کند - بلوک های ساختمان مدار مجتمع که قرار است برای ساختن سیستم های کامل با هم ترکیب شوند.
Ponte Vecchio از هشت "کاشی" ساخته شده بر روی پیشرفته ترین فرآیند 5 نانومتری شرکت تولید نیمه هادی تایوان (TSMC) استفاده می کند. هر کاشی دارای هشت "X" استeهسته ها، و هر یک از هشت هسته به نوبه خود دارای هشت موتور بردار و هشت موتور ماتریسی تخصصی است. کاشی ها در بالای یک "کاشی پایه" قرار می گیرند که آنها را با یک پارچه سوئیچ غول پیکر به حافظه و دنیای خارج متصل می کند. این کاشی پایه با استفاده از فرآیند "Intel 7" این شرکت ساخته شده است، که نام جدیدی برای فرآیند تولید SuperFin 10 نانومتری این شرکت است. همچنین یک سیستم حافظه با کارایی بالا به نام "RAMBO" وجود دارد که مخفف عبارت Random Access Memory, Bandwidth Optimized است که بر روی یک کاشی پایه با استفاده از فناوری اتصال Intel 7 Foveros ساخته شده است. بسیاری از بلوک های ساختمانی دیگر نیز گنجانده شده است.
طرح Ponte Vecchio یک مطالعه موردی در یکپارچگی ناهمگن است - ترکیبی از 63 کاشی مختلف (47 کاشی که عملکرد محاسباتی و 16 برای مدیریت حرارتی را انجام میدهند) با مجموع بیش از 100 میلیارد ترانزیستور در یک بسته منفرد که 77.5 x 62.5 میلیمتر است (تقریباً 3 x. 2.5 اینچ). خیلی وقت پیش نبود که آنقدر توان محاسباتی یک انبار را پر کرد و نیاز به اتصال خودش به شبکه برق داشت. چالش های مهندسی در چنین طراحی بسیار زیاد است:
اتصال تمام قطعات. طراحان به راهی برای انتقال سیگنال ها بین تمام تراشه های متفاوت نیاز دارند. در قدیم این کار را با سیم یا رد روی بردهای مدار چاپی انجام می دادند و تراشه ها را با لحیم کاری به بردها متصل می کردند. اما مدتها پیش با افزایش تعداد سیگنال ها و سرعت، بخار آن تمام شد. اگر همه چیز را در یک تراشه قرار دهید، می توانید آنها را با ردپای فلزی در انتهای فرآیند تولید متصل کنید. اگر می خواهید از چند تراشه استفاده کنید، به این معنی است که به تعداد زیادی پین اتصال نیاز دارید و می خواهید فاصله های اتصال کوتاه باشد. اینتل از دو فناوری برای پشتیبانی از آن استفاده می کند. اولی "پل اتصال چند قالبی تعبیه شده" آن (EMIB) است که از یک برش کوچک سیلیکون ساخته شده است که می تواند صدها یا هزاران اتصال را در یک زمان ایجاد کند، و دومی فناوری انباشته قالب Foveros آن است. در پردازنده موبایل Lakefield استفاده می شود.
اطمینان حاصل کنید که تمام قطعات هماهنگ هستند. هنگامی که تعداد زیادی از قطعات متفاوت را به هم وصل کردید، باید مطمئن شوید که همه قطعات می توانند به طور همزمان با یکدیگر صحبت کنند. این معمولاً به معنای توزیع یک سیگنال زمانبندی است که به عنوان ساعت شناخته میشود، به طوری که همه تراشهها بتوانند در حالت قفل کار کنند. معلوم میشود که این امر بیاهمیت نیست، زیرا سیگنالها تمایل به کج شدن دارند و محیط بسیار پر سر و صدا است و سیگنالهای زیادی به اطراف میچرخند. برای مثال، هر کاشی محاسباتی بیش از 7,000 اتصال در فضای 40 میلیمتر مربع دارد، بنابراین همگامسازی بسیار زیاد است.
مدیریت گرما. کاشی های مدولار هر کدام به قدرت زیادی نیاز دارند و ارائه آن به طور یکنواخت در کل سطح در حالی که گرمای تولید شده را از بین می برد یک چالش بزرگ است. تراشه های حافظه مدتی است که روی هم چیده شده اند، اما گرمای تولید شده به طور نسبتاً یکنواختی توزیع می شود. تراشهها یا کاشیهای پردازنده بسته به میزان استفاده از آنها میتوانند نقاط داغ داشته باشند، و مدیریت گرما در یک پشته تراشههای سه بعدی آسان نیست. اینتل از فرآیند متالیزاسیون برای قسمتهای پشتی تراشهها استفاده کرد و آنها را با پخشکنندههای حرارتی ادغام کرد تا 3 وات پیشبینیشده تولید شده توسط سیستم Ponte Vecchio را مدیریت کند.
نتایج آزمایشگاهی اولیه که اینتل گزارش داد شامل عملکرد بیش از 45 ترافلاپس بود. ابررایانه Aurora که در آزمایشگاه ملی آرگون ساخته می شود از بیش از 54,000 Ponte Vecchios به همراه بیش از 18,000 پردازنده نسل بعدی Xeon استفاده می کند. Aurora دارای حداکثر عملکرد هدفمند بیش از 2 Exaflops است که 1,000 برابر بیشتر از یک ماشین Teraflop است. در اواسط دهه 1990، زمانی که من در تجارت ابرکامپیوتر فعالیت می کردم، یک ماشین ترافلوپ یک پروژه علمی 100 میلیون دلاری بود.
AMD's Zen 3
AMD در مورد هسته ریزپردازنده نسل دوم Zen 3 خود که بر اساس فرآیند 7 نانومتری TSMC ساخته شده است صحبت کرد. این هسته ریزپردازنده برای استفاده در بخشهای بازار AMD، از دستگاههای تلفن همراه کم مصرف، رایانههای رومیزی تا قدرتمندترین سرورهای مرکز داده آن، طراحی شده است. اصل اصلی این استراتژی بسته بندی هسته Zen 3 با عملکردهای پشتیبانی به عنوان یک "مجتمع هسته" بر روی یک چیپلت بود که مانند کاشی های اینتل به عنوان بلوک های ساختمانی مدولار عمل می کرد. بنابراین آنها می توانند هشت چیپلت را برای یک دسکتاپ یا سرور با کارایی بالا، یا چهار تراشه برای یک سیستم ارزشی، مانند یک سیستم خانگی ارزان قیمت که ممکن است بخرم، با هم بسته بندی کنند. AMD همچنین تراشهها را بهصورت عمودی با استفاده از روشهایی که از طریق سیلیکون vias (TSV) نامیده میشوند، روی هم قرار میدهد، راهی برای اتصال چند تراشه که روی هم قرار گرفتهاند. همچنین میتواند دو تا هشت عدد از این چیپلتها را با یک سرور ساختهشده در فرآیند ۱۲ نانومتری GlobalFoundries ترکیب کند تا 12 عدد را بسازد.rd نسل تراشه های سرور EPYC
فرصت بزرگی که Ponte Vecchio و Zen 3 برجسته می کنند، توانایی ترکیب و تطبیق تراشه های ساخته شده با استفاده از فرآیندهای مختلف است. در مورد اینتل، این شامل قطعات ساخته شده به تنهایی و همچنین پیشرفته ترین فرآیندهای TSMC بود. AMD می تواند قطعات TSMC و GlobalFoundries را ترکیب کند. مزیت بزرگ اتصال چیپلتها یا کاشیهای کوچکتر بهجای ساختن یک تراشه بزرگ، این است که نمونههای کوچکتر بازده تولید بهتری خواهند داشت و بنابراین هزینه کمتری دارند. همچنین میتوانید چیپلتهای جدید را با چیپلتهای اثباتشده قدیمیتر که میدانید خوب هستند یا با فرآیندی ارزانتر ساخته شدهاند، ترکیب و تطبیق دهید.
هر دو طراحی AMD و Intel فنی هستند تورهای نظامی. بدون شک آنها نشان دهنده کار سخت و یادگیری هستند و سرمایه گذاری عظیمی از منابع را نشان می دهند. اما همانطور که IBM در دهه 360 زیرسیستم های مدولار را در سیستم اصلی خود یعنی System/1960 معرفی کرد و کامپیوترهای شخصی در دهه 1980 ماژولار شدند، پارتیشن بندی ماژولار میکروسیستم های سیلیکونی که نمونه ای از این دو طراحی بود و با بسته بندی تراشه های پیشرفته امکان پذیر شد، نوید یک تغییر تکنولوژی قابل توجه است. مسلماً بسیاری از قابلیتهای نشاندادهشده در اینجا هنوز از دسترس بیشتر استارتآپها دور است، اما میتوانیم تصور کنیم که وقتی این فناوری در دسترستر شود، موجی از نوآوریهای ترکیبی و تطبیق را راهاندازی خواهد کرد.
منبع: https://www.forbes.com/sites/willyshih/2022/02/22/intels-ponte-vecchio-and-amds-zen-3-show-the-promise-of-advanced-semiconductor-packaging- فن آوری/