ChatGPT V4 به نوار، SAT ها می رسد و می تواند اکسپلویت ها را در قراردادهای ETH شناسایی کند

GPT-4، آخرین نسخه چت ربات هوش مصنوعی (AI)، ChatGPT، می‌تواند در آزمون‌های دبیرستان و آزمون‌های دانشکده حقوق با رتبه‌بندی در صدک ۹۰ قبول شود و دارای قابلیت‌های پردازشی جدیدی است که با نسخه قبلی امکان‌پذیر نبود.

ارقام نمرات آزمون GPT-4 در 14 مارس توسط خالق آن OpenAI به اشتراک گذاشته شد و نشان داد که می‌تواند ورودی‌های تصویر، صدا و ویدئو را به متن تبدیل کند و «دستورالعمل‌های ظریف‌تر» را خلاقانه‌تر و قابل اعتمادتر مدیریت کند.

OpenAI اضافه کرد: "این آزمون یک آزمون شبیه سازی شده وکالت را با امتیازی در حدود 10 درصد از شرکت کنندگان برتر قبول می کند." در مقابل، امتیاز GPT-3.5 حدود 10 درصد پایین بود.

ارقام نشان می‌دهند که GPT-4 در امتحان LSAT در صدک 163 نمره 88 را به دست آورد - دانش‌آموزان کالج آزمون باید در ایالات متحده قبول شوند تا در دانشکده حقوق پذیرفته شوند.

*نتایج آزمون GPT-4 و GPT-3.5 در طیف وسیعی از امتحانات اخیر ایالات متحده. منبع:* *OpenAI*

نمره GPT4 آن را در موقعیت خوبی برای پذیرش در 20 دانشکده حقوق برتر قرار می دهد و تنها چند نمره کمتر از نمرات گزارش شده مورد نیاز برای پذیرش در دانشکده های معتبر مانند هاروارد، استنفورد، پرینستون یا ییل است.

نسخه قبلی ChatGPT تنها امتیاز 149 را در LSAT کسب کرده است که آن را در 40 درصد پایین قرار می دهد.

GPT-4 همچنین در آزمون وکالت یکنواخت امتیاز 298 از 400 را کسب کرد - آزمونی که توسط دانشجویانی که اخیراً فارغ التحصیل شده اند و به آنها اجازه می دهد به عنوان وکیل در هر حوزه قضایی ایالات متحده مشغول به کار شوند.

*نمرات UBE باید برای وکالت در هر حوزه قضایی ایالات متحده پذیرفته شود. منبع:* *همایش ملی بازرسان وکالت*

نسخه قدیمی ChatGPT در این آزمون با مشکل مواجه شد و با امتیاز 10 از 213 در رده 400 درصد پایین قرار گرفت.

در مورد آزمون‌های SAT Evidence-based Reading & Writing و SAT Math که توسط دانش‌آموزان دبیرستانی ایالات متحده برای اندازه‌گیری آمادگی دانشگاهی آنها گرفته می‌شود، GPT-4 به ترتیب در صدک 93 و 89 امتیاز کسب کرد.

GPT-4 در علوم "سخت" نیز سرآمد بود، و نمرات صدک بسیار بالاتری را در AP Biology (85-100٪)، شیمی (71-88٪) و فیزیک 2 (66-84٪) به دست آورد.

با این حال، امتیاز AP Calculus آن نسبتاً متوسط بود و در صدک 43 تا 59 قرار گرفت.

یکی دیگر از زمینه هایی که GPT-4 فاقد آن بود، در امتحانات ادبیات انگلیسی بود که نمرات در صدک 8 تا 44 را در دو آزمون جداگانه ارسال کرد.

OpenAI گفت که GPT-4 و GPT-3.5 این تست ها را از آزمون های عملی 2022-2023 گرفته اند، و "هیچ آموزش خاصی" توسط ابزارهای پردازش زبان انجام نشده است:

ما هیچ آموزش خاصی برای این امتحانات انجام ندادیم. اقلیتی از مشکلات در امتحانات توسط مدل در طول آموزش دیده شد، اما ما معتقدیم که نتایج معرف است.

نتایج باعث ترس در جامعه توییتر نیز شد.

مرتبط: ChatGPT چگونه بر فضای Web3 تأثیر می گذارد؟ صنعت پاسخ می دهد

نیک آلموند، بنیانگذار FactoryDAO گفته شده 14,300 دنبال کننده او در توییتر در 14 مارس که GPT4 قرار است "مردم را بترساند" و سیستم آموزشی جهانی را "فروپاشی" خواهد کرد.

تئوری ارزیابی برای چندین سال بخش بزرگی از زندگی من بود. من سالها پیش به این روز فکر می کردم. من در آن زمان به معنای واقعی کلمه شبیه میل لنگ ساکن به نظر می رسیدم.
اما... واقعاً این بدان معنی است که از این نقطه به بعد هر چیزی به جز ارزیابی نادیده گرفته شده به پایان رسیده است.
— drnick ️² (@DrNickA) مارس 14، 2023

مدیر سابق Coinbase، Conor Grogan، گفت که او یک قرارداد هوشمند اتریوم زنده را در GPT-4 وارد کرده است و فوراً به چندین «آسیب‌پذیری امنیتی» اشاره کرده و نحوه سوء استفاده از کد را توضیح داده است:

من یک قرارداد زنده اتریوم را در GPT-4 ریختم.
در یک لحظه، تعدادی از آسیب‌پذیری‌های امنیتی را برجسته کرد و به مناطق سطحی اشاره کرد که می‌توان از قرارداد بهره‌برداری کرد. سپس روش خاصی را تأیید کرد که من می‌توانم از قرارداد استفاده کنم pic.twitter.com/its5puakUW
— کنر (@jconorgrogan) مارس 14، 2023

ممیزی های قبلی قرارداد هوشمند در ChatGPT نشان داد که نسخه اول آن نیز قادر به شناسایی اشکالات کد تا حد معقولی است.

Rowan Cheung، بنیانگذار خبرنامه هوش مصنوعی "The Rundown" ویدئویی از GPT را به اشتراک گذاشت که یک وب سایت جعلی را که با دست طراحی شده بود روی یک تکه کاغذ به صورت کد رونویسی می کند.

من به تازگی تماشا کردم که GPT-4 یک طرح دستی را به یک وب سایت کاربردی تبدیل می کند.
این دیوانه کننده است. pic.twitter.com/P5nSjrk7Wn
— روآن چونگ (@rowancheung) مارس 14، 2023