نگاهی به آزمون های موفقیت آمیز ChatGPT این هوش مصنوعی از پس هر امتحانی بر می آید!

نیوزتل: نیوزتل: ربات هوش مصنوعی «ChatGPT» در راه تبدیل شدن به یک پزشک مجازی، یک وکیل و تحلیلگر تجاری است. در اینجا نگاهی خواهیم داشت به لیستی از امتحانات پیشرفته ای که این ربات هوش مصنوعی تا حالا با موفقیت پشت سر گذاشته است.
به گزارش نیوزتل به نقل از ایسنا، ربات «ChatGPT» یک ربات مخصوص گفتگو یا چت است که بر روی خانواده مدلهای زبان بزرگ ساخته شده و با روشهای فنی یادگیری نظارت شده و تقویتی به خوبی تنظیم شده است.
این ربات در دسامبر ۲۰۲۲ با نظرات مثبتی مواجه گردید و بعنوان مثال نیویورک تایمز آنرا «بهترین ربات چت هوش مصنوعی که تاکنون برای عموم معرفی شده» نامید و گاردین هم گفته است که می تواند متنی با جزئیات چشم گیر و مانند انسان تولید نماید.
«ChatGPT» آخرین مورد از یک مجموعه هوش مصنوعی است که شرکت سازنده از آن بعنوان GPTs یاد می کند و مخفف عبارت «مبدل از پیش آموزش دیده مولد»(Generative Pre-Trained Transformer) است.
بیشتر بخوانید:
هر آنچه باید در مورد «ChatGPT» بدانید
یکی از خصوصیت های کلیدی «ChatGPT» توانایی آن در ایجاد پاسخ های متنی انسان مانند به درخواست ها است. این سبب می شود که برای طیف گسترده ای از برنامه ها مانند ایجاد ربات های چت برای عرضه خدمات به مشتری، ایجاد پاسخ به سؤالات در انجمن های آنلاین یا حتی ایجاد محتوای شخصی سازی شده برای پست های شبکه های اجتماعی مفید باشد.
اما این ربات هوش مصنوعی باهوش تابحال چه امتحاناتی را پشت سر گذاشته است؟

آزمون MBA مدرسه بازرگانی وارتون(Wharton)

کریستین ترویش(Christian Terwiesch) استاد مدرسه بازرگانی وارتون اخیرا این فناوری را با سوالاتی از امتحان نهایی مدیریت عملیات که زمانی درس مورد نیاز همه دانشجویان MBA بوده است، آزمایش کرده و یافته های خویش را منتشر نموده است.
ترویش شاهد عملکرد فوق العاده این ربات در پاسخ دهی به سوالات عملیات اساسی بر مبنای مطالعات موردی بود.
مطالعه موردی به بررسی متمرکز و عمیق یک فرد، گروه یا شرکت گفته می شود و روش متداولی است که مدارس کسب و کار به دانش آموزان آموزش می دهند.
باآنکه در موارد دیگر، «ChatGPT» اشتباهات پیش پا افتاده محاسباتی مرتکب شد که ترویش فکر می کرد در سطح ریاضیات کلاس ششم بوده است. ترویش همینطور تصریح کرد که نسخه فعلی «ChatGPT» نمی تواند سوالات پیشرفته تر از تحلیل و بررسی فرایند را حتی اگر آنها بر مبنای الگوهای نسبتاً استاندارد باشند، بررسی کند.
در نهایت، او افزود که با عنایت به عملکرد این ربات در امتحان، نمره آنرا B یا B- درجه بندی می کند.

آزمون مجوز پزشکی ایالات متحده

محققان «ChatGPT» را از راه آزمون مجوز پزشکی ایالات متحده مورد بررسی قرار دادند. این یک آزمون سه قسمتی برای پزشکانی است که می خواهند بین دانشکده پزشکی و رزیدنتی یکی را انتخاب کنند. محققان یافته های خویش را در مقاله ای که در ماه دسامبر سال ۲۰۲۲ انتشار یافت، عرضه کردند.
چکیده مقاله ی آنها خاطرنشان می کند که «ChatGPT» بدون بهره مندی از هرگونه آموزش یا تقویت تخصصی در هر سه امتحان نزدیک به آستانه قبولی بوده است. علاوه بر این، «ChatGPT» سطح بالایی از هماهنگی و درک را در توضیحات خود نشان داد.
در نهایت، نتایج نشان داده است که مدلهای زبانی بزرگ که «ChatGPT» بر مبنای آنها آموزش دیده است امکان دارد “پتانسیل” کمک به آموزش پزشکی و حتی تصمیم گیری بالینی را داشته باشد.
این تحقیق هنوز در دست بررسی می باشد.

نوشتن مقالات

طولی نکشید که دانش آموزان آغاز به استفاده از «ChatGPT» برای نوشتن مقاله کنند و استادها نگران سرقت ادبی شوند.
در ماه دسامبر، متیو اس. شوارتز(Matthew S. Schwartz)، تولید کننده پادکست بلومبرگ، در توییتی نوشت که نوشتن مقاله در خانه دیگر وجود نخواهد داشت. او تصریح کرد که یک مقاله دانشکده حقوق را به «ChatGPT» سپرده و بلافاصله یک پاسخ قوی دریافت کرده است.
در نمونه ای دیگر، یک استاد فلسفه در دانشگاه «فورمن»(Furman)، دریافت که یکی از دانشجوها مقاله اش را با استفاده از هوش مصنوعی نوشته است. او متوجه شد که این مقاله حاوی اطلاعات غلط است.
این استاد دانشگاه به اینسایدر اظهار داشت: کلمه به کلمه این مقاله به خوبی نوشته شده بود. با این وجود، زمانی که او با دقت بیشتری به آن نگاه کرد، متوجه شد که دانشجو ادعایی در مورد فیلسوف دیوید هیوم(David Hume) مطرح کرده است که هیچ معنایی ندارد و صرفا اشتباه است.
در یک مصاحبه در ماه ژانویه، سام آلتمن(Sam Altman) مدیر عامل شرکت «OpenAI» که «ChatGPT» را ساخته است اظهار داشت که باآنکه این شرکت راه هایی جهت کمک به مدارس در تشخیص سرقت ادبی ابداع خواهد کرد، اما نمی توان این راه ها را به صورت کامل تضمین نمود.

آزمون میکروبیولوژی

الکس برزو(Alex Berezow) روزنامه نگار علمی و سردبیر اجرایی «Big Think»، هوش مصنوعی «ChatGPT» را با یک آزمون میکروبیولوژی ۱۰ سوالی آزمایش کرد.
برزو، که دارای مدرک دکترای میکروبیولوژی است، تصریح کرد که این سوالات برای امتحان نهایی دانشجویان سطح کالج مناسب می باشد. او اظهار داشت که «ChatGPT» اعجاب انگیز عمل کرده است.
برای مثال در یک سوال، برزو پرسید: یک بیمار اورژانسی با سردرد وحشتناک و سفتی گردن رجوع می کند. پزشک برای جمع آوری مایع مغزی نخاعی بذل نخاع تجویز می کند. «رنگ آمیزی گرم» (Gram staining) مایع مغزی نخاعی وجود دیپلوکوک های گرم منفی را نشان داده است. تشخیص چیست؟
«ChatGPT» به درستی پاسخ داد: بر مبنای اطلاعاتی که عرضه کردید، رنگ آمیزی گرم مایع مغزی نخاعی(CSF) وجود دیپلوکوک های گرم منفی را نشان داده است که باکتری هایی هستند که به صورت معمول بیضی شکل هستند و به صورت جفت ایجاد می شوند. این یافته با تشخیص مننژیت مطابقت دارد.

امتحانات دانشکده حقوق

«ChatGPT» اخیرا امتحانات چهار دوره در دانشکده حقوق دانشگاه مینه سوتا را پشت سر گذاشته است و مقاله ای توسط چهار استاد دانشکده حقوق در این دانشکده در مورد آن نوشته شده است.
در مجموع، این ربات هوش مصنوعی به بیشتر از ۹۵ سوال چند گزینه ای و ۱۲ سوال تشریحی پاسخ داده است. اساتید بدون این که از ربات بودن پاسخ دهنده اطلاع داشته باشند به او نمره دادند. در نهایت، «ChatGPT» موفق به دریافت نمره ای کم اما قابل قبول در هر چهار درس» یعنی تقریبا معادل C+ شد.
محققان به نتایج این امر برای وکلا و آموزش حقوق اشاره کردند. آنها نوشتند: باآنکه «ChatGPT» دانشجوی حقوق متوسطی بود، اما عملکرد آن برای کسب مدرک JD(یک مدرک دکترای حرفه ای در رشته ی حقوق) از یک دانشکده حقوق با فرایند پذیرش بسیار دقیق، کافی بود. با این فرض که عملکرد آن در سرتاسر دوره ثابت می ماند و با فرض نادیده گرفتن سایر الزامات فارغ التحصیلی که شامل مهارت های مختلف می شود، در زمانی که برگزاری آزمون از راه دور به یک امر عادی تبدیل گشته است، این مورد به صورت بالقوه می تواند منجر به این شود که یک دانشجوی حقوق از «ChatGPT» برای کسب مدرک JD استفاده نماید و نمره او نشان دهنده توانایی ها یا آمادگی او برای وکالت نخواهد بود.

منبع: