خانه تکنولوژی هوش مصنوعی تحقیق جدید: ChatGPT در پاسخ‌دادن به سؤالات برنامه‌نویسی چندان دقیق نیست

تحقیق جدید: ChatGPT در پاسخ‌دادن به سؤالات برنامه‌نویسی چندان دقیق نیست

توسط

9 خرداد 1403

چت‌بات هوش مصنوعی ChatGPT به‌صورت تقریبی تنها در نیمی از موارد به سؤالات پاسخ درست می‌دهد.

تیمی از دانشمندان حوزه کامپیوتر در دانشگاه پردو دریافتند که چت‌بات هوش مصنوعی محبوب ChatGPT در پاسخ به سؤالات برنامه‌نویسی کامپیوتر خطاهای بسیاری دارد و پاسخ‌های اشتباه بسیاری می‌دهد.

این گروه در مقاله خود که به‌عنوان بخشی از مجموعه مقالات کنفرانس CHI در مورد عوامل انسانی در سیستم‌های محاسباتی منتشر شد، توضیح می‌دهد که چگونه سؤالات را از وب‌سایت StackOverflow بیرون آورده و آن‌ها را به ChatGPT داده و سپس میزان دقت آن را هنگام پاسخ‌دهی اندازه‌گیری کرده‌اند.

این تیم یافته‌های خود را در کنفرانس عوامل انسانی در سیستم‌های محاسباتی (CHI 2024) که از 11 تا 16 می برگزار شد، ارائه کردند.

دانشمندان میزان دقت ChatGPT را در پاسخ به سؤالات برنامه‌نویسی بررسی کردند
چت‌بات هوش مصنوعی ChatGPT و سایر LLM‌ها اخیراً مورد توجه قرار دارند. از آنجایی که چنین برنامه‌هایی در دسترس عموم قرار گرفته‌اند، بسیار محبوب شده‌اند. اما متأسفانه، همراه با گنجینه‌ای از اطلاعات مفید موجود در بسیاری از پاسخ‌های ارائه‌شده توسط چنین برنامه‌هایی، انبوهی از نادرستی‌ها نیز وجود دارد. حتی تأسف‌بارتر این است که همیشه مشخص نیست که برنامه‌ها چه زمانی پاسخ‌های اشتباه می‌دهند.

در این مطالعه جدید، تیم تحقیقاتی دانشگاه پردو اشاره کرد که بسیاری از دانشجویان برنامه‌نویسی از LLMها، نه‌تنها برای کمک به نوشتن کد در تکالیف برنامه‌نویسی، بلکه برای پاسخ‌دادن به سؤالات مربوط به برنامه‌نویسی استفاده می‌کنند.

این تیم تحقیقاتی 517 سؤال را در نظر گرفتند، و بررسی کردند که هوش مصنوعی ChatGPT چند بار پاسخ صحیح به این سؤالات داده است. متأسفانه میزان دقت این چت‌بات تنها در 52 درصد موارد گزارش شده است. بررسی‌ها در مورد پاسخ‌های چت‌بات‌های هوش مصنوعی همچنان ادامه دارد.

محققان از سؤالاتی استفاده کردند که به‌صورت رایگان در وب‌سایت StackOverflow در دسترس است. این وب‌سایت برای کمک به برنامه‌نویسان برای یادگیری بیشتر در مورد برنامه‌نویسی ازطریق کار با دیگران ایجاد شده است.

برنامه «Trusted Tester» گوگل: پیکسل‌های آینده در دستان طرفداران

معرفی گوشی‌های پرچمدار Vivo X300 و X300 Pro

بررسی آیفون ۱۷ پرو مکس؛ قهرمان استقامت یا غول بی‌احساس؟

۵ نکته مهم درباره آیفون ایر که احتمالا نمی‌دانید

رونمایی از جاروبرقی رباتیک DJI Romo: طراحی شفاف و ناوبری پیشرفته

ساخت گیم‌بوی واقعی با لگو: کیت ارتقاء Natalie the Nerd

چرا Galaxy XR سامسونگ ممکن است Vision Pro اپل را به…

تخفیف‌های برتر تکنولوژی: فرصت‌های خرید پس از پرایم دِی

Belkin PowerGrip: بهبود عکاسی با گوشی‌های هوشمند

مشکل Project Indigo ادوبی با دوربین سلفی آیفون ۱۷

قابلیت جدید کروم: غیرفعال‌سازی خودکار نوتیفیکیشن‌های وب‌سایت‌های نادیده گرفته شده

شکارچیان باگ: چگونه با پیدا کردن حفره‌های امنیتی درآمد نجومی کسب…

اپل در WWDC از قابلیت ترجمه پیام‌ و تماس‌ با هوش…

اپل در دفاع از سیاست‌های اپ استور: جلوی 9 میلیارد دلار…

تصاویر آخرالزمانی از هتل متروکه‌ای که طبیعت آن را پس گرفته…

داستان برند لومیکس؛ انقلاب در دنیای عکاسی دیجیتال به سبک پاناسونیک

افتتاح خانه لوسی کاشان همزمان با برگزاری دو نمایشگاه عکس

دوربین فوجی فیلم Instax Mini Evo با قابلیت ارسال تصاویر به…

عکاسی پرتره چیست؛ هر آنچه برای شروع باید بدانید

تحقیق جدید: ChatGPT در پاسخ‌دادن به سؤالات برنامه‌نویسی چندان دقیق نیست

برنامه‌ها

اطلاعات جدید از گوشی گلکسی S7

یوتیوب روی توسعه ابزار جدید هوش‌مصنوعی کار می‌کند: ارائه ایده به...

هوش مصنوعی هواوی Pura 70 از روتوش عکس و خلاصه‌سازی متن...

پاسخ مدیر واتس‌اپ به ادعای ایلان ماسک: پیام‌های کاربران برای ما...

داغ‌ترین اخبار

مایکروسافت پس از اختلال CrowdStrike به‌دنبال اعمال تغییرات در ویندوز است

توییتر بخش پادکست‌ها را رسماً به پلتفرم خود اضافه کرد

جمینای 2.0 گوگل ظاهراً در دسترس کاربری قرار گرفته است

تلگرام ظاهراً در تماس‌های صوتی آدرس IP کاربران را فاش می‌کند

منتخب سردبیر

آبروریزی در کیش؛ ربات انسان نمای جعلی فاجعه به بار آورد

مدل جدید چت‌ GPT معرفی شد

پروژه جاه‌طلبانه گوگل؛ دیتاسنترهای هوش مصنوعی به مدار زمین می‌روند

مطالب محبوب

الگوریتم هوش مصنوعی جدید متا

امکان انتقال حیوانات خانگی از دنیای واقعی به متاورس فراهم می‌شود

ردیاب جدید هدست Vive Focus 3

دسته‌های محبوب