01 فروردین 1404 مطالعه 5 دقیقه

هوش مصنوعی، پاسخ‌های اشتباه را با اطمینان میدهد!

دسته بندی ها:

آنچه خواهید خواند

ابزارهای جستجوی هوش مصنوعی اغلب با اطمینان اشتباه میکنند!
گزارش CJR
میزان خطا بین پلتفرم‌های مختلف
کلام آخر

ابزارهای جستجوی هوش مصنوعی اغلب با اطمینان اشتباه میکنند!

یک مطالعه جدید نشان داده است که ابزارهای جستجوی مبتنی بر هوش مصنوعی، اغلب با اطمینان کامل پاسخ‌های نادرست میدهند. بررسی انجام شده توسط مجله روزنامه‌نگاری کلمبیا (CJR)، با ارائه قسمتی از یک مقاله به هشت ابزار هوش مصنوعی و درخواست از آن‌ها برای شناسایی «تیتر، ناشر اصلی، تاریخ انتشار و لینک مقاله اصلی» انجام شد. طبق این بررسی، چت‌بات‌ها به طور جمعی در بیش از 60 درصد از سؤالات، پاسخ‌های نادرستی ارائه کردند.

هدفون جی بی ال مدل Tune 770NC

مشاهده و خرید

اشتباهات این ابزارها متفاوت بوده است. گاهی اوقات ابزار جستجو صرفاً حدس زده یا پاسخ‌هایی غلط به سؤالاتی داده است که قادر به پاسخگویی آن‌ها نبوده است. در مواردی نیز، لینک‌ها یا منابع ساختگی ارائه داده یا نسخه‌های سرقت‌ شده از مقاله واقعی را به‌عنوان منبع ذکر کرده است.

گزارش CJR

CJR در گزارش خود نوشته است که اغلب ابزارهایی که آزمایش کردند پاسخ‌های اشتباه را با اطمینان نگران‌کننده‌ای ارائه دادند و به ندرت از عبارت‌های مشروط مانند «احتمالاً»، «شاید»، «ممکن است» یا پذیرش عدم آگاهی با جملاتی نظیر «نتوانستم مقاله اصلی را پیدا کنم» استفاده کردند.

به نظر منطقی میرسد که نسبت به ابزارهای جستجوی هوش مصنوعی با دیده تردید نگاه کنیم. مشکل اصلی اینجاست که به نظر میرسد افراد چنین تردیدی ندارند. طبق گزارش CJR، بیست‌وپنج درصد آمریکایی‌ها اعلام کرده‌اند که به جای موتورهای جستجوی سنتی، از هوش مصنوعی برای جستجو استفاده میکنند.

شرکت بزرگ گوگل نیز بیش از پیش در حال ترغیب افراد به استفاده از AI است. این شرکت اخیراً اعلام کرده که قصد دارد امکانات مبتنی بر هوش مصنوعی را گسترش داده و شروع به آزمایش نتایج جستجوی صرفاً مبتنی بر هوش مصنوعی کرده است.

این تحقیق از CJR یکی از شواهد متعدد درباره نادرستی ابزارهای هوش مصنوعی است. بارها ثابت شده است که این ابزارها با اطمینان کامل پاسخ‌های نادرستی ارائه میدهند. با توجه به اینکه شرکت‌های بزرگ فناوری به سرعت در حال ادغام هوش مصنوعی در تمامی محصولات خود هستند، باید درباره اعتماد به این پاسخ‌ها بسیار محتاط باشید.

همچنین این ابزارهای جستجوی AI در ذکر منابع خود بسیار ضعیف عمل کرده‌اند. برای مثال ChatGPT Search در تقریباً 40 درصد موارد به مقاله‌ای نادرست لینک داده و در 21 درصد موارد نیز اصلاً منبعی ارائه نکرده است. این ضعف‌ها هم برای بررسی‌کنندگان حقایق و هم برای ناشران بسیار زیان‌بار است، زیرا ناشران حتی فرصت دریافت ترافیک از مدل هوش مصنوعی که محتوای آن‌ها را کپی کرده، از دست خواهند داد.

میزان خطا بین پلتفرم‌های مختلف

میزان خطا بین پلتفرم‌های آزمایش‌ شده تفاوت چشمگیری داشت. ابزار Perplexity در 37 درصد از پرسش‌ها اطلاعات اشتباه ارائه داد، در حالی‌ که ChatGPT Search در 67 درصد موارد (134 از 200 پرسش) مقالات را اشتباه شناسایی کرد. Grok 3 با نرخ خطای 94 درصدی، بیشترین اشتباه را داشت.

در این آزمون‌ها، پژوهشگران بخش‌هایی از مقالات خبری واقعی را مستقیماً به مدل‌های AI دادند و سپس از هر مدل خواستند تا عنوان مقاله، ناشر اصلی، تاریخ انتشار و آدرس اینترنتی آن را شناسایی کند. آن‌ها در مجموع 1600 پرسش را در هشت ابزار جستجوی مولد مختلف اجرا کردند.

مطالعه به یک گرایش مشترک میان تمام این مدل‌های هوش مصنوعی اشاره کرد: به جای اینکه این ابزارها در مواقعی که اطلاعات قابل اعتمادی نداشتند از پاسخ دادن خودداری کنند، معمولاً اطلاعات نادرست یا گمانه‌زنی‌هایی ارائه میکردند که ظاهری منطقی و قابل‌ قبول داشت. پژوهشگران تأکید کردند که این رفتار در تمام مدل‌های آزمایش‌شده دیده شده و منحصر به ابزار خاصی نبوده است.

به طور شگفت‌آوری، نسخه‌های پولی و پریمیوم این ابزارهای جستجوی هوش مصنوعی در برخی جنبه‌ها عملکرد بدتری داشتند. نسخه پولی Perplexity Pro (با هزینه 20 دلار در ماه) و سرویس پریمیوم Grok 3 (با هزینه 40 دلار در ماه) با اطمینان بیشتری پاسخ‌های اشتباه ارائه دادند و در مقایسه با نسخه‌های رایگان خود، تمایل کمتری به خودداری از ارائه پاسخ‌های نامطمئن داشتند. هرچند این نسخه‌های پولی به تعداد بیشتری از سؤالات پاسخ صحیح دادند، اما عدم تمایل آن‌ها به خودداری از پاسخ‌های نامطمئن باعث افزایش نرخ کلی خطا شد.

کلام آخر

با توجه به نتایج این مطالعه و موارد مشابه، روشن است که ابزارهای جستجوی AI همچنان با محدودیت‌های جدی روبه‌رو هستند و نمیتوان بدون احتیاط به نتایج آن‌ها اعتماد کرد. هرچند که شرکت‌های بزرگ فناوری به طور مداوم این فناوری‌ها را توسعه میدهند، اما تا زمانی که هوش مصنوعی نتواند با دقت و اعتبار کافی پاسخ‌ها را ارائه دهد، باید مراقب بود و صحت پاسخ‌ها را همواره بررسی کرد.

هدفون جی بی ال مدل Tune 720BT

مشاهده و خرید

توصیه میشود که در استفاده از ابزارهای جستجوی مبتنی بر هوش مصنوعی احتیاط کرده و به دنبال منابع تأییدشده و قابل اعتماد باشید. با رعایت این نکته، میتوان از مزایای این فناوری‌ها بهره برد و در عین حال از بروز اشتباهات پرهزینه جلوگیری کرد.

مقالات دیگر

مقالات بیشتر

پاسخگوی سوالات شما هستیم

دیدگاهی وجود ندارد!

هوش مصنوعی، پاسخ‌های اشتباه را با اطمینان میدهد!

آنچه خواهید خواند