آنچه خواهید خواند
ابزارهای جستجوی هوش مصنوعی اغلب با اطمینان اشتباه میکنند!
یک مطالعه جدید نشان داده است که ابزارهای جستجوی مبتنی بر هوش مصنوعی، اغلب با اطمینان کامل پاسخهای نادرست میدهند. بررسی انجام شده توسط مجله روزنامهنگاری کلمبیا (CJR)، با ارائه قسمتی از یک مقاله به هشت ابزار هوش مصنوعی و درخواست از آنها برای شناسایی «تیتر، ناشر اصلی، تاریخ انتشار و لینک مقاله اصلی» انجام شد. طبق این بررسی، چتباتها به طور جمعی در بیش از 60 درصد از سؤالات، پاسخهای نادرستی ارائه کردند.
اشتباهات این ابزارها متفاوت بوده است. گاهی اوقات ابزار جستجو صرفاً حدس زده یا پاسخهایی غلط به سؤالاتی داده است که قادر به پاسخگویی آنها نبوده است. در مواردی نیز، لینکها یا منابع ساختگی ارائه داده یا نسخههای سرقت شده از مقاله واقعی را بهعنوان منبع ذکر کرده است.
گزارش CJR
CJR در گزارش خود نوشته است که اغلب ابزارهایی که آزمایش کردند پاسخهای اشتباه را با اطمینان نگرانکنندهای ارائه دادند و به ندرت از عبارتهای مشروط مانند «احتمالاً»، «شاید»، «ممکن است» یا پذیرش عدم آگاهی با جملاتی نظیر «نتوانستم مقاله اصلی را پیدا کنم» استفاده کردند.
به نظر منطقی میرسد که نسبت به ابزارهای جستجوی هوش مصنوعی با دیده تردید نگاه کنیم. مشکل اصلی اینجاست که به نظر میرسد افراد چنین تردیدی ندارند. طبق گزارش CJR، بیستوپنج درصد آمریکاییها اعلام کردهاند که به جای موتورهای جستجوی سنتی، از هوش مصنوعی برای جستجو استفاده میکنند.
شرکت بزرگ گوگل نیز بیش از پیش در حال ترغیب افراد به استفاده از AI است. این شرکت اخیراً اعلام کرده که قصد دارد امکانات مبتنی بر هوش مصنوعی را گسترش داده و شروع به آزمایش نتایج جستجوی صرفاً مبتنی بر هوش مصنوعی کرده است.
این تحقیق از CJR یکی از شواهد متعدد درباره نادرستی ابزارهای هوش مصنوعی است. بارها ثابت شده است که این ابزارها با اطمینان کامل پاسخهای نادرستی ارائه میدهند. با توجه به اینکه شرکتهای بزرگ فناوری به سرعت در حال ادغام هوش مصنوعی در تمامی محصولات خود هستند، باید درباره اعتماد به این پاسخها بسیار محتاط باشید.
همچنین این ابزارهای جستجوی AI در ذکر منابع خود بسیار ضعیف عمل کردهاند. برای مثال ChatGPT Search در تقریباً 40 درصد موارد به مقالهای نادرست لینک داده و در 21 درصد موارد نیز اصلاً منبعی ارائه نکرده است. این ضعفها هم برای بررسیکنندگان حقایق و هم برای ناشران بسیار زیانبار است، زیرا ناشران حتی فرصت دریافت ترافیک از مدل هوش مصنوعی که محتوای آنها را کپی کرده، از دست خواهند داد.
میزان خطا بین پلتفرمهای مختلف
میزان خطا بین پلتفرمهای آزمایش شده تفاوت چشمگیری داشت. ابزار Perplexity در 37 درصد از پرسشها اطلاعات اشتباه ارائه داد، در حالی که ChatGPT Search در 67 درصد موارد (134 از 200 پرسش) مقالات را اشتباه شناسایی کرد. Grok 3 با نرخ خطای 94 درصدی، بیشترین اشتباه را داشت.
در این آزمونها، پژوهشگران بخشهایی از مقالات خبری واقعی را مستقیماً به مدلهای AI دادند و سپس از هر مدل خواستند تا عنوان مقاله، ناشر اصلی، تاریخ انتشار و آدرس اینترنتی آن را شناسایی کند. آنها در مجموع 1600 پرسش را در هشت ابزار جستجوی مولد مختلف اجرا کردند.
مطالعه به یک گرایش مشترک میان تمام این مدلهای هوش مصنوعی اشاره کرد: به جای اینکه این ابزارها در مواقعی که اطلاعات قابل اعتمادی نداشتند از پاسخ دادن خودداری کنند، معمولاً اطلاعات نادرست یا گمانهزنیهایی ارائه میکردند که ظاهری منطقی و قابل قبول داشت. پژوهشگران تأکید کردند که این رفتار در تمام مدلهای آزمایششده دیده شده و منحصر به ابزار خاصی نبوده است.
به طور شگفتآوری، نسخههای پولی و پریمیوم این ابزارهای جستجوی هوش مصنوعی در برخی جنبهها عملکرد بدتری داشتند. نسخه پولی Perplexity Pro (با هزینه 20 دلار در ماه) و سرویس پریمیوم Grok 3 (با هزینه 40 دلار در ماه) با اطمینان بیشتری پاسخهای اشتباه ارائه دادند و در مقایسه با نسخههای رایگان خود، تمایل کمتری به خودداری از ارائه پاسخهای نامطمئن داشتند. هرچند این نسخههای پولی به تعداد بیشتری از سؤالات پاسخ صحیح دادند، اما عدم تمایل آنها به خودداری از پاسخهای نامطمئن باعث افزایش نرخ کلی خطا شد.
کلام آخر
با توجه به نتایج این مطالعه و موارد مشابه، روشن است که ابزارهای جستجوی AI همچنان با محدودیتهای جدی روبهرو هستند و نمیتوان بدون احتیاط به نتایج آنها اعتماد کرد. هرچند که شرکتهای بزرگ فناوری به طور مداوم این فناوریها را توسعه میدهند، اما تا زمانی که هوش مصنوعی نتواند با دقت و اعتبار کافی پاسخها را ارائه دهد، باید مراقب بود و صحت پاسخها را همواره بررسی کرد.
توصیه میشود که در استفاده از ابزارهای جستجوی مبتنی بر هوش مصنوعی احتیاط کرده و به دنبال منابع تأییدشده و قابل اعتماد باشید. با رعایت این نکته، میتوان از مزایای این فناوریها بهره برد و در عین حال از بروز اشتباهات پرهزینه جلوگیری کرد.





پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!