صداهای تولیدی هوش مصنوعی، تشخیص ناپذیر از صدای انسان

صداهای تولیدی هوش مصنوعی، تقلید واقعی‌تر از همیشه

صداهای تولیدی هوش مصنوعی اکنون انسان را چنان متقاعدکننده تقلید میکنند که تشخیص آن‌ها تقریباً غیرممکن است.

ساخت یک صدای شبیه‌سازی‌شده متقاعدکننده اکنون تنها در چند دقیقه و با حداقل تخصص امکان‌پذیر است.

برخی صداهای مصنوعی حتی قابل اعتمادتر از ضبط‌های واقعی صدای انسان ارزیابی شدند.

سال‌ها بسیاری از مردم تصور می‌کردند که گفتار تولیدی هوش مصنوعی همیشه با ویژگی‌های کمی «جعلی» و غیرواقعی خود قابل شناسایی است. اما تحقیقات جدید دانشگاه کوئین مری لندن این تصور را به چالش میکشد و نشان میدهد که فناوری کنونی صداهای تولیدی هوش مصنوعی به سطحی رسیده که «شبیه سازهای صوتی» و دیپ فیک ها تقریباً از ضبط‌های واقعی قابل تشخیص نیستند.

در این مطالعه، شرکت‌کنندگان صداهای انسانی را با دو نوع صدای مصنوعی مقایسه کردند: صداهای شبیه‌سازی‌شده‌ای که برای تقلید از گویندگان واقعی طراحی شده بودند و صداهایی که از یک سیستم مدل زبانی بزرگ (LLM) بدون نمونه‌های خاص تولید شده بودند.

صداهای تولیدی هوش مصنوعی، تشخیص ناپذیر از صدای انسان

فراتر از واقع‌گرایی و ورود به قلمرو تسلط

شنوندگان اغلب در تشخیص بین این دو مشکل داشتند، که نشان میدهد این فناوری وارد فاز جدیدی شده است که در آن واقع‌گرایی شبیه به انسان دیگر یک آرزو نیست، بلکه یک واقعیت است.

تیم تحقیقاتی نه تنها بررسی کرد که آیا شرکت‌کنندگان میتوانند بین صداهای مصنوعی و واقعی تمایز قائل شوند، بلکه چگونگی درک آن‌ها را نیز مورد مطالعه قرار داد.

به طور شگفت‌انگیزی، هر دو نوع صدای تولیدی هوش مصنوعی قدرتمندتر از صداهای انسانی ارزیابی شدند و در برخی موارد، حتی قابل اعتمادتر قضاوت شدند.

دکتر نادین لاوان، مدرس ارشد روانشناسی در دانشگاه کوئین مری لندن، بر این نکته تأکید کرد که تیم او تا چه حد به آسانی و با هزینه کم توانستند این شبیه‌سازی‌های صوتی را ایجاد کند.

او گفت: «صداهای تولیدی هوش مصنوعی اکنون در اطراف ما هستند؛ فقط مسئله زمان بود که فناوری هوش مصنوعی شروع به تولید گفتار طبیعی و انسان‌گونه کند. این فرآیند به حداقل تخصص، تنها چند دقیقه ضبط صدا و تقریباً هیچ پولی نیاز نداشت.»

او افزود که سهولت استفاده نشان میدهد که این فناوری در مدت کوتاهی تا چه حد پیشرفت کرده است.

چنین دسترسی‌ای فرصت‌هایی را در زمینه‌هایی مانند آموزش، ارتباطات و دسترسی‌پذیری ایجاد میکند، جایی که صداهای مصنوعی سفارشی میتوانند تعامل و فراگیری را افزایش دهند.

همانطور که نویسندگان هوش مصنوعی پرسش‌هایی را در مورد اصالت، حق کپی‌رایت و سوءاستفاده مطرح میکنند، تولید صدای هوش مصنوعی نیز بحث‌هایی را پیرامون مالکیت هویت و رضایت‌مندی به وجود می‌آورد.

اگر صدای واقع‌گرایانه تنها از یک نمونه کوتاه قابل ایجاد باشد، خطرات شبیه‌سازی غیرمجاز را نمی‌توان نادیده‌گرفت.

با گسترش مداوم قابلیت‌ها و دسترسی‌پذیری ابزارهای هوش مصنوعی، چالش اصلی این خواهد بود که اطمینان حاصل شود از مزایای آن‌ها بهره‌برداری میشود، بدون آنکه مسیرهای جدیدی برای فریب‌کاری گشوده شود.

درک نحوه واکنش مردم به این صداها تنها گام اول در رسیدگی به پیامدهای اخلاقی، حقوقی و اجتماعی فناوری‌ای است که دیگر آینده‌نگرانه نیست، بلکه به طور قاطعانه در زمان حال حضور دارد.