تولید صدای هوش مصنوعی روی موبایل با تراشه Arm

بهینه‌سازی مدل تولید صدای هوش مصنوعی روی تراشه‌ Arm

استارتاپ هوش مصنوعی Stability AI با همکاری شرکت تولیدکننده تراشه Arm، قصد دارد مدل تولید صدای هوش مصنوعی خود، یعنی Stable Audio Open را که قادر به تولید انواع صدا از جمله جلوه‌های صوتی است، روی دستگاه‌های موبایلی که از تراشه‌های Arm استفاده میکنند، اجرا کند.

با توجه به نیاز روزافزون به تولید صدای باکیفیت و در عین حال مستقل از اتصال به اینترنت، Stability AI وعده داده است که مدل جدید آن‌ها قادر است به صورت کاملاً آفلاین انواع صداها از جمله جلوه‌های صوتی و موسیقی را تنها با استفاده از دستورات متنی تولید کند. این امر میتواند نقطه عطفی در صنعت تولید محتوای صوتی توسط هوش مصنوعی باشد.

تولید صدای هوش مصنوعی روی موبایل با تراشه Arm

مدل Stable Audio Open

در حال حاضر برنامه‌های متنوعی مانند Suno و Udio برای تولید صدا با استفاده از هوش مصنوعی وجود دارند، اما اکثر آن‌ها به پردازش ابری متکی هستند، به این معنی که نمیتوان از آن‌ها در حالت آفلاین استفاده کرد.

علاوه بر این، برخی مدل‌های تولید صدا بر اساس محتوای دارای حق کپی رایت آموزش دیده‌اند که از نظر حقوق مالکیت معنوی میتواند مشکل‌آفرین باشد. Stability تأکید دارد که مجموعه داده‌هایی که برای آموزش Stable Audio Open استفاده شده کاملاً شامل صداها و آهنگ‌های بدون حق امتیاز بوده است.

مدل Stable Audio Open که برای اجرا روی تراشه‌ Arm بهینه‌سازی شده است، قرار است این هفته در کنفرانس جهانی موبایل در بارسلون رونمایی شود. این مدل میتواند از طریق توصیف متنی، صدا تولید کند.

مثلاً شما میتوانید با نوشتن متنی مانند «موج‌های آرام دریا هنگام غروب خورشید»، صدای مورد نظر خود را تولید کنید. Stability میگوید که با همکاری Arm توانسته است مدل Stable Audio Open را به شکل قابل توجهی بهینه‌سازی کند و به این ترتیب سرعت تولید صدا را تا 30 برابر افزایش دهد. تولید یک نمونه صوتی 11 ثانیه‌ای روی پردازنده Armv9 تقریباً 8 ثانیه طول میکشد.

البته باید توجه داشت که این نسخه‌ بهینه‌شده از Stable Audio Open هنوز برای دانلود عمومی در دسترس نیست اما مدیرعامل Stability، پِرِم آکاراجو در بیانیه‌ای اعلام کرد که این شرکت قصد دارد در آینده مدل‌هایش از جمله Stable Audio Open را به اپلیکیشن‌ها و دستگاه‌های مصرف‌کنندگان عادی نیز بیاورد. همچنین Stability اعلام کرده است که همکاری این شرکت با Arm برای بهینه‌سازی و بهبود بیشتر مدل Stable Audio Open به منظور استفاده در دستگاه‌های موبایل ادامه خواهد داشت.

تولید صدای هوش مصنوعی روی موبایل با تراشه Arm

مشکلات شرکت Stability AI

شرکت Stability AI که قبلاً به دلیل عرضه مدل محبوب تولید تصاویر Stable Diffusion به شهرت رسید، اخیراً با مشکلات جدی روبه‌رو شده بود. سال گذشته، این شرکت با جذب سرمایه‌گذاران جدید، از جمله اریک اشمیت و شان پارکر، بنیانگذار Napster، تلاش کرد اوضاع مالی خود را بهبود ببخشد.

گفته میشود عماد مستاک، بنیانگذار و مدیرعامل سابق Stability، شرکت را به دلیل سوءمدیریت در وضعیت مالی دشواری قرار داده بود که باعث استعفای کارمندان، فسخ همکاری‌ها از جمله همکاری با Canva و ایجاد نگرانی جدی در میان سرمایه‌گذاران شد.

در ماه‌های اخیر، Stability AI یک مدیرعامل جدید استخدام کرده، جیمز کامرون، کارگردان فیلم معروف تایتانیک را به هیئت مدیره خود اضافه کرده و همچنین چندین مدل جدید تولید تصویر را نیز معرفی نموده است.

تولید صدای هوش مصنوعی روی موبایل با تراشه Arm

کلام آخر

بهینه‌سازی مدل Stable Audio Open برای اجرا روی تراشه‌ Arm نشان میدهد که Stability AI به‌ خوبی از اهمیت هوش مصنوعی در کاربردهای روزمره آگاه است و تلاش دارد تا وابستگی افراد به پردازش‌های ابری را به حداقل برساند. این اقدام به آنها امکان میدهد تا در هر لحظه و در هر مکانی بتوانند محتوای صوتی منحصربه‌فرد خود را تولید کنند، بدون آنکه نگرانی بابت مالکیت معنوی داشته باشند.

هرچند این نسخه هنوز به صورت عمومی در دسترس نیست، اما همکاری این دو شرکت بزرگ میتواند در آینده نزدیک مسیر استفاده از هوش مصنوعی در دستگاه‌های موبایل را متحول کند. پیش‌بینی میشود این روند، سایر شرکت‌ها را نیز ترغیب به بهینه‌سازی مدل‌های هوش مصنوعی خود برای اجرا به صورت آفلاین کند و بدین ترتیب، شاهد تغییرات گسترده‌ای در بازار تولید محتوای دیجیتال باشیم.