آنچه خواهید خواند
بهینهسازی مدل تولید صدای هوش مصنوعی روی تراشه Arm
استارتاپ هوش مصنوعی Stability AI با همکاری شرکت تولیدکننده تراشه Arm، قصد دارد مدل تولید صدای هوش مصنوعی خود، یعنی Stable Audio Open را که قادر به تولید انواع صدا از جمله جلوههای صوتی است، روی دستگاههای موبایلی که از تراشههای Arm استفاده میکنند، اجرا کند.
پیشنهاد مطالعه
با توجه به نیاز روزافزون به تولید صدای باکیفیت و در عین حال مستقل از اتصال به اینترنت، Stability AI وعده داده است که مدل جدید آنها قادر است به صورت کاملاً آفلاین انواع صداها از جمله جلوههای صوتی و موسیقی را تنها با استفاده از دستورات متنی تولید کند. این امر میتواند نقطه عطفی در صنعت تولید محتوای صوتی توسط هوش مصنوعی باشد.
مدل Stable Audio Open
در حال حاضر برنامههای متنوعی مانند Suno و Udio برای تولید صدا با استفاده از هوش مصنوعی وجود دارند، اما اکثر آنها به پردازش ابری متکی هستند، به این معنی که نمیتوان از آنها در حالت آفلاین استفاده کرد.
علاوه بر این، برخی مدلهای تولید صدا بر اساس محتوای دارای حق کپی رایت آموزش دیدهاند که از نظر حقوق مالکیت معنوی میتواند مشکلآفرین باشد. Stability تأکید دارد که مجموعه دادههایی که برای آموزش Stable Audio Open استفاده شده کاملاً شامل صداها و آهنگهای بدون حق امتیاز بوده است.
مدل Stable Audio Open که برای اجرا روی تراشه Arm بهینهسازی شده است، قرار است این هفته در کنفرانس جهانی موبایل در بارسلون رونمایی شود. این مدل میتواند از طریق توصیف متنی، صدا تولید کند.
مثلاً شما میتوانید با نوشتن متنی مانند «موجهای آرام دریا هنگام غروب خورشید»، صدای مورد نظر خود را تولید کنید. Stability میگوید که با همکاری Arm توانسته است مدل Stable Audio Open را به شکل قابل توجهی بهینهسازی کند و به این ترتیب سرعت تولید صدا را تا 30 برابر افزایش دهد. تولید یک نمونه صوتی 11 ثانیهای روی پردازنده Armv9 تقریباً 8 ثانیه طول میکشد.
البته باید توجه داشت که این نسخه بهینهشده از Stable Audio Open هنوز برای دانلود عمومی در دسترس نیست اما مدیرعامل Stability، پِرِم آکاراجو در بیانیهای اعلام کرد که این شرکت قصد دارد در آینده مدلهایش از جمله Stable Audio Open را به اپلیکیشنها و دستگاههای مصرفکنندگان عادی نیز بیاورد. همچنین Stability اعلام کرده است که همکاری این شرکت با Arm برای بهینهسازی و بهبود بیشتر مدل Stable Audio Open به منظور استفاده در دستگاههای موبایل ادامه خواهد داشت.
مشکلات شرکت Stability AI
شرکت Stability AI که قبلاً به دلیل عرضه مدل محبوب تولید تصاویر Stable Diffusion به شهرت رسید، اخیراً با مشکلات جدی روبهرو شده بود. سال گذشته، این شرکت با جذب سرمایهگذاران جدید، از جمله اریک اشمیت و شان پارکر، بنیانگذار Napster، تلاش کرد اوضاع مالی خود را بهبود ببخشد.
گفته میشود عماد مستاک، بنیانگذار و مدیرعامل سابق Stability، شرکت را به دلیل سوءمدیریت در وضعیت مالی دشواری قرار داده بود که باعث استعفای کارمندان، فسخ همکاریها از جمله همکاری با Canva و ایجاد نگرانی جدی در میان سرمایهگذاران شد.
در ماههای اخیر، Stability AI یک مدیرعامل جدید استخدام کرده، جیمز کامرون، کارگردان فیلم معروف تایتانیک را به هیئت مدیره خود اضافه کرده و همچنین چندین مدل جدید تولید تصویر را نیز معرفی نموده است.
کلام آخر
بهینهسازی مدل Stable Audio Open برای اجرا روی تراشه Arm نشان میدهد که Stability AI به خوبی از اهمیت هوش مصنوعی در کاربردهای روزمره آگاه است و تلاش دارد تا وابستگی افراد به پردازشهای ابری را به حداقل برساند. این اقدام به آنها امکان میدهد تا در هر لحظه و در هر مکانی بتوانند محتوای صوتی منحصربهفرد خود را تولید کنند، بدون آنکه نگرانی بابت مالکیت معنوی داشته باشند.
هرچند این نسخه هنوز به صورت عمومی در دسترس نیست، اما همکاری این دو شرکت بزرگ میتواند در آینده نزدیک مسیر استفاده از هوش مصنوعی در دستگاههای موبایل را متحول کند. پیشبینی میشود این روند، سایر شرکتها را نیز ترغیب به بهینهسازی مدلهای هوش مصنوعی خود برای اجرا به صورت آفلاین کند و بدین ترتیب، شاهد تغییرات گستردهای در بازار تولید محتوای دیجیتال باشیم.





پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!