انویدیا مدل جدید هوش مصنوعی را برای تولید موسیقی و صدا معرفی کرد که میتواند صداها را تغییر دهد و نواهای جدیدی بسازد. تیم سبز، بزرگترین تأمینکنندهی تراشه برای سرورهای هوش مصنوعی جهان، مدل مولد صدای خود را Fugatto نامیده و اعلام کرده است که فعلاً برنامهای برای انتشار عمومی آن ندارد.
Fugatto میتواند توصیف متنی را به صوت و موسیقی تبدیل و حتی صداهای شنیدهنشدهای خلق کند؛ از جمله صداهای جدیدی مانند صدای یک ترامپت بهشکلی که مانند یک سگ پارس کند.
آنچه Fugatto را از سایر مدلهای هوش مصنوعی متمایز میکند، توانایی آن در تغییر یا اصلاح صداهای موجود است. بهعنوان مثال، میتواند قطعهی نواختهشدهای روی پیانو را به آواز انسانگونه تبدیل کند یا صدای یک فرد را اصلاح کند و لهجه و حالت بیان آن را تغییر دهد.
بهگزارش رویترز، برایان کاتنزارو، معاون تحقیقوتوسعهی یادگیری عمیق کاربردی در انویدیا میگوید: «من فکر میکنم که هوش مصنوعی مولد قابلیتهای جدیدی به موسیقی، بازیهای ویدئویی و افراد عادی که میخواهند چیزهایی بسازند، هدیه میدهد.»
مقالههای مرتبط
مدل جدید انویدیا روی دادههای منبعباز آموزش دیده است و زمان انتشار آن هنوز در ابهام قرار دارد. کاتنزارو گفت: «هر فناوری مولدی همیشه برخی خطرات را بههمراه دارد؛ زیرا شاید افراد از آن برای تولید محتواهایی استفاده کنند که مناسب نیست. ما باید در این مورد محتاط باشیم، به همین دلیل، برنامهای فوری برای در دسترس قراردادن Fugatto نداریم.»
سازندگان مدلهای هوش مصنوعی مولد هنوز نتوانستهاند راهی برای جلوگیری از سوءاستفاده از این فناوری، مانند دیپ فیک یا نقض حق کپیرایت پیدا کنند. OpenAI و متا نیز همچنان نگفتهاند که چه زمانی قصد دارند مدلهای تولید صوت یا تصویر خود را بهصورت عمومی منتشر کنند.
source