به گزارش راهبرد معاصر؛ تیم تحقیقاتی متا به تازگی یک مدل زبان یادگیری عمیق منبع باز به نام «MusicGen» را منتشر کرده، که میتواند موسیقی جدیدی را بر اساس پیامهای متنی تولید کند و حتی با یک آهنگ موجود تراز شود.
با استفاده از این ابزار میتوانید سبک موسیقی مورد نظر را توضیح داده و سپس روی گزینه «Generate» کلیک کنید؛ پس از مدتی یک قطعه کوتاه از موسیقی کاملاً جدید را بر اساس پیامهای متن و ملودی درخواستی شما منتشر میکند. نسخه نمایشی به شما امکان میدهد موسیقی خود را توصیف کنید. سپس میتوانید انتخاب کنید که آهنگ چقدر طول بکشد.
این تیم از ۲۰ هزار ساعت موسیقی برای آموزش مدل استفاده کرد که شامل ۱۰ هزار آهنگ موسیقی با کیفیت بالا از مجموعه دادههای داخلی به همراه آهنگهای شرکتهای شاتراستاک و Pond۵ بود. محققان برای سریعتر کردن آن، از واحدساز صوتی ۳۲ کیلوهرتزی «EnCodec» متا جهت تولید قطعات کوچکتر موسیقی که میتوانند به صورت موازی پردازش شوند، استفاده کردند.
گوگل ماه گذشته، یک تولید کننده موسیقی مشابه به نام «MusicLM» منتشر کرد، اما به نظر میرسد MusicGen نتایج بهتری ایجاد میکند.
همانطور که گفته شد، MusicGen منبع باز است و حتی میتوان از آن برای تولید موسیقی تجاری استفاده کرد. با این حال، این آخرین نمونه از سرعت خیره کننده توسعه هوش مصنوعی در نیم سال گذشته است. / انگجت