Stable Audio 3.0リリース!オープンウェイトで音楽生成の新境地を開く。
Stable Audio 3.0リリース、オープンウェイトモデルによる音楽生成
原題: Stable Audio 3.0, the model family built with open-weight models<br/> — Stability AI
重要度の根拠: 新しいオープンウェイトの音楽生成モデルがリリースされ、多くのユーザーに影響を与えるため
要約
Stability AIがStable Audio 3.0を発表しました。このモデルファミリーは、完全にライセンスされたデータでトレーニングされたオープンウェイトの音楽モデルで構成されています。ユーザーは出力物を自由に配布・商業化でき、様々な用途に応じた4つのモデルが提供されます。このリリースは、音楽コミュニティの創造的な実験を促進することを目指しており、音声生成の革新を期待されています。
要点
- Stable Audio 3.0はオープンウェイトの音楽モデル
- ユーザーは出力物を自由に商業化可能
- 4つのモデルが異なる用途に対応
- 完全にライセンスされたデータでトレーニング
- 音楽コミュニティの革新を促進
開発者向け技術解説(API・実装詳細・破壊的変更)を見る
Stable Audio 3.0には、さまざまな用途に対応した4つのモデルがあります。具体的には、Stable Audio 3.0 Small SFX(モバイルデバイス向けの効果音生成)、Stable Audio 3.0 Small(音楽の完全な作曲)、Stable Audio 3.0 Medium(構造やメロディの一貫性が向上した音楽生成)、Stable Audio 3.0 Large(低遅延生成が可能な最も高度なモデル)が含まれます。全モデルは完全にライセンスされたデータでトレーニングされており、Stability AI Community Licenseの下で出力物の所有権が保証されています。企業向けにはEnterprise Licenseが用意されており、年間収益が1百万ドルを超える場合の商業的カバレッジも提供されます。
本文の日本語訳(全文)を見る
Stable Audio 3.0をリリースします。このモデルファミリーは、完全にライセンスされたデータでトレーニングされたオープンウェイトの音楽モデルです。
あなたは出力物を所有し、Stability AI Community Licenseまたは年収1百万ドル以上の組織向けのEnterprise Licenseの下で自由に配布・商業化できます。
主な革新点には、最大6分の可変長生成や、ポータブルデバイスでの完全な曲作成が含まれます。
Stable Audio 3.0 SmallおよびMediumはHugging Faceで入手可能です。ここからモデルをダウンロードできます。
Stable Audio 3.0 Largeは、Stability AI APIを介して利用可能で、企業の導入向けに自己ホスティングが可能です。ここから試してみてください。
本日、Stable Audio 3.0をリリースします。このモデルファミリーは、完全にライセンスされたデータでトレーニングされ、音声コミュニティが次に構築するための基盤を提供することを目的としています。3つのモデルはオープンウェイトであり、無料でダウンロードして構築できます。
音楽は常にコミュニティの創造力を通じて進化してきました。リミックス文化、インターポレーション、マッシュアップは、アーティストが互いの作品に基づいて構築し、アートフォームを前進させる方法です。生成された音声も同様です。私たちは、Stable Diffusionの立ち上げで画像生成に火をつけたのと同様に、音声でのコミュニティ主導の革新を促進したいと考えています。
Stable Audio 3.0は、生成音声を試すためのオープンな招待状です。私たちは、まだまだ多くの革新が待っていると信じています。
異なるユースケースと展開オプションに対応するために設計された4つの新しいモデルをリリースします。
Stable Audio 3.0 Small SFX:モバイルフォンやコンシューマー向けノートパソコンでの効果音生成。
Stable Audio 3.0 Small:デバイス上での完全な音楽作曲。
Stable Audio 3.0 Medium:より高い音楽性(すなわち、構造、メロディの一貫性、フレージング)と最大6分20秒の長いトラック。
Stable Audio 3.0 Large:音楽プラットフォームや高ボリュームで低遅延生成が必要なクリエイティブアプリケーション向けに構築されたファミリーの中で最も高度な音楽性を持つモデルです。
全てのStable Audio 3.0モデルは完全にライセンスされたデータでトレーニングされています。Stability AI Community Licenseの下で、出力物の所有権が保証され、自由に配布・商業化できます。
年間収益が1百万ドルを超える企業向けに、商業的カバレッジを提供するEnterprise Licenseも用意しています。Enterprise Licenseの下では法的補償も提供しています。
媒体: Stability AI
※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。