341Mパラメータの新モデルで、スマホから短音声を8秒未満で生成可能!
Stability AIとArmがStable Audio Open Smallを発表
原題: Stability AI and Arm Collaborate to Release Stable Audio Open Small, Enabling Real-World Deployment for On-Device Audio Generation — Stability AI
重要度の根拠: 新モデルのリリースが多くのユーザーに影響を与えるため。
要約
Stability AIはArmと提携し、Stable Audio Open Smallをオープンソースでリリースしました。この341百万パラメータのテキストからオーディオへのモデルは、Arm CPU上で動作するよう最適化されており、スマートフォンで短い音声を8秒以内に生成できます。この新しいモデルは、音声効果やドラムループなどの短い音声サンプルを迅速に生成することに特化しています。
要点
- 341Mパラメータの小型モデル
- スマホで8秒未満で音声生成
- 商用・非商用を問わず無料
- Arm CPUでの最適化が特徴
- 短い音声サンプル生成に最適
開発者向け技術解説(API・実装詳細・破壊的変更)を見る
Stable Audio Open Smallは341Mパラメータのテキストからオーディオへのモデルで、Arm CPU上で動作するように最適化されています。短い音声サンプルを迅速に生成し、スマートフォンで8秒未満で最大11秒のオーディオを作成可能です。ArmのKleidiAIライブラリを活用し、効率的なエッジ処理を実現。商用・非商用利用ともに無料で利用可能です。
媒体: Stability AI
※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。