非公式・AI自動要約ニュースサイト(各AI企業の公式とは無関係)
AI News JP / www.ai-news.jp
📰 ニュース DeepSeek 🟠 重要 LLMコーディング · 出典: DeepSeek Release Notes

最大90%のコスト削減、ディスク上のキャッシング技術が新登場!

DeepSeek APIがディスク上のコンテキストキャッシングを導入

原題: DeepSeek API introduces Context Caching on Disk, cutting prices by an order of magnitude | DeepSeek API Docs

重要度の根拠: 新機能が多くのユーザーに影響を与えるため。

要約

DeepSeek APIが新たにディスク上のコンテキストキャッシング技術を導入しました。この技術により、ユーザーの重複入力を検出し、再計算を避けることでサービスのレイテンシを減少させ、コストを最大90%削減します。API利用者は、長い入力に対しても迅速な応答を得られるようになります。この機能は全ユーザーに自動で提供され、特別なコード変更は不要です。

要点

  • ディスク上のコンテキストキャッシング導入
  • 重複入力を検出し再計算を回避
  • コストを最大90%削減可能
  • 長い入力でも応答が迅速に
  • 全ユーザーに自動提供、コード変更不要
開発者向け技術解説(API・実装詳細・破壊的変更)を見る

DeepSeek APIに新たに導入されたディスク上のコンテキストキャッシング技術は、重複したユーザー入力を検出し、キャッシュされた部分を再利用することでレイテンシを大幅に削減します。API利用者は、同じプレフィックスを持つリクエストでキャッシュヒットを利用でき、コストを最大90%削減可能です。キャッシュの応答に関する新しいフィールドにより、パフォーマンスをモニタリングできます。

API/SDKパフォーマンス料金対象: 一般ユーザー対象: 開発者

出典: https://api-docs.deepseek.com/news/news0802

媒体: DeepSeek Release Notes

※本記事は Anthropic / OpenAI / Google / Meta / Mistral / DeepSeek / Sakana 等各社の公開情報を基に AI (OpenAI GPT-4o-mini) が日本語で要約・分類した二次的著作物です。著作権法第32条の引用要件に基づき出典 URL を必ず併記しています。要約は AI 生成のため誤訳・誤解釈を含む可能性があります。詳細・正確な情報は必ず出典元の原文をご確認ください。