目次
概要
中国のMoonshot AIが公開したオープンウェイトのマルチモーダルモデル。15兆トークンで事前学習され、SWE-bench Verifiedで76.8%を達成。最大100のサブエージェントを自律的に協調させる「Agent Swarm」機能が最大の特徴。
主な要素
- SWE-bench Verified 76.8% — オープンウェイトモデルとしてDevstral 2(72.2%)を上回る性能
- Agent Swarm — 1つのタスクを最大100のサブエージェントに分解し、並列実行・結果統合を自律的に行う
- マルチモーダル入力 — テキスト・画像・動画からの理解とコード生成に対応。UIスクリーンショットからコードを生成できる
- 15兆トークン事前学習 — コード・数学・科学文献を重点的に含むコーパスで学習
- オープンウェイト — モデルの重みが公開されており、ローカルデプロイ可能
今までとの違い
「シングルエージェント」から「Swarm」へ
従来のコーディングモデルは1つのエージェントが逐次的にタスクを処理していた。Agent Swarmは異なるアプローチを取る——タスクを複数のサブタスクに分解し、それぞれに専門化したエージェントを割り当て、結果を統合する。
例えば「このリポジトリのテストカバレッジを80%に上げて」という指示に対し、モジュールごとに独立したエージェントがテストを生成し、最終的に統合・整合性チェックを行う。
中国発オープンモデルの台頭
DeepSeek、Qwen、そしてKimiと、中国発のオープンウェイトモデルが性能面で急速にフロンティアに追いついている。Agent Swarmのような独自機能を持つモデルが登場したことで、「オープン vs クローズド」の競争軸に「エージェント設計の独自性」が加わった。
この先に何が見えるか
- マルチエージェント協調の標準化 — 複数のAIエージェントがチームとして動く開発パラダイムの加速
- 動画→コード生成 — UIデモ動画を入力にしてフロントエンドコードを生成するワークフローの普及
- オープンモデルの性能天井の引き上げ — SWE-bench 80%超をオープンモデルが達成する日が近い
免責事項 — 掲載情報は執筆時点のものです。料金・機能は変更される場合があります。最新情報は各公式サイトをご確認ください。