GPT-5.3-Codex-Spark — Cerebras搭載の超高速コーディングモデル

Lab AI GPT-5.3-Codex-Spark — Cerebras搭載の超高速コーディングモデル

概要

OpenAIがCerebras Wafer Scale Engine 3上で動作する超高速コーディングモデルを発表。毎秒1,000トークンを超える推論速度を実現し、OpenAIとして初めてNVIDIA以外のハードウェアで本番運用されるモデルとなった。

従来のGPU推論では、モデルの重みをGPUメモリに載せきれない場合にモデル並列化やバッチ処理が必要だった。Cerebrasのアプローチは根本的に異なる——46,225平方ミリメートルのシングルチップにモデル全体を載せることで、GPU間通信のオーバーヘッドを完全に排除する。

結果として、レイテンシが劇的に低下する。コードを書いている最中に「生成を待つ」感覚がなくなるレベルの応答速度は、開発体験そのものを変える可能性がある。

OpenAIがNVIDIA以外のハードウェアで本番モデルを稼働させたのはこれが初めてだ。これは技術的な判断であると同時に、サプライチェーンの多様化という戦略的判断でもある。

免責事項 — 掲載情報は執筆時点のものです。料金・機能は変更される場合があります。最新情報は各公式サイトをご確認ください。