Mercury 2

Mercury 2は非常に高速な推論LLMであり、最初の推論拡散LLM（dLLM）です。トークンを順序立てて生成する代わりに、Mercury 2は複数のトークンを並列で生成・改善し、標準GPUで1秒あたり1,000トークン以上を実現します。Mercury 2は、Claude 4.5 HaikuやGPT 5 Miniなどの速度最適化LLMより5倍以上高速で、コストは大幅に削減されます。 Mercury 2は、調整可能な推論レベル、128Kコンテキスト、ネイティブツール使用、スキーマ準拠のJSON出力に対応しています。レイテンシが複合する開発ワークフロー、リアルタイム音声/検索、エージェントループ向けに構築されています。OpenAI API互換です。詳細は[ブログ投稿](https://www.inceptionlabs.ai/blog/introducing-mercury-2)をご覧ください。

2026/3/4

128,000 トークン

#54 コード (総合)

仕様

モダリティ

入力

text

出力

text

サポートされているパラメータ

include_reasoning

max_tokens

reasoning

response_format

stop

structured_outputs

temperature

tool_choice

tools

最大出力トークン

50,000

リーダーボード

テキスト

🏆総合ELO: 1,348

#141

🇬🇧英語ELO: 1,366

#144

russianELO: 1,308

#170

💻コーディングELO: 1,398

#134

✍️創作ELO: 1,297

#167

📝指示遵守ELO: 1,322

#154

🌶️高難度ELO: 1,360

#148

💬マルチターンELO: 1,343

#141

コード

🏆総合ELO: 1,183

#54

Inceptionの他のモデル