モデル一覧に戻る
inception/mercury-2
利用不可

Mercury 2

Mercury 2は非常に高速な推論LLMであり、最初の推論拡散LLM(dLLM)です。 トークンを順序立てて生成する代わりに、Mercury 2は複数のトークンを並列で生成・改善し、標準GPUで1秒あたり1,000トークン以上を実現します。Mercury 2は、Claude 4.5 HaikuやGPT 5 Miniなどの速度最適化LLMより5倍以上高速で、コストは大幅に削減されます。 Mercury 2は、調整可能な推論レベル、128Kコンテキスト、ネイティブツール使用、スキーマ準拠のJSON出力に対応しています。レイテンシが複合する開発ワークフロー、リアルタイム音声/検索、エージェントループ向けに構築されています。OpenAI API互換です。詳細は[ブログ投稿](https://www.inceptionlabs.ai/blog/introducing-mercury-2)をご覧ください。

2026/3/4
128,000 トークン
#54 コード (総合)
仕様

モダリティ

入力
text
出力
text

サポートされているパラメータ

include_reasoning
max_tokens
reasoning
response_format
stop
structured_outputs
temperature
tool_choice
tools

最大出力トークン

50,000
リーダーボード
テキスト
🏆総合ELO: 1,348
#141
🇬🇧英語ELO: 1,366
#144
russianELO: 1,308
#170
💻コーディングELO: 1,398
#134
✍️創作ELO: 1,297
#167
📝指示遵守ELO: 1,322
#154
🌶️高難度ELO: 1,360
#148
💬マルチターンELO: 1,343
#141
コード
🏆総合ELO: 1,183
#54