R1 Distill Qwen 32B

DeepSeek R1 Distill Qwen 32Bは、[Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B)をベースとした蒸留大規模言語モデルで、[DeepSeek R1](/deepseek/deepseek-r1)の出力を使用しています。様々なベンチマークでOpenAIのo1-miniを上回り、密集型モデルの新しい最先端の結果を達成しています。その他のベンチマーク結果は以下の通りです： - AIME 2024 pass@1: 72.6 - MATH-500 pass@1: 94.3 - CodeForces Rating: 1691 このモデルはDeepSeek R1の出力からのファインチューニングを活用し、より大規模なフロンティアモデルに匹敵する競争力のあるパフォーマンスを実現しています。

2025/1/29

32,768 トークン

仕様