モデル一覧に戻る
deepseek logo
deepseek/deepseek-r1-distill-qwen-32b
利用不可

R1 Distill Qwen 32B

DeepSeek R1 Distill Qwen 32Bは、[Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B)をベースとした蒸留大規模言語モデルで、[DeepSeek R1](/deepseek/deepseek-r1)の出力を使用しています。様々なベンチマークでOpenAIのo1-miniを上回り、密集型モデルの新しい最先端の結果を達成しています。 その他のベンチマーク結果は以下の通りです: - AIME 2024 pass@1: 72.6 - MATH-500 pass@1: 94.3 - CodeForces Rating: 1691 このモデルはDeepSeek R1の出力からのファインチューニングを活用し、より大規模なフロンティアモデルに匹敵する競争力のあるパフォーマンスを実現しています。

2025/1/29
32,768 トークン
仕様

モダリティ

入力
text
出力
text

サポートされているパラメータ

frequency_penalty
include_reasoning
max_tokens
presence_penalty
reasoning
repetition_penalty
response_format
seed
stop
structured_outputs
temperature
top_k
top_p

最大出力トークン

32,768