GLM-5 レビュー:MITライセンスのオープン大規模MoEは「コーディング特化」で選ぶ
結論から言うと、GLM-5(glm-5)は「コーディングとエージェント用途を、MITライセンスのオープンモデルで割安に回したい」場面で有力な選択肢です。一方で、長文脈の読解や厳密な指示追従は同クラスの上位に一歩譲るとの報告もあり、用途を選んで使うモデルです。
概要:オープンモデルとしての位置づけ
GLM-5 は Zhipu AI(Z.ai)が 2026年2月11日に公開した大規模 Mixture-of-Experts(MoE)モデルです。各レビューによると総パラメータは 744B(約7,440億)規模で、専門家(experts)の一部だけを推論ごとに使うスパース構造により、アクティブパラメータは約44Bにとどまります。コンテキスト長は 約200K(202K)トークンと報じられています。
注目点は MITライセンスでの重み公開です(Hugging Face 上で配布)。商用利用・改変・ファインチューニングが許諾された、最も寛容な部類のライセンスで、「フロンティアに近い性能をオープンに使える」という点が GLM-5 最大の魅力です。
強み:コーディングとエージェント
GLM-5 はソフトウェアエンジニアリング系の評価で目立ちます。複数のレビューは SWE-bench Verified で 77.8% という値を伝えており、これはクローズドの上位勢(後述)に肉薄するスコアです。また科学系の GPQA で 86% という報告もあります。
エージェント用途の評価も比較的高く、Artificial Analysis の計測では agentic index 68.4、ツール使用を伴うタスク信頼性の指標 tau2 が 0.974 と報告されています。関数呼び出し(function calling)と長めのコンテキストを組み合わせた、多段階の自動化ワークフローに向く性格づけです。
弱み・注意点
得意がコーディングに寄っている分、苦手も明確です。レビューによると 指示追従(ifbench 0.552)は及第点だが突出はせず、長文脈の推論(lcr 0.37)はこのクラスとしては平均以下との指摘があります。長大なドキュメントを丁寧に読ませる用途では期待しすぎないほうが無難です。
加えて 出力がやや冗長で、実運用ではトークンコストが膨らみやすいという声もあります。コーディング以外の汎用タスクでは、クローズドのフロンティアが依然リードするという評価が一般的です。
他モデルとの比較
SWE-bench Verified を軸に、各レビューが伝える数値を並べます(出典により小数の差はあります)。
| モデル | 種別 | SWE-bench Verified |
|---|---|---|
| GLM-5 | オープン(MIT) | 77.8% |
| Claude Sonnet 4.6 | クローズド | 79.6% |
| GPT-5.2 | クローズド | 80.0% |
| Claude Opus 4.6 | クローズド | 80.8% |
差は数ポイントで、「コーディングに限ればオープンでもフロンティアに迫る」という評価は妥当に見えます。オープン同士(DeepSeek/Qwen/MiniMax 系)でも GLM 系はエージェント・コーディングで上位常連という声が多い一方、汎用知能の総合指標では closed 勢が上、という整理が現実的です。なお後継の GLM-5.1 はさらに数値を伸ばしたと報じられていますが、本記事は glm-5 を対象としています。
コスト感
オープンモデルらしく、クローズドのフロンティアに比べて単価を抑えやすいのが利点です。参考として、提供元系の情報では GLM-5(Reasoning)の目安は 入力 $1.00 / 100万トークン、出力 $3.20 / 100万トークンとされます(プロバイダにより異なります)。FastMetal での円建ての実際の単価は料金ページでご確認ください。前述のとおり出力が長くなりがちな点は、コスト試算時に織り込んでおくと安全です。
日本語での使い勝手
GLM-5 は多言語対応で、日本語の一般的なタスクでも実用的な応答が得られます。ただし、日本語に特化した公開ベンチマークは確認できませんでした。ニュアンスや敬語、専門用語が重要な業務では、ベンチマークの数値を鵜呑みにせず、自分の実プロンプトで品質を必ず検証してから採用することをおすすめします。
向いている用途/向かない用途
向いている:
- コーディング、コードレビュー、エージェント的な多段階処理
- ツール呼び出しを伴う自動化ワークフロー
- コストを抑えつつ高めのコーディング性能が欲しい場面
向かない:
- 超長文ドキュメントの精密な読解・要約
- 厳密な指示追従が最優先のタスク
- 出力トークンを極限まで절約したい用途
よくある質問
Q. GLM-5 はオープンモデルですか? はい。各レビューによると、重みが MIT ライセンスで公開されており、商用利用・改変・ファインチューニングが可能です。
Q. クローズドのフロンティアモデルと比べてどうですか? コーディング(SWE-bench Verified 77.8%)では Claude や GPT の上位に数ポイント差まで迫る一方、汎用知能や長文脈推論では closed 勢がリードする、というのが各レビューの一致した見方です。
Q. 日本語は問題なく使えますか? 多言語対応で一般用途は実用的ですが、日本語特化のベンチマークは見当たりませんでした。重要な用途では実プロンプトでの検証をおすすめします。
FastMetal で試す
FastMetal なら、glm-5 も Claude などのクローズドモデルも 同じ API キー・同じ円建て残高で切り替えられます。まずは1リクエストから。
curl https://api.fastmetal.ai/v1/chat/completions \
-H "Authorization: Bearer $FASTMETAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5",
"messages": [{"role": "user", "content": "こんにちは"}]
}'
model を差し替えるだけで、同じコードのまま GLM-5 とクローズドモデルの出力品質・コスト・速度を直接比較できます。対応モデルはモデルカタログ、単価は料金ページで確認できます。