モデル一覧に戻る
z-ai/glm-4-6v
利用不可

GLM 4.6V

GLM-4.6Vは、画像、ドキュメント、混合メディア全体にわたって高忠実度の視覚理解と長文脈推論のために設計された大規模マルチモーダルモデルです。最大128Kトークンをサポートし、複雑なページレイアウトとチャートを視覚入力として直接処理し、知覚とダウンストリームツール実行を接続するネイティブマルチモーダル関数呼び出しを統合しています。このモデルはまた、スクリーンショットからHTMLへの合成と反復的な視覚編集を含む、インターリーブされた画像テキスト生成とUI再構築ワークフローを可能にします。

2025/12/8
131,072 トークン
仕様

モダリティ

入力
image
text
video
出力
text

サポートされているパラメータ

frequency_penalty
include_reasoning
max_tokens
min_p
presence_penalty
reasoning
repetition_penalty
response_format
seed
stop
structured_outputs
temperature
tool_choice
tools
top_k
top_p

最大出力トークン

131,072