GLM-5.2:智譜 AI 的 100 萬 Token 開放權重編碼與 Agentic 模型
智譜採用 MIT 授權的旗艦模型專為編碼、工具使用同長週期 agent 而設——以下係對開發者意味住乜

智譜 AI 剛推出一個開放權重模型,感覺上係為 agent 而唔係聊天而設。GLM-5.2 係智譜最新旗艦——專為編碼、推理同以工具驅動的「agentic」工作負載而打造——並且以 MIT 開源授權提供 100 萬 token 上下文窗口。呢個模型喺 2026 年 6 月 13 日發布,接替 GLM-5 家族中的 GLM-5.1,已經喺 Z.ai 的 GLM Coding Plan 同多個第三方平台上線。(apidog)
如果你正喺度開發 AI agent、自主編碼工具,或者長週期工作流程,GLM-5.2 係最早一批讀起上嚟似係為你嘅使用場景而生的開放權重模型之一——而唔係由一個通用助手硬改出嚟。呢篇指南會拆解 GLM-5.2 到底係乜、其架構同上下文窗口、推理模式、定價、早期基準測試情況,以及開發者點樣喺 Eigent 呢類 agent 平台入面發揮最大效用。
GLM-5.2 係乜?
GLM-5.2 係智譜 AI(全球以 Z.ai 營運)推出的開放權重大型語言模型,重點調校用於軟件工程、多步推理同工具增強型 agent 工作。佢建立喺 GLM-5 同 GLM-5.1 引入的 Mixture-of-Experts (MoE) 基礎之上,並將上下文窗口擴展到實用的 100 萬 token,同時保持強勁的編碼表現。(Modular)
喺底層,GLM-5.2 採用大約 750B 參數的稀疏 MoE 設計,每個 token 約有 40B 活躍參數,並配合一種新嘅「IndexShare」稀疏注意力技術,目標係控制 100 萬上下文推理成本。智譜將呢個模型定位為以編碼為先、面向 agent 的系統,而唔係通用聊天模型——對話只係一個副產品,真正重點係打造一個強大、面向開發者的引擎。(LLM Reference)
呢種以 agent 為先的定位,令 GLM-5.2 同 Anthropic 嘅 Claude Fable 5 進入同一個討論範圍:越嚟越多前沿模型首先係圍繞長週期 agentic 使用而設,聊天只係次要介面。
關鍵規格同架構
GLM-5.2 嘅主打功能圍繞上下文、推理同開放性而展開。(DataCamp)
- 100 萬 token 上下文窗口,透過
glm-5.2[1m]模型 ID 提供——足以容納完整 monorepo、大型文件,或者長時間運行的 agent 狀態。(note) - 每次回應最多 131,072 個輸出 token——足以一次過生成或重構非常大型的文件。(Lush Binary)
- MoE 設計,總參數約 753B,每個 token 約 40B 活躍參數,沿用 GLM-5.1 基礎。(dev.to)
- IndexShare——一種稀疏注意力方案,可喺多層稀疏層之間重用同一個 attention indexer,降低長上下文長度下每 token 的 FLOPs。(Latent Space)
- 改進的 multi-token prediction (MTP) 層,用於 speculative decoding,據報可將接受率提升最多約 20%,並改善吞吐量。(Latent Space)
Z.ai 強調,GLM-5.2 保留咗 GLM-5 系列「開放權重、編碼優先 DNA」,而係升級上下文窗口同推理控制,而唔係追求全新架構。(Modular)
100 萬 Token 上下文:點解重要
100 萬 token 上下文窗口係 GLM-5.2 最明顯嘅差異化優勢。呢個數字大概係之前 GLM-5.x 窗口嘅五倍,令 GLM-5.2 躋身開放權重生態中最大、可公開實用的上下文窗口之一。(LLM Reference)
實際上,呢個特性解鎖咗幾個過去一向比較脆弱的工作流程:
- 代碼庫級別理解——將整個服務、monorepo,或者微服務集群放入同一個上下文,而唔需要激進截斷。(Lush Binary)
- 長時間運行的 agents——agent 可以喺上下文入面維持跨日或跨 session 的工作記憶,而唔係要將一切壓縮成工具專用摘要。(CometAPI)
- 複雜文件分析——法律文集、技術標準,或者數千頁 PDF,可以一次過處理,而唔使靠分塊再拼接的管線。(CometAPI)
Cloudflare Workers AI 的整合喺度提供咗一個有用信號:佢以 function calling、推理支援同大型上下文(目前部署為 262k tokens,並計劃擴展)方式提供 GLM-5.2,特別針對大型 codebase 同多步規劃。呢個反映出模型係為持續、高上下文工作負載而調校,而唔只係一個市場宣傳層面嘅「100 萬」數字。(Cloudflare)
雙重推理模式:High 同 Max
GLM-5.2 引入咗兩級「thinking-effort」系統:High 同 Max。(AI Weekly)
- High 係大多數編碼任務嘅預設模式,會先以結構化 chain-of-thought 推理再回應,但推理預算有上限。Z.ai 建議用於日常代碼生成、重構同除錯,適合你想兼顧可靠性同速度嘅場景。(DataCamp)
- Max 會提升推理預算,用於更複雜問題同更長嘅 agentic 序列,但代價係延遲同 token 用量增加。適合非平凡 bug、跨服務重構、架構變更同多步規劃。(AI Weekly)
從 agent 設計角度睇,呢個提供咗一個控制桿,讓你可以根據任務難度調整推理深度,而唔使切換模型。你可以將日常操作路由去 High,將棘手工單、規劃步驟或者失敗嘗試升級到 Max——呢個其實係嚴肅 agentic 系統已經常用嘅分類與路由模式,只不過用單一模型去實現。
Agentic 能力同工具使用
智譜將 GLM-5.2 品牌化為「agent-oriented」模型,旨在支援自主工作流程、工具增強型 agents 同長週期編碼任務。(Atlas Cloud)
Cloudflare 的部署將 @cf/zai-org/glm-5.2 描述為一個「為 agentic coding workflows 而建」的文本生成模型,並提供一流的 function calling 同多輪工具使用支援。佢特別指出:(Cloudflare)
- Function calling:可喺多個對話回合中調用工具同 API,支援經典 agent 工具使用循環。
- 長週期規劃:依靠 100 萬上下文同推理模式,面向大型代碼庫。(note)
- 複雜問題解決:包括多步推理同結構化 chain-of-thought。(dev.to)
第三方評測強調,GLM-5.2 更適合倉庫規模的軟件工程同長時間運行的 agent 工作流程,而唔係一次性 code completion——呢點同 Z.ai 嘅訊息一致,即 GLM 係「刻意為軟件開發而設,而唔係純聊天」,其設計核心就係編碼、工具使用同長期 agent 工作流程。(AI for Anything)
開放權重同授權
GLM-5.2 最大嘅策略動作之一,就係其授權同分發方式。Z.ai 承諾將 GLM-5.2 作為 MIT 授權、開放權重模型 發布,延續 GLM-5 同 GLM-5.1 嘅路線。(Gigazine)
- LLM Reference 同開發者指南將 GLM-5.2 描述為採用 MIT 授權的開源、開放權重模型,權重可喺 Hugging Face 下載(例如
zai-org/GLM-5.2同 FP8 版本)。(apidog) - 日本同中國嘅媒體報導亦提到,GLM-5.2 會喺 2026 年 6 月第三週以開放模型形式發布,初期先供 GLM Coding Plan 訂閱者使用。(AI for Anything)
呢點對生態系統好重要:一個開放權重、MIT 授權、前沿級編碼模型,仲有 100 萬 token 上下文,令獨立開發者同開源平台喺 agentic 系統方面有一個認真替代封閉模型嘅選擇。
基準測試同早期表現信號
喺發布時,Z.ai 尤其冇公布一套完整官方 benchmark 套件俾 GLM-5.2——呢點已經被唔少觀察者指出。面向開發者嘅博客強調,公司喺初期技術溝通中更重視「1M context 同 agentic RL 的基礎設施創新」,而唔係 benchmark 圖表。(DataCamp)
不過,LLM Reference 同模型卡總結咗其自報分數,顯示 GLM-5.2 喺編碼同推理基準上具競爭力——包括 SWE-bench Pro、Terminal-Bench 同工具使用評估等任務上有唔錯表現,但獨立驗證仍然追緊。喺第三方評測出現之前,應將早期數字視為方向性參考,而唔係定論。(LLM Reference)
如果你正比較 GLM-5.2 vs GPT-5 vs Claude,老實講,到今日為止,我哋對 GLM-5.2 有更多透明的定價同上下文規格,但要做到完全 apples-to-apples 的第三方 benchmark,數據仲未夠齊。
定價同使用方式
Z.ai 正喺其自家產品同合作平台上廣泛推出 GLM-5.2,定價通常同之前 GLM-5.x 模型相同或更低。(AI for Anything)
主要存取路徑包括:
- GLM Coding Plan(Lite / Pro / Max / Team)——GLM-5.2 已成為所有層級的預設旗艦模型,可直接透過 Z.ai 的編碼工具同聊天介面使用。(Gigazine)
- 獨立 API 同聊天——Z.ai 已宣布 GLM-5.2 API 同聊天存取會喺編碼工具推出後不久跟上。(note)
- 第三方供應商——OpenRouter 同多模型 gateway 等平台將 GLM-5.2 標價約每 100 萬 input tokens $1.4(output 更高),喺某些地區定位為大約比 GPT-5 或同類前沿模型平一個數量級。(Atlas Cloud)
- Workers AI(Cloudflare)——提供
@cf/zai-org/glm-5.2,支援 function calling 同大型上下文,可直接整合入 edge functions 同 serverless 工作流程。(Cloudflare)
如果要自行部署,開放權重同 MIT 授權令你可以將 GLM-5.2 放入自己嘅基礎設施或專門推理堆疊,包括針對 MoE 優化的 runtime。(Modular)
使用場景:GLM-5.2 最擅長咩
對 agent 同工具開發者嚟講,當你充分利用佢嘅長上下文同編碼焦點時,GLM-5.2 最具吸引力。
倉庫規模編碼 agents
100 萬上下文、High/Max 推理模式同 function calling 嘅組合,令 GLM-5.2 成為以下場景嘅強力候選:
- 自主代碼庫重構同遷移。
- 跨服務依賴分析同 API 表面探索。
- 跨多個代碼庫嘅多步除錯工作流程。
開發者指南指出,GLM-5.2 係喺「倉庫規模」工程任務上做過測試,而唔係玩具 repo;其長上下文明確係為咗「喺真實代碼庫上頂得住,而唔係喺幾十萬 token 後就散晒」。(dev.to)
長週期 agent 工作流程
由於 GLM-5.2 可以維持超大上下文,並提供推理控制,所以好適合以下類型 agent:
- 保持豐富、token 級嘅先前運行記憶,而唔係不斷做摘要。
- 透過多次對話回合,以 function calls 協調多工具工作流程(API、資料庫、搜尋、內部工具)。(CometAPI)
- 喺同一上下文中混合規劃同執行——將計劃、中間結果同日誌同源碼同文件一齊保存。(Lush Binary)
幾篇評測都將 GLM-5.2 視為對開發者對「長跑型」agents 的需求作出回應:可以持續幾個鐘頭處理同一個問題,而唔撞上硬性上下文限制。(note)
多語言開發同文件
GLM-5.2 保持強勁嘅多語言支援,英語同中文都係一級語言,並承襲自 GLM-5 系列的更廣泛多語能力。對於處理英中雙語 codebase 同文件的團隊,尤其係開源場景,呢點相當有吸引力。(apidog)
限制同未解問題
GLM-5.2 好有野心,但有幾點注意事項值得記住:
- 基準測試仍未完整。 喺未有全面 benchmark 套件下發布,意味住早期採用者要依賴自報分數同零散測試。(AI Weekly)
- 100 萬上下文未必完全開放。 某些平台,例如 Cloudflare Workers AI,目前部署上限遠低於 100 萬(例如 262k tokens),即使底層模型支援更多。(note)
- MoE 同長上下文推理都好吃硬件。 即使有 IndexShare 同 MTP 優化降低每 token FLOPs,100 萬 token 的 MoE 推理喺自家部署時仍然比小型 dense 模型昂貴——GLM-5.2 唔係可以直接當做單張消費級 GPU 上的輕量推理替代品。(apidog)
GLM-5.2 點樣融入 AI Agent 生態
從策略上睇,GLM-5.2 推動咗 agent 領域三個趨勢向前:
- 開放權重前沿模型。 GLM-5.2 證明咗前沿級編碼同 agentic 能力,加上 100 萬上下文,可以喺寬鬆授權下推出——令開源生態更有槓桿。(Gigazine)
- 以 agent 為先的定位。 Z.ai 明確將 GLM-5.2 品牌化為「agent-oriented」模型,針對長期工作流程優化,而唔只係聊天——呢點正正係認真做自動化的開發者一直想要嘅。(Atlas Cloud)
- 將上下文作為一級產品功能。 唔係細微嘅 marketing 提升,而係將 GLM-5.2 升級到實用的 100 萬 token——再配合 IndexShare 同 MTP 呢類基礎設施變更——顯示長上下文可靠性正成為 agent 平台嘅基線預期。(Latent Space)
對創辦人、平台建設者同 agent framework 作者嚟講,開放權重、agentic 調校同極端上下文呢個組合,令 GLM-5.2 係一個值得試嘅模型——無論係作為主引擎,定係 multi-model 路由策略的一部分。
而呢點正正適合 模型無關、multi-agent 基礎設施。模型版圖變得好快,而贏嘅平台係能夠將 GLM-5.2 呢類模型插入去處理最難問題——而唔需要重做整個 stack。就好似我哋 將 MiniMax M2.1 交由 Eigent 的 CAMEL Workforce 運行 一樣,GLM-5.2 呢類開放權重模型可以乾淨利落地接入同一套 orchestration 層。如果你正喺呢類基礎之上構建,探索一下開源、多 agent 平台 Eigent 點樣幫你喺真實工作流程中協調專門模型。
常見問題
GLM-5.2 係乜?
GLM-5.2 係智譜 AI(Z.ai)最新旗艦開放權重模型,針對編碼、推理同 agentic 工具使用而調校。佢採用 Mixture-of-Experts 架構(總參數約 753B,每個 token 約 40B 活躍參數),配備 100 萬 token 上下文窗口,並以 MIT 開源授權發布。
GLM-5.2 的上下文窗口有幾大?
GLM-5.2 透過 glm-5.2[1m] 模型 ID 支援 100 萬 token 上下文窗口——大約係之前 GLM-5.x 窗口的五倍。要注意,部分平台目前只開放少於完整 100 萬 token 的上下文(例如 Cloudflare Workers AI 目前部署為 262k tokens)。
GLM-5.2 係開源嗎?
係。Z.ai 以 MIT 授權將 GLM-5.2 作為開放權重模型發布,權重可喺 Hugging Face 下載(例如 zai-org/GLM-5.2 同 FP8 版本),延續 GLM-5 同 GLM-5.1 的開放權重路線。
GLM-5.2 幾錢?
Z.ai 將 GLM-5.2 作為 GLM Coding Plan 各層級的預設旗艦模型打包提供。喺 OpenRouter 呢類第三方 gateway,上面標價約每 100 萬 input tokens $1.4(output 更高)——喺某些地區大概比 GPT-5 或同類前沿模型平一個數量級。
GLM-5.2 的 High 同 Max 推理模式係乜?
佢哋係兩個「thinking-effort」級別。High 係日常編碼任務的預設模式,使用 chain-of-thought 推理並設有預算上限,以保持速度同可靠性。Max 會提高推理預算,用於更難問題——例如非平凡 bug、跨服務重構同多步規劃——但代價係延遲同 token 用量增加。
我可以喺 Eigent 用 GLM-5.2 嗎?
可以。Eigent 的模型無關、multi-agent 架構,令你可以透過其 MCP 工具同 Skills framework 將任務路由到 GLM-5.2——利用其長上下文同編碼焦點處理倉庫規模工作,同時將其他模型留俾日常任務。
Recent Posts

香港 Claude 教學:介面、Prompt 寫作、粵語內容實戰
畀香港用家嘅實用 Claude 教學:介面導覽、粵語/繁體中文 Prompt 範本、寫程式技巧,仲有一個免費替代方案。

點樣喺香港用 Claude?最新完整教學
香港 IP 入唔到 Claude.ai?本文解釋原因,教你用 VPN+電話驗證、AWS 企業版繞過地區限制,仲會講安全合規同一個免費開源替代方案。

2026 年最佳法律 AI 代理:頂尖平台比較(附免費替代方案)
比較 2026 年最佳法律 AI 代理:Harvey、CoCounsel、Lexis+ Protégé、Kira、Spellbook,以及可自行託管的免費開源法律 AI Eigent。