行業Jun 18, 2026

GLM-5.2：智譜 AI 的 100 萬 Token 開放權重編碼與 Agentic 模型

智譜採用 MIT 授權的旗艦模型專為編碼、工具使用同長週期 agent 而設——以下係對開發者意味住乜

Douglas Lai

Share to

智譜 AI 剛推出一個開放權重模型，感覺上係為 agent 而唔係聊天而設。GLM-5.2 係智譜最新旗艦——專為編碼、推理同以工具驅動的「agentic」工作負載而打造——並且以 MIT 開源授權提供 100 萬 token 上下文窗口。呢個模型喺 2026 年 6 月 13 日發布，接替 GLM-5 家族中的 GLM-5.1，已經喺 Z.ai 的 GLM Coding Plan 同多個第三方平台上線。(apidog)

如果你正喺度開發 AI agent、自主編碼工具，或者長週期工作流程，GLM-5.2 係最早一批讀起上嚟似係為你嘅使用場景而生的開放權重模型之一——而唔係由一個通用助手硬改出嚟。呢篇指南會拆解 GLM-5.2 到底係乜、其架構同上下文窗口、推理模式、定價、早期基準測試情況，以及開發者點樣喺 Eigent 呢類 agent 平台入面發揮最大效用。

GLM-5.2 係乜？

GLM-5.2 係智譜 AI（全球以 Z.ai 營運）推出的開放權重大型語言模型，重點調校用於軟件工程、多步推理同工具增強型 agent 工作。佢建立喺 GLM-5 同 GLM-5.1 引入的 Mixture-of-Experts (MoE) 基礎之上，並將上下文窗口擴展到實用的 100 萬 token，同時保持強勁的編碼表現。(Modular)

喺底層，GLM-5.2 採用大約 750B 參數的稀疏 MoE 設計，每個 token 約有 40B 活躍參數，並配合一種新嘅「IndexShare」稀疏注意力技術，目標係控制 100 萬上下文推理成本。智譜將呢個模型定位為以編碼為先、面向 agent 的系統，而唔係通用聊天模型——對話只係一個副產品，真正重點係打造一個強大、面向開發者的引擎。(LLM Reference)

呢種以 agent 為先的定位，令 GLM-5.2 同 Anthropic 嘅 Claude Fable 5 進入同一個討論範圍：越嚟越多前沿模型首先係圍繞長週期 agentic 使用而設，聊天只係次要介面。

關鍵規格同架構

GLM-5.2 嘅主打功能圍繞上下文、推理同開放性而展開。(DataCamp)

100 萬 token 上下文窗口，透過 glm-5.2[1m] 模型 ID 提供——足以容納完整 monorepo、大型文件，或者長時間運行的 agent 狀態。(note)
每次回應最多 131,072 個輸出 token——足以一次過生成或重構非常大型的文件。(Lush Binary)
MoE 設計，總參數約 753B，每個 token 約 40B 活躍參數，沿用 GLM-5.1 基礎。(dev.to)
IndexShare——一種稀疏注意力方案，可喺多層稀疏層之間重用同一個 attention indexer，降低長上下文長度下每 token 的 FLOPs。(Latent Space)
改進的 multi-token prediction (MTP) 層，用於 speculative decoding，據報可將接受率提升最多約 20%，並改善吞吐量。(Latent Space)

Z.ai 強調，GLM-5.2 保留咗 GLM-5 系列「開放權重、編碼優先 DNA」，而係升級上下文窗口同推理控制，而唔係追求全新架構。(Modular)

100 萬 Token 上下文：點解重要

100 萬 token 上下文窗口係 GLM-5.2 最明顯嘅差異化優勢。呢個數字大概係之前 GLM-5.x 窗口嘅五倍，令 GLM-5.2 躋身開放權重生態中最大、可公開實用的上下文窗口之一。(LLM Reference)

實際上，呢個特性解鎖咗幾個過去一向比較脆弱的工作流程：

代碼庫級別理解——將整個服務、monorepo，或者微服務集群放入同一個上下文，而唔需要激進截斷。(Lush Binary)
長時間運行的 agents——agent 可以喺上下文入面維持跨日或跨 session 的工作記憶，而唔係要將一切壓縮成工具專用摘要。(CometAPI)
複雜文件分析——法律文集、技術標準，或者數千頁 PDF，可以一次過處理，而唔使靠分塊再拼接的管線。(CometAPI)

Cloudflare Workers AI 的整合喺度提供咗一個有用信號：佢以 function calling、推理支援同大型上下文（目前部署為 262k tokens，並計劃擴展）方式提供 GLM-5.2，特別針對大型 codebase 同多步規劃。呢個反映出模型係為持續、高上下文工作負載而調校，而唔只係一個市場宣傳層面嘅「100 萬」數字。(Cloudflare)

雙重推理模式：High 同 Max

GLM-5.2 引入咗兩級「thinking-effort」系統：High 同 Max。(AI Weekly)

High 係大多數編碼任務嘅預設模式，會先以結構化 chain-of-thought 推理再回應，但推理預算有上限。Z.ai 建議用於日常代碼生成、重構同除錯，適合你想兼顧可靠性同速度嘅場景。(DataCamp)
Max 會提升推理預算，用於更複雜問題同更長嘅 agentic 序列，但代價係延遲同 token 用量增加。適合非平凡 bug、跨服務重構、架構變更同多步規劃。(AI Weekly)

從 agent 設計角度睇，呢個提供咗一個控制桿，讓你可以根據任務難度調整推理深度，而唔使切換模型。你可以將日常操作路由去 High，將棘手工單、規劃步驟或者失敗嘗試升級到 Max——呢個其實係嚴肅 agentic 系統已經常用嘅分類與路由模式，只不過用單一模型去實現。

Agentic 能力同工具使用

智譜將 GLM-5.2 品牌化為「agent-oriented」模型，旨在支援自主工作流程、工具增強型 agents 同長週期編碼任務。(Atlas Cloud)

Cloudflare 的部署將 @cf/zai-org/glm-5.2 描述為一個「為 agentic coding workflows 而建」的文本生成模型，並提供一流的 function calling 同多輪工具使用支援。佢特別指出：(Cloudflare)

Function calling：可喺多個對話回合中調用工具同 API，支援經典 agent 工具使用循環。
長週期規劃：依靠 100 萬上下文同推理模式，面向大型代碼庫。(note)
複雜問題解決：包括多步推理同結構化 chain-of-thought。(dev.to)

第三方評測強調，GLM-5.2 更適合倉庫規模的軟件工程同長時間運行的 agent 工作流程，而唔係一次性 code completion——呢點同 Z.ai 嘅訊息一致，即 GLM 係「刻意為軟件開發而設，而唔係純聊天」，其設計核心就係編碼、工具使用同長期 agent 工作流程。(AI for Anything)

開放權重同授權

GLM-5.2 最大嘅策略動作之一，就係其授權同分發方式。Z.ai 承諾將 GLM-5.2 作為 MIT 授權、開放權重模型 發布，延續 GLM-5 同 GLM-5.1 嘅路線。(Gigazine)

LLM Reference 同開發者指南將 GLM-5.2 描述為採用 MIT 授權的開源、開放權重模型，權重可喺 Hugging Face 下載（例如 zai-org/GLM-5.2 同 FP8 版本）。(apidog)
日本同中國嘅媒體報導亦提到，GLM-5.2 會喺 2026 年 6 月第三週以開放模型形式發布，初期先供 GLM Coding Plan 訂閱者使用。(AI for Anything)

呢點對生態系統好重要：一個開放權重、MIT 授權、前沿級編碼模型，仲有 100 萬 token 上下文，令獨立開發者同開源平台喺 agentic 系統方面有一個認真替代封閉模型嘅選擇。

基準測試同早期表現信號

喺發布時，Z.ai 尤其冇公布一套完整官方 benchmark 套件俾 GLM-5.2——呢點已經被唔少觀察者指出。面向開發者嘅博客強調，公司喺初期技術溝通中更重視「1M context 同 agentic RL 的基礎設施創新」，而唔係 benchmark 圖表。(DataCamp)

不過，LLM Reference 同模型卡總結咗其自報分數，顯示 GLM-5.2 喺編碼同推理基準上具競爭力——包括 SWE-bench Pro、Terminal-Bench 同工具使用評估等任務上有唔錯表現，但獨立驗證仍然追緊。喺第三方評測出現之前，應將早期數字視為方向性參考，而唔係定論。(LLM Reference)

如果你正比較 GLM-5.2 vs GPT-5 vs Claude，老實講，到今日為止，我哋對 GLM-5.2 有更多透明的定價同上下文規格，但要做到完全 apples-to-apples 的第三方 benchmark，數據仲未夠齊。

定價同使用方式

Z.ai 正喺其自家產品同合作平台上廣泛推出 GLM-5.2，定價通常同之前 GLM-5.x 模型相同或更低。(AI for Anything)

主要存取路徑包括：

GLM Coding Plan（Lite / Pro / Max / Team）——GLM-5.2 已成為所有層級的預設旗艦模型，可直接透過 Z.ai 的編碼工具同聊天介面使用。(Gigazine)
獨立 API 同聊天——Z.ai 已宣布 GLM-5.2 API 同聊天存取會喺編碼工具推出後不久跟上。(note)
第三方供應商——OpenRouter 同多模型 gateway 等平台將 GLM-5.2 標價約每 100 萬 input tokens $1.4（output 更高），喺某些地區定位為大約比 GPT-5 或同類前沿模型平一個數量級。(Atlas Cloud)
Workers AI（Cloudflare）——提供 @cf/zai-org/glm-5.2，支援 function calling 同大型上下文，可直接整合入 edge functions 同 serverless 工作流程。(Cloudflare)

如果要自行部署，開放權重同 MIT 授權令你可以將 GLM-5.2 放入自己嘅基礎設施或專門推理堆疊，包括針對 MoE 優化的 runtime。(Modular)

使用場景：GLM-5.2 最擅長咩

對 agent 同工具開發者嚟講，當你充分利用佢嘅長上下文同編碼焦點時，GLM-5.2 最具吸引力。

倉庫規模編碼 agents

100 萬上下文、High/Max 推理模式同 function calling 嘅組合，令 GLM-5.2 成為以下場景嘅強力候選：

自主代碼庫重構同遷移。
跨服務依賴分析同 API 表面探索。
跨多個代碼庫嘅多步除錯工作流程。

開發者指南指出，GLM-5.2 係喺「倉庫規模」工程任務上做過測試，而唔係玩具 repo；其長上下文明確係為咗「喺真實代碼庫上頂得住，而唔係喺幾十萬 token 後就散晒」。(dev.to)

長週期 agent 工作流程

由於 GLM-5.2 可以維持超大上下文，並提供推理控制，所以好適合以下類型 agent：

保持豐富、token 級嘅先前運行記憶，而唔係不斷做摘要。
透過多次對話回合，以 function calls 協調多工具工作流程（API、資料庫、搜尋、內部工具）。(CometAPI)
喺同一上下文中混合規劃同執行——將計劃、中間結果同日誌同源碼同文件一齊保存。(Lush Binary)

幾篇評測都將 GLM-5.2 視為對開發者對「長跑型」agents 的需求作出回應：可以持續幾個鐘頭處理同一個問題，而唔撞上硬性上下文限制。(note)

多語言開發同文件

GLM-5.2 保持強勁嘅多語言支援，英語同中文都係一級語言，並承襲自 GLM-5 系列的更廣泛多語能力。對於處理英中雙語 codebase 同文件的團隊，尤其係開源場景，呢點相當有吸引力。(apidog)

限制同未解問題

GLM-5.2 好有野心，但有幾點注意事項值得記住：

基準測試仍未完整。 喺未有全面 benchmark 套件下發布，意味住早期採用者要依賴自報分數同零散測試。(AI Weekly)
100 萬上下文未必完全開放。 某些平台，例如 Cloudflare Workers AI，目前部署上限遠低於 100 萬（例如 262k tokens），即使底層模型支援更多。(note)
MoE 同長上下文推理都好吃硬件。 即使有 IndexShare 同 MTP 優化降低每 token FLOPs，100 萬 token 的 MoE 推理喺自家部署時仍然比小型 dense 模型昂貴——GLM-5.2 唔係可以直接當做單張消費級 GPU 上的輕量推理替代品。(apidog)

GLM-5.2 點樣融入 AI Agent 生態

從策略上睇，GLM-5.2 推動咗 agent 領域三個趨勢向前：

開放權重前沿模型。 GLM-5.2 證明咗前沿級編碼同 agentic 能力，加上 100 萬上下文，可以喺寬鬆授權下推出——令開源生態更有槓桿。(Gigazine)
以 agent 為先的定位。 Z.ai 明確將 GLM-5.2 品牌化為「agent-oriented」模型，針對長期工作流程優化，而唔只係聊天——呢點正正係認真做自動化的開發者一直想要嘅。(Atlas Cloud)
將上下文作為一級產品功能。 唔係細微嘅 marketing 提升，而係將 GLM-5.2 升級到實用的 100 萬 token——再配合 IndexShare 同 MTP 呢類基礎設施變更——顯示長上下文可靠性正成為 agent 平台嘅基線預期。(Latent Space)

對創辦人、平台建設者同 agent framework 作者嚟講，開放權重、agentic 調校同極端上下文呢個組合，令 GLM-5.2 係一個值得試嘅模型——無論係作為主引擎，定係 multi-model 路由策略的一部分。

而呢點正正適合 模型無關、multi-agent 基礎設施。模型版圖變得好快，而贏嘅平台係能夠將 GLM-5.2 呢類模型插入去處理最難問題——而唔需要重做整個 stack。就好似我哋將 MiniMax M2.1 交由 Eigent 的 CAMEL Workforce 運行一樣，GLM-5.2 呢類開放權重模型可以乾淨利落地接入同一套 orchestration 層。如果你正喺呢類基礎之上構建，探索一下開源、多 agent 平台 Eigent 點樣幫你喺真實工作流程中協調專門模型。

常見問題

GLM-5.2 係乜？

GLM-5.2 係智譜 AI（Z.ai）最新旗艦開放權重模型，針對編碼、推理同 agentic 工具使用而調校。佢採用 Mixture-of-Experts 架構（總參數約 753B，每個 token 約 40B 活躍參數），配備 100 萬 token 上下文窗口，並以 MIT 開源授權發布。

GLM-5.2 的上下文窗口有幾大？

GLM-5.2 透過 glm-5.2[1m] 模型 ID 支援 100 萬 token 上下文窗口——大約係之前 GLM-5.x 窗口的五倍。要注意，部分平台目前只開放少於完整 100 萬 token 的上下文（例如 Cloudflare Workers AI 目前部署為 262k tokens）。

GLM-5.2 係開源嗎？

係。Z.ai 以 MIT 授權將 GLM-5.2 作為開放權重模型發布，權重可喺 Hugging Face 下載（例如 zai-org/GLM-5.2 同 FP8 版本），延續 GLM-5 同 GLM-5.1 的開放權重路線。

GLM-5.2 幾錢？

Z.ai 將 GLM-5.2 作為 GLM Coding Plan 各層級的預設旗艦模型打包提供。喺 OpenRouter 呢類第三方 gateway，上面標價約每 100 萬 input tokens $1.4（output 更高）——喺某些地區大概比 GPT-5 或同類前沿模型平一個數量級。

GLM-5.2 的 High 同 Max 推理模式係乜？

佢哋係兩個「thinking-effort」級別。High 係日常編碼任務的預設模式，使用 chain-of-thought 推理並設有預算上限，以保持速度同可靠性。Max 會提高推理預算，用於更難問題——例如非平凡 bug、跨服務重構同多步規劃——但代價係延遲同 token 用量增加。

我可以喺 Eigent 用 GLM-5.2 嗎？

可以。Eigent 的模型無關、multi-agent 架構，令你可以透過其 MCP 工具同 Skills framework 將任務路由到 GLM-5.2——利用其長上下文同編碼焦點處理倉庫規模工作，同時將其他模型留俾日常任務。

GLM-5.2：智譜 AI 的 100 萬 Token 開放權重編碼與 Agentic 模型

智譜採用 MIT 授權的旗艦模型專為編碼、工具使用同長週期 agent 而設——以下係對開發者意味住乜

Douglas Lai

Share to

GLM-5.2 係乜？

關鍵規格同架構

GLM-5.2 嘅主打功能圍繞上下文、推理同開放性而展開。(DataCamp)

100 萬 token 上下文窗口，透過 glm-5.2[1m] 模型 ID 提供——足以容納完整 monorepo、大型文件，或者長時間運行的 agent 狀態。(note)
每次回應最多 131,072 個輸出 token——足以一次過生成或重構非常大型的文件。(Lush Binary)
MoE 設計，總參數約 753B，每個 token 約 40B 活躍參數，沿用 GLM-5.1 基礎。(dev.to)
IndexShare——一種稀疏注意力方案，可喺多層稀疏層之間重用同一個 attention indexer，降低長上下文長度下每 token 的 FLOPs。(Latent Space)
改進的 multi-token prediction (MTP) 層，用於 speculative decoding，據報可將接受率提升最多約 20%，並改善吞吐量。(Latent Space)

Z.ai 強調，GLM-5.2 保留咗 GLM-5 系列「開放權重、編碼優先 DNA」，而係升級上下文窗口同推理控制，而唔係追求全新架構。(Modular)

100 萬 Token 上下文：點解重要

實際上，呢個特性解鎖咗幾個過去一向比較脆弱的工作流程：

代碼庫級別理解——將整個服務、monorepo，或者微服務集群放入同一個上下文，而唔需要激進截斷。(Lush Binary)
長時間運行的 agents——agent 可以喺上下文入面維持跨日或跨 session 的工作記憶，而唔係要將一切壓縮成工具專用摘要。(CometAPI)
複雜文件分析——法律文集、技術標準，或者數千頁 PDF，可以一次過處理，而唔使靠分塊再拼接的管線。(CometAPI)

雙重推理模式：High 同 Max

GLM-5.2 引入咗兩級「thinking-effort」系統：High 同 Max。(AI Weekly)

High 係大多數編碼任務嘅預設模式，會先以結構化 chain-of-thought 推理再回應，但推理預算有上限。Z.ai 建議用於日常代碼生成、重構同除錯，適合你想兼顧可靠性同速度嘅場景。(DataCamp)
Max 會提升推理預算，用於更複雜問題同更長嘅 agentic 序列，但代價係延遲同 token 用量增加。適合非平凡 bug、跨服務重構、架構變更同多步規劃。(AI Weekly)

Agentic 能力同工具使用

智譜將 GLM-5.2 品牌化為「agent-oriented」模型，旨在支援自主工作流程、工具增強型 agents 同長週期編碼任務。(Atlas Cloud)

Function calling：可喺多個對話回合中調用工具同 API，支援經典 agent 工具使用循環。
長週期規劃：依靠 100 萬上下文同推理模式，面向大型代碼庫。(note)
複雜問題解決：包括多步推理同結構化 chain-of-thought。(dev.to)

開放權重同授權

GLM-5.2 最大嘅策略動作之一，就係其授權同分發方式。Z.ai 承諾將 GLM-5.2 作為 MIT 授權、開放權重模型 發布，延續 GLM-5 同 GLM-5.1 嘅路線。(Gigazine)

LLM Reference 同開發者指南將 GLM-5.2 描述為採用 MIT 授權的開源、開放權重模型，權重可喺 Hugging Face 下載（例如 zai-org/GLM-5.2 同 FP8 版本）。(apidog)
日本同中國嘅媒體報導亦提到，GLM-5.2 會喺 2026 年 6 月第三週以開放模型形式發布，初期先供 GLM Coding Plan 訂閱者使用。(AI for Anything)

基準測試同早期表現信號

定價同使用方式

Z.ai 正喺其自家產品同合作平台上廣泛推出 GLM-5.2，定價通常同之前 GLM-5.x 模型相同或更低。(AI for Anything)

主要存取路徑包括：

GLM Coding Plan（Lite / Pro / Max / Team）——GLM-5.2 已成為所有層級的預設旗艦模型，可直接透過 Z.ai 的編碼工具同聊天介面使用。(Gigazine)
獨立 API 同聊天——Z.ai 已宣布 GLM-5.2 API 同聊天存取會喺編碼工具推出後不久跟上。(note)
第三方供應商——OpenRouter 同多模型 gateway 等平台將 GLM-5.2 標價約每 100 萬 input tokens $1.4（output 更高），喺某些地區定位為大約比 GPT-5 或同類前沿模型平一個數量級。(Atlas Cloud)
Workers AI（Cloudflare）——提供 @cf/zai-org/glm-5.2，支援 function calling 同大型上下文，可直接整合入 edge functions 同 serverless 工作流程。(Cloudflare)

如果要自行部署，開放權重同 MIT 授權令你可以將 GLM-5.2 放入自己嘅基礎設施或專門推理堆疊，包括針對 MoE 優化的 runtime。(Modular)