logo
  • 環境
  • 企業方案
  • 價格
Blogs
行業|Jun 18, 2026

GLM-5.2:智譜 AI 的 100 萬 Token 開放權重編碼與 Agentic 模型

智譜採用 MIT 授權的旗艦模型專為編碼、工具使用同長週期 agent 而設——以下係對開發者意味住乜

Douglas LaiDouglas Lai
Share to
GLM-5.2:智譜 AI 的 100 萬 Token 開放權重編碼與 Agentic 模型
  • GLM-5.2 係乜?
  • 關鍵規格同架構
  • 100 萬 Token 上下文:點解重要
  • 雙重推理模式:High 同 Max
  • Agentic 能力同工具使用
  • 開放權重同授權
  • 基準測試同早期表現信號
  • 定價同使用方式
  • 使用場景:GLM-5.2 最擅長咩
  • 限制同未解問題
  • GLM-5.2 點樣融入 AI Agent 生態
  • 常見問題
Automate Everything with
AI Workforce on Desktop
Download Eigent

智譜 AI 剛推出一個開放權重模型,感覺上係為 agent 而唔係聊天而設。GLM-5.2 係智譜最新旗艦——專為編碼、推理同以工具驅動的「agentic」工作負載而打造——並且以 MIT 開源授權提供 100 萬 token 上下文窗口。呢個模型喺 2026 年 6 月 13 日發布,接替 GLM-5 家族中的 GLM-5.1,已經喺 Z.ai 的 GLM Coding Plan 同多個第三方平台上線。(apidog)

如果你正喺度開發 AI agent、自主編碼工具,或者長週期工作流程,GLM-5.2 係最早一批讀起上嚟似係為你嘅使用場景而生的開放權重模型之一——而唔係由一個通用助手硬改出嚟。呢篇指南會拆解 GLM-5.2 到底係乜、其架構同上下文窗口、推理模式、定價、早期基準測試情況,以及開發者點樣喺 Eigent 呢類 agent 平台入面發揮最大效用。

GLM-5.2 係乜?

GLM-5.2 係智譜 AI(全球以 Z.ai 營運)推出的開放權重大型語言模型,重點調校用於軟件工程、多步推理同工具增強型 agent 工作。佢建立喺 GLM-5 同 GLM-5.1 引入的 Mixture-of-Experts (MoE) 基礎之上,並將上下文窗口擴展到實用的 100 萬 token,同時保持強勁的編碼表現。(Modular)

喺底層,GLM-5.2 採用大約 750B 參數的稀疏 MoE 設計,每個 token 約有 40B 活躍參數,並配合一種新嘅「IndexShare」稀疏注意力技術,目標係控制 100 萬上下文推理成本。智譜將呢個模型定位為以編碼為先、面向 agent 的系統,而唔係通用聊天模型——對話只係一個副產品,真正重點係打造一個強大、面向開發者的引擎。(LLM Reference)

呢種以 agent 為先的定位,令 GLM-5.2 同 Anthropic 嘅 Claude Fable 5 進入同一個討論範圍:越嚟越多前沿模型首先係圍繞長週期 agentic 使用而設,聊天只係次要介面。

關鍵規格同架構

GLM-5.2 嘅主打功能圍繞上下文、推理同開放性而展開。(DataCamp)

  • 100 萬 token 上下文窗口,透過 glm-5.2[1m] 模型 ID 提供——足以容納完整 monorepo、大型文件,或者長時間運行的 agent 狀態。(note)
  • 每次回應最多 131,072 個輸出 token——足以一次過生成或重構非常大型的文件。(Lush Binary)
  • MoE 設計,總參數約 753B,每個 token 約 40B 活躍參數,沿用 GLM-5.1 基礎。(dev.to)
  • IndexShare——一種稀疏注意力方案,可喺多層稀疏層之間重用同一個 attention indexer,降低長上下文長度下每 token 的 FLOPs。(Latent Space)
  • 改進的 multi-token prediction (MTP) 層,用於 speculative decoding,據報可將接受率提升最多約 20%,並改善吞吐量。(Latent Space)

Z.ai 強調,GLM-5.2 保留咗 GLM-5 系列「開放權重、編碼優先 DNA」,而係升級上下文窗口同推理控制,而唔係追求全新架構。(Modular)

100 萬 Token 上下文:點解重要

100 萬 token 上下文窗口係 GLM-5.2 最明顯嘅差異化優勢。呢個數字大概係之前 GLM-5.x 窗口嘅五倍,令 GLM-5.2 躋身開放權重生態中最大、可公開實用的上下文窗口之一。(LLM Reference)

實際上,呢個特性解鎖咗幾個過去一向比較脆弱的工作流程:

  • 代碼庫級別理解——將整個服務、monorepo,或者微服務集群放入同一個上下文,而唔需要激進截斷。(Lush Binary)
  • 長時間運行的 agents——agent 可以喺上下文入面維持跨日或跨 session 的工作記憶,而唔係要將一切壓縮成工具專用摘要。(CometAPI)
  • 複雜文件分析——法律文集、技術標準,或者數千頁 PDF,可以一次過處理,而唔使靠分塊再拼接的管線。(CometAPI)

Cloudflare Workers AI 的整合喺度提供咗一個有用信號:佢以 function calling、推理支援同大型上下文(目前部署為 262k tokens,並計劃擴展)方式提供 GLM-5.2,特別針對大型 codebase 同多步規劃。呢個反映出模型係為持續、高上下文工作負載而調校,而唔只係一個市場宣傳層面嘅「100 萬」數字。(Cloudflare)

雙重推理模式:High 同 Max

GLM-5.2 引入咗兩級「thinking-effort」系統:High 同 Max。(AI Weekly)

  • High 係大多數編碼任務嘅預設模式,會先以結構化 chain-of-thought 推理再回應,但推理預算有上限。Z.ai 建議用於日常代碼生成、重構同除錯,適合你想兼顧可靠性同速度嘅場景。(DataCamp)
  • Max 會提升推理預算,用於更複雜問題同更長嘅 agentic 序列,但代價係延遲同 token 用量增加。適合非平凡 bug、跨服務重構、架構變更同多步規劃。(AI Weekly)

從 agent 設計角度睇,呢個提供咗一個控制桿,讓你可以根據任務難度調整推理深度,而唔使切換模型。你可以將日常操作路由去 High,將棘手工單、規劃步驟或者失敗嘗試升級到 Max——呢個其實係嚴肅 agentic 系統已經常用嘅分類與路由模式,只不過用單一模型去實現。

Agentic 能力同工具使用

智譜將 GLM-5.2 品牌化為「agent-oriented」模型,旨在支援自主工作流程、工具增強型 agents 同長週期編碼任務。(Atlas Cloud)

Cloudflare 的部署將 @cf/zai-org/glm-5.2 描述為一個「為 agentic coding workflows 而建」的文本生成模型,並提供一流的 function calling 同多輪工具使用支援。佢特別指出:(Cloudflare)

  • Function calling:可喺多個對話回合中調用工具同 API,支援經典 agent 工具使用循環。
  • 長週期規劃:依靠 100 萬上下文同推理模式,面向大型代碼庫。(note)
  • 複雜問題解決:包括多步推理同結構化 chain-of-thought。(dev.to)

第三方評測強調,GLM-5.2 更適合倉庫規模的軟件工程同長時間運行的 agent 工作流程,而唔係一次性 code completion——呢點同 Z.ai 嘅訊息一致,即 GLM 係「刻意為軟件開發而設,而唔係純聊天」,其設計核心就係編碼、工具使用同長期 agent 工作流程。(AI for Anything)

開放權重同授權

GLM-5.2 最大嘅策略動作之一,就係其授權同分發方式。Z.ai 承諾將 GLM-5.2 作為 MIT 授權、開放權重模型 發布,延續 GLM-5 同 GLM-5.1 嘅路線。(Gigazine)

  • LLM Reference 同開發者指南將 GLM-5.2 描述為採用 MIT 授權的開源、開放權重模型,權重可喺 Hugging Face 下載(例如 zai-org/GLM-5.2 同 FP8 版本)。(apidog)
  • 日本同中國嘅媒體報導亦提到,GLM-5.2 會喺 2026 年 6 月第三週以開放模型形式發布,初期先供 GLM Coding Plan 訂閱者使用。(AI for Anything)

呢點對生態系統好重要:一個開放權重、MIT 授權、前沿級編碼模型,仲有 100 萬 token 上下文,令獨立開發者同開源平台喺 agentic 系統方面有一個認真替代封閉模型嘅選擇。

基準測試同早期表現信號

喺發布時,Z.ai 尤其冇公布一套完整官方 benchmark 套件俾 GLM-5.2——呢點已經被唔少觀察者指出。面向開發者嘅博客強調,公司喺初期技術溝通中更重視「1M context 同 agentic RL 的基礎設施創新」,而唔係 benchmark 圖表。(DataCamp)

不過,LLM Reference 同模型卡總結咗其自報分數,顯示 GLM-5.2 喺編碼同推理基準上具競爭力——包括 SWE-bench Pro、Terminal-Bench 同工具使用評估等任務上有唔錯表現,但獨立驗證仍然追緊。喺第三方評測出現之前,應將早期數字視為方向性參考,而唔係定論。(LLM Reference)

如果你正比較 GLM-5.2 vs GPT-5 vs Claude,老實講,到今日為止,我哋對 GLM-5.2 有更多透明的定價同上下文規格,但要做到完全 apples-to-apples 的第三方 benchmark,數據仲未夠齊。

定價同使用方式

Z.ai 正喺其自家產品同合作平台上廣泛推出 GLM-5.2,定價通常同之前 GLM-5.x 模型相同或更低。(AI for Anything)

主要存取路徑包括:

  • GLM Coding Plan(Lite / Pro / Max / Team)——GLM-5.2 已成為所有層級的預設旗艦模型,可直接透過 Z.ai 的編碼工具同聊天介面使用。(Gigazine)
  • 獨立 API 同聊天——Z.ai 已宣布 GLM-5.2 API 同聊天存取會喺編碼工具推出後不久跟上。(note)
  • 第三方供應商——OpenRouter 同多模型 gateway 等平台將 GLM-5.2 標價約每 100 萬 input tokens $1.4(output 更高),喺某些地區定位為大約比 GPT-5 或同類前沿模型平一個數量級。(Atlas Cloud)
  • Workers AI(Cloudflare)——提供 @cf/zai-org/glm-5.2,支援 function calling 同大型上下文,可直接整合入 edge functions 同 serverless 工作流程。(Cloudflare)

如果要自行部署,開放權重同 MIT 授權令你可以將 GLM-5.2 放入自己嘅基礎設施或專門推理堆疊,包括針對 MoE 優化的 runtime。(Modular)

使用場景:GLM-5.2 最擅長咩

對 agent 同工具開發者嚟講,當你充分利用佢嘅長上下文同編碼焦點時,GLM-5.2 最具吸引力。

倉庫規模編碼 agents

100 萬上下文、High/Max 推理模式同 function calling 嘅組合,令 GLM-5.2 成為以下場景嘅強力候選:

  • 自主代碼庫重構同遷移。
  • 跨服務依賴分析同 API 表面探索。
  • 跨多個代碼庫嘅多步除錯工作流程。

開發者指南指出,GLM-5.2 係喺「倉庫規模」工程任務上做過測試,而唔係玩具 repo;其長上下文明確係為咗「喺真實代碼庫上頂得住,而唔係喺幾十萬 token 後就散晒」。(dev.to)

長週期 agent 工作流程

由於 GLM-5.2 可以維持超大上下文,並提供推理控制,所以好適合以下類型 agent:

  • 保持豐富、token 級嘅先前運行記憶,而唔係不斷做摘要。
  • 透過多次對話回合,以 function calls 協調多工具工作流程(API、資料庫、搜尋、內部工具)。(CometAPI)
  • 喺同一上下文中混合規劃同執行——將計劃、中間結果同日誌同源碼同文件一齊保存。(Lush Binary)

幾篇評測都將 GLM-5.2 視為對開發者對「長跑型」agents 的需求作出回應:可以持續幾個鐘頭處理同一個問題,而唔撞上硬性上下文限制。(note)

多語言開發同文件

GLM-5.2 保持強勁嘅多語言支援,英語同中文都係一級語言,並承襲自 GLM-5 系列的更廣泛多語能力。對於處理英中雙語 codebase 同文件的團隊,尤其係開源場景,呢點相當有吸引力。(apidog)

限制同未解問題

GLM-5.2 好有野心,但有幾點注意事項值得記住:

  • 基準測試仍未完整。 喺未有全面 benchmark 套件下發布,意味住早期採用者要依賴自報分數同零散測試。(AI Weekly)
  • 100 萬上下文未必完全開放。 某些平台,例如 Cloudflare Workers AI,目前部署上限遠低於 100 萬(例如 262k tokens),即使底層模型支援更多。(note)
  • MoE 同長上下文推理都好吃硬件。 即使有 IndexShare 同 MTP 優化降低每 token FLOPs,100 萬 token 的 MoE 推理喺自家部署時仍然比小型 dense 模型昂貴——GLM-5.2 唔係可以直接當做單張消費級 GPU 上的輕量推理替代品。(apidog)

GLM-5.2 點樣融入 AI Agent 生態

從策略上睇,GLM-5.2 推動咗 agent 領域三個趨勢向前:

  1. 開放權重前沿模型。 GLM-5.2 證明咗前沿級編碼同 agentic 能力,加上 100 萬上下文,可以喺寬鬆授權下推出——令開源生態更有槓桿。(Gigazine)
  2. 以 agent 為先的定位。 Z.ai 明確將 GLM-5.2 品牌化為「agent-oriented」模型,針對長期工作流程優化,而唔只係聊天——呢點正正係認真做自動化的開發者一直想要嘅。(Atlas Cloud)
  3. 將上下文作為一級產品功能。 唔係細微嘅 marketing 提升,而係將 GLM-5.2 升級到實用的 100 萬 token——再配合 IndexShare 同 MTP 呢類基礎設施變更——顯示長上下文可靠性正成為 agent 平台嘅基線預期。(Latent Space)

對創辦人、平台建設者同 agent framework 作者嚟講,開放權重、agentic 調校同極端上下文呢個組合,令 GLM-5.2 係一個值得試嘅模型——無論係作為主引擎,定係 multi-model 路由策略的一部分。

而呢點正正適合 模型無關、multi-agent 基礎設施。模型版圖變得好快,而贏嘅平台係能夠將 GLM-5.2 呢類模型插入去處理最難問題——而唔需要重做整個 stack。就好似我哋 將 MiniMax M2.1 交由 Eigent 的 CAMEL Workforce 運行 一樣,GLM-5.2 呢類開放權重模型可以乾淨利落地接入同一套 orchestration 層。如果你正喺呢類基礎之上構建,探索一下開源、多 agent 平台 Eigent 點樣幫你喺真實工作流程中協調專門模型。

常見問題

GLM-5.2 係乜?

GLM-5.2 係智譜 AI(Z.ai)最新旗艦開放權重模型,針對編碼、推理同 agentic 工具使用而調校。佢採用 Mixture-of-Experts 架構(總參數約 753B,每個 token 約 40B 活躍參數),配備 100 萬 token 上下文窗口,並以 MIT 開源授權發布。

GLM-5.2 的上下文窗口有幾大?

GLM-5.2 透過 glm-5.2[1m] 模型 ID 支援 100 萬 token 上下文窗口——大約係之前 GLM-5.x 窗口的五倍。要注意,部分平台目前只開放少於完整 100 萬 token 的上下文(例如 Cloudflare Workers AI 目前部署為 262k tokens)。

GLM-5.2 係開源嗎?

係。Z.ai 以 MIT 授權將 GLM-5.2 作為開放權重模型發布,權重可喺 Hugging Face 下載(例如 zai-org/GLM-5.2 同 FP8 版本),延續 GLM-5 同 GLM-5.1 的開放權重路線。

GLM-5.2 幾錢?

Z.ai 將 GLM-5.2 作為 GLM Coding Plan 各層級的預設旗艦模型打包提供。喺 OpenRouter 呢類第三方 gateway,上面標價約每 100 萬 input tokens $1.4(output 更高)——喺某些地區大概比 GPT-5 或同類前沿模型平一個數量級。

GLM-5.2 的 High 同 Max 推理模式係乜?

佢哋係兩個「thinking-effort」級別。High 係日常編碼任務的預設模式,使用 chain-of-thought 推理並設有預算上限,以保持速度同可靠性。Max 會提高推理預算,用於更難問題——例如非平凡 bug、跨服務重構同多步規劃——但代價係延遲同 token 用量增加。

我可以喺 Eigent 用 GLM-5.2 嗎?

可以。Eigent 的模型無關、multi-agent 架構,令你可以透過其 MCP 工具同 Skills framework 將任務路由到 GLM-5.2——利用其長上下文同編碼焦點處理倉庫規模工作,同時將其他模型留俾日常任務。

Recent Posts

香港 Claude 教學:介面、Prompt 寫作、粵語內容實戰
行業Jun 24, 2026

香港 Claude 教學:介面、Prompt 寫作、粵語內容實戰

畀香港用家嘅實用 Claude 教學:介面導覽、粵語/繁體中文 Prompt 範本、寫程式技巧,仲有一個免費替代方案。

Douglas LaiDouglas Lai
點樣喺香港用 Claude?最新完整教學
行業Jun 24, 2026

點樣喺香港用 Claude?最新完整教學

香港 IP 入唔到 Claude.ai?本文解釋原因,教你用 VPN+電話驗證、AWS 企業版繞過地區限制,仲會講安全合規同一個免費開源替代方案。

Douglas LaiDouglas Lai
2026 年最佳法律 AI 代理:頂尖平台比較(附免費替代方案)
Jun 19, 2026

2026 年最佳法律 AI 代理:頂尖平台比較(附免費替代方案)

比較 2026 年最佳法律 AI 代理:Harvey、CoCounsel、Lexis+ Protégé、Kira、Spellbook,以及可自行託管的免費開源法律 AI Eigent。

Douglas LaiDouglas Lai
Automate everything with AI workforce on desktop
Download Eigent

立即試用 Eigent

下載開源桌面 app。你的 AI workforce,直接在你電腦上運行。

下載 Eigent
Eigent

獲取 AI workforce 自動化的最新更新、教學與版本消息。

產品Eigent環境定價企業方案
探索解決方案使用案例技能外掛網誌
開發者文件GitHubCAMEL-AIOpen Source Fund合作夥伴
下載適用於開源版
公司關於我們品牌招聘使用條款私隱政策安全與信任Cookie 政策退款與試用政策

版權所有 © 2026 EIGENT UK LTD

Eigent 1.0 新版本已發佈!download