GLM-5.2 已正式接入 AINFT,现在 API + Web Chat 双端同步开放,已经可以直接使用。
这次升级的重点很清晰:把“模型能力”和“使用入口”一起做了整合。
GLM-5.2 作为 新一代开源前沿模型,最大变化是上下文能力直接拉到 1M 级别。在实际使用里意味着三件事:
一是长文本处理不再需要切段。无论是长文档、多轮对话历史,还是复杂知识库内容,都可以一次性放进上下文里处理,不需要反复拼接。
二是推理链路更完整。复杂任务比如代码生成、业务逻辑拆解、多步骤分析,可以在同一轮上下文中持续推进,减少中断和信息丢失。
三是更适合 Agent 化任务。比如自动化脚本、多工具调用流程、批量任务生成,这类以前需要拆成多个请求的流程,现在可以在一个会话里完成闭环。
再说 AINFT 这次的接入方式:
不是简单“上架模型”,而是直接做了双端统一入口。
现在有两个使用方式:
一是 Web Chat 直接对话,打开即可用,适合日常使用、内容生成、分析任务。
二是 API 调用同步开放,适合开发者接入系统、做应用集成、跑批量任务或构建 AI 应用。
重点是两边能力一致,不存在“网页强、API弱”或“环境割裂”的情况。
实际体验上,相当于把模型能力从“工具调用”变成“基础设施级别”的可用能力。
开发侧的变化也比较明显:
可以直接基于 1M context 做长链路 Agent
可以把复杂业务文档当作完整输入源处理
可以降低多轮状态管理成本
可以减少外部记忆模块依赖
入口也更简单了,统一在:
整体来看,这次更像是把大模型能力从“可用”推进到“可工程化稳定使用”。
@justinsuntron @AINFTcom #
TRONEcostar#
📢 GLM 5.2 is LIVE on AINFT! Dual Support for API & Web Chat
next-gen open-weights model, GLM 5.2, is now fully supported on AINFT! Unlock its industry-leading 1M context window seamlessly across both API and Web Chat.
From direct web chat to building with API, harness next-level power for large-scale coding, complex reasoning, and AI agents today.
🚀 Experience dual-channel efficiency now:
显示更多