之前就听说豆包在憋一个新模型,能力可以达到 Opus 4.6 水平,今天终于在 FORCE 大会上公布了。
官方给的跑分数据,有些地方能跟 Opus 4.7 比一比了,不过能不能在真实项目里打,还得等我上手一段时间再说。模型的定位比较明确,专门为 Coding 和 Agent 场景设计的,最大变化是「需求理解 + 长期规划 + 持续修复」这一套能力拉上来了,奔着让 AI 能独立交付完整工程项目去的。
价格比 Claude 和 GPT 的 API 定价有优势,不过对比 DeepSeek V4-Pro 就不够亲民了。
这两天微信的原生 AI 助手「小微」也在灰度内测,能直接操作微信功能、调起小程序。国产 AI 这波是真的在不同层面集体发力了,你看好吗?
显示更多
26 年 AI 编程学习路线一条龙,8 分钟速通!🤫 小孩哥都开始 Vibe Coding 了
GLM 5.2 这波上线的时机实在是很巧妙,而且官方发文直接强调大模型应该是“开放、可用、可构建,并服务于每一位开发者”的。看看人家这格局😛
这次升级后上下文终于拉到了 100 万,另外新增了 High 和 Max 两档思考模式。
虽然可能因为上得比较急,没给官方 benchmark,不过早期第三方测评显示整体编程能力大概在 Opus 4.8 的 94% 左右。而且 GLM 5.1 之前的跑分和口碑都很不错,可以说是国产模型之光了。
当然如果想用的话,Coding Plan 记得定闹钟去抢。。
显示更多