我用 TRAE Work 测了 豆包 2.1 Pro:视觉还原和前端设计、交互能力,真的超出我的预期了!
字节跳动最新发布的 豆包2.1 系列模型,官方介绍整体在 Coding 和 Agent 能力上有显著提升,VLM 能力保持领先,能力介于 Claude Opus 4.6 和 4.8 之间,这在项目中就很有想象空间了。
在进入正式项目中使用体验之前,先找一个前端设计图还原实现的题目,结合它的 Coding 和 Agent 能力,特别是 VLM 对设计图的布局、设计要素、细节、场景的理解。
我把操作过程录屏,可以看到我让 豆包2.1 参考的设计图,和一句简单的要求,它在执行前,会先思考整个规划和实现过程,然后读取我的设计图、理解它的使用场景和设计细节等,再调用对应最合理的 Skill 来规划整体网页实现逻辑。分步骤实现网页编写后,使用本地预览和视觉验证等来验证实现符合规划预期。
整体实现完成后,输出在视觉还原、交互和技术实现方面的实现细节,可以看出,非常细节,包括设计图中的设计感、布局,甚至不同标题和字体选择,都很贴切,自适应布局也是默认就有且很丝滑。
最让我意外的是,它居然还给每个部分真的配了有实际意义的图,而不只是占位!
显示更多