字节发布了新的豆包大模型 Doubao-Seed-2.1-Pro,我拿它写了几轮代码,帮大家看看实际是什么水平。
一段 prompt,让它做一个完整的产品落地页,hero、桌面 app mockup、价格表、FAQ 全在,一把就跑起来了。
入口很简单:下载 TRAE Work CN(免费),模型选 Doubao-Seed-2.1-Pro。
下面几个案例一个一个说:内容系统产品落地页制作、VLM 界面还原、failing test 自定位自修、3D 小游戏自测自修。
显示更多
这篇文章最近很火,被众多大佬转发,有 400 多万的曝光。
强烈推荐看一看这篇文章。
使用 SentiaRead 浏览器插件阅读英文,太舒服了。既能学知识,又能积累词汇量。
显示更多
鼓励每个人都努力用上 Claude Max 和 ChatGPT Pro ,不用纠结哪个好。
两个都很好,多在工作生活中使用,也不用纠结一定要把额度消耗完才睡觉。
几个月之后,你一定会感到非常超值。
显示更多
我从去年开始至今的策略一直没有变,要编码,永远用最顶级的工具和模型,否则就是纯粹浪费时间。
不是说其它模型完全不行,从能力特长、稳定性和价格方面,把它们用到合适的场景是很有必要的。
对于 thinking, design, coding, 用最好的模型和工具,虽然贵点但节省时间,实际效益是更高的。
显示更多
国产模型能用了,但我还不敢用
前段时间,我的 GPT 账户意外被封,被迫开始全面试用国产模型
过去两周,我深度使用了 DeepSeek v4 Pro、Xiaomi Mimo 2.5 Pro、Minimax M3 和 Kimi 2.7,覆盖编码、文字创作和 Hermes Agent 自动化三大场景
以下是真实使用体验
DeepSeek v4 Pro:资深老编辑
文字能力确实顶尖,总结、翻译、摘要、润色都让我非常满意。但代码生成、长时任务和 Agent 工具调用只能算差强人意。它更像一位经验丰富的老编辑——文笔一流,但让他写代码或处理复杂流程,就有点力不从心
Xiaomi Mimo 2.5 Pro:六边形战士
综合能力最均衡,没有明显短板。文字、代码、逻辑都在线,像一个公司里随时能顶上的得力助手,交给他的任务基本都能稳妥完成。
Minimax M3:名校实习生
文字功底不如 DeepSeek,但在长时任务和 Agent 工具调用上表现很稳定。缺点是"智商"偶尔着急,复杂推理会卡壳。像一个名校毕业的实习生——执行力不错,但遇到需要深度思考的问题还得再带一带
Kimi 2.7:准旗舰水准
这是四款中表现最好的,整体能力接近 GPT 5.5 的水准。除了发布第一天有些不稳定,后续更新后体验大幅提升,目前是我最常用的国产模型
国产模型的共同痛点:稳定性
然而,这些模型都有一个通病——输出稳定性不足
以我的 Hermes Agent 为例:我有十几个定时自动化任务,在 GPT 5.5 下可以数月稳定运行
但同样的 Prompt 和任务流交给上述国产模型,几乎每天都会有一两个任务莫名其妙报错
诡异的是,这些报错任务单独手动执行时,又能顺利通过
这种"薛定谔的报错"让我很难完全信任它们处理无人值守的长时任务
我的当前工作流
因此,我对国产模型和 GPT 5.5 采取了不同的信任策略:
一次性、短时任务 → 首选 Kimi 2.7,效率和质量都足够
代码开发、复杂项目、长时自动化任务 → 仍回退到 GPT 5.5,稳定性是底线
简单来说:国产模型我已经敢用,但还不敢完全放手,关键任务仍需人工审查代码和结果,充当最后一道防线。
PS:至于GLM 5.2,我对智普伤透心了,没有好感,故略过
显示更多
Luo 哥的分享跟我自己的观点和感悟挺一致的。我之前也看过”12个月做12个产品”这种模式,想想还是觉得不太适合我,但里面有一点值得学的,就是执行力。
我可能还是偏”古典”一点。SentiaRead 这款产品不是拍脑袋想出来的,而是我长期学英语积累下来的——用过市面上一堆现有产品,等 AI 技术成熟之后,自己思考出来的东西。
开始做之前我也担心会不会闭门造车,所以挺认同 ShipFast 那套理念:快速把东西做出来推到市场上看反馈,别一个人闷头搞太完美,但核心功能要可用。
我在正式动手之前先发了一条帖子,分享了自己的痛点和想做的东西。那条帖子的互动数据挺好的,说明不止我一个人有这种痛点,大概率还有不少人和我需求一样。
基于这个判断我就开始做了。我的开发和发布速度其实不算快,多多少少受完美主义影响,但整体上我清楚:不能追求太完美,要尽早把 MVP 做出来看反馈。
我用的是拉微信群这种比较老派的方法,喜欢直接跟用户聊。我工作和生活分得没那么开,所以也不太在意晚上很晚被用户打扰。我挺享受通过这种交流去观察他们怎么学英语、痛点在哪、习惯跟我的理念差在哪。
这款产品其实更多是围绕我自己的需求和出发点打磨的。这样吸引来的用户,本身也是有类似痛点、认同同一套学习理念的人。在这个基础上,我再去观察大家更细的习惯和需求。
中间也碰到过一些我一开始不太认同的方法,但慢慢我发现,学习方法没有绝对的对错,更多是看它离我的产品理念和定位偏差大不大、能不能帮到不少人。
产品就是一个节点一个节点往前推。内测结束后正式发布,观察大家的付费意愿——我发现还真有不少内测用户愿意付。
虽然挺多人觉得我定价不低,但发布当周就有人付了。让我意外的是,还有一些不在内测群的用户,看到我分享的帖子去体验了一下,直接就下单了。这样一个个事情给了我持续迭代的信心。
我的方法比较”古典”,就是这样一步步推进、验证、拿反馈。用自己舒服、做得到的方式来做产品。如果不是围绕我自己的观察和需求出发,我可能很难洞察到到具体的痛点,也很难很好地解决它。
显示更多
以前受“build 12 products in 12 months"这种前卫思想的影响,觉得做 build 产品就是进步。
看到一个需求,觉得自己能做;看到别人赚钱的产品,觉得自己也能做。
花几天糊出来一个 MVP,感觉自己效率很高自己特别牛逼。
然而我高估了“做出一个东西”的价值,低估了“让别人知道这个东西”的难度。
这两年我看推上主流的声音一直在鼓励大家 ship fast。
这句话没错。
错的是很多人只听到了 ship,没听到 fast learning。
如果你 ship 之后没有用户反馈,没有使用数据,没有真实对话,没有分发渠道,那你学到的东西非常有限。
你只是学会了更快地完成项目。
但你没有学会更快地接近市场。
这两个能力完全不同。
做产品给你确定感。
做分发给你挫败感。
所以很多人会本能选择逃避,躲进研发的舒适区里。
改 UI。
加 dark mode。
重构代码。
做一个更漂亮的 logo。
再加一个 AI feature。
这些事都很舒服。因为它们相对可控。
但增长不可控。
内容发出去可能没人看。
cold email 可能没人回。
社群里分享可能很尴尬。
SEO 可能三个月没效果。
用户访谈可能直接拒绝你说:我不需要这个。
这才是创业最难的地方。
不是把产品做出来。
而是把自己暴露在市场面前。
一个真实 audience 的价值,不只是 launch 的时候帮你点几个赞。
更重要的是,他们会让你少走很多弯路。
你可以在做之前问他们。
你可以在做一半的时候让他们试。
你可以观察他们真正关心什么。
你可以发现他们愿意为什么付费,而不是猜。
分发不是产品之后的事。
分发就是产品的一部分。
如果没人知道你,没人信你,没人愿意听你解释,那你的产品体验其实从第一步就断了。
所以我觉得 shipping 10 products with no distribution,往往不如 shipping 1 product with a real audience。
独立开发的核心资产,不是做过多少个项目。
而是有没有一个可以反复测试想法、获取反馈、建立信任的渠道。
这可以是 X。
可以是 newsletter。
可以是 SEO。
可以是 YouTube。
可以是一个垂直社群。
可以是一个很小但很精准的用户池。
形式不重要。
重要的是你不能每次 launch 都从零开始。
从零开始一次,是创业。
从零开始十次,可能就是逃避。
显示更多