注册并分享邀请链接,可获得视频播放与邀请奖励。

AYi 的个人资料封面
AYi 的头像

AYi (@AYi_AInotes)

@AYi_AInotes
AI 实用主义 大厂组织发展专家 × 心理学硕士(QS30) 分享有用的 AI 实践,也分享工具之外的深度认知 AIGC | Prompt | 商业思维 丨职场丨认知心理学 合作/交流:DM/TG @AYi_AInotes
368 正在关注    53.6K 粉丝
这可能是今年 AI 编码最反常识的结论,跑了一整年生产环境的人告诉你,最好的 AI 编码环境根本不是你的笔记本。 Pieter Levels 用近一年的真实生产数据验证了这套玩法, Claude Code 常驻 VPS,Agent 直接在线编辑生产环境代码, 传统本地编码加 Git 加部署的流程要一分钟迭代一个特性, 现在改完刷新就能测,反馈循环直接压到秒级。 十二个月生产环境跑下来只出过两次小故障, 每次都是十秒级的 PHP 报错随即自愈, 搭配严格的多份备份策略,风险完全可控。 不用一直开着电脑,手机接个 SSH 就能续上任务, 丢个目标指令 Agent 就能自己跑一整夜。 真正的变化藏在表层玩法下面。 第一是 Agent 的定位变了, 从本地 IDE 的辅助插件,变成生产环境里常驻的执行者, 代码和运行环境第一次贴得这么近。 第二是速度的复利效应, 对独立开发者来说不是快一点, 是能同时跑更多实验更快验证想法, 单位时间的试错次数直接拉开量级差距。 第三是风险的标准变了, 团队要合规走预发布环境天经地义, 但 solo 开发者用备份兜底换极致效率, 本来就是完全不同的取舍逻辑。 第四是基础设施的方向反了, 以前本地重云端只负责部署, 现在云端成了主力开发加运行环境, 本地设备只是个接入终端。 AI 编码的竞争早就不在谁补代码更快了, 在谁先把 Agent 放进真正的生产环境里, 让它成为永远在线的执行层。 想试的朋友从非核心项目入手, 配好快照和备份,门槛比想象的低很多。
显示更多
✨ I think I've been coding almost solely on my VPS with Claude Code for almost a year now All I can say it's just fantastic: - no need to keep laptop open ever - no laptop battery drain - can switch to phone or any other device you like whenever you want to continue (like when you're outside) - it just keeps going all night while you sleep (esp with /goal) - you can start hacky projects from scratch and go live in seconds because you're already on the server which is great to ship things and get it used by people fast (not stuck on your local laptop webserver) - it just feels like living in the future I used to code on my laptop, test locally, then push to GitHub, then it auto pulled and deploy to production, that'd take me ~1 minute to get a new feature out But then when I bought a new Mac Book Pro a few years ago I was too lazy to install a local Nginx environment, so I just started pushing to prod and everything went fine, and I sped up deploying to about 3 seconds from laptop to server, which people called me crazy for too But now with Claude Code on my VPS in the last year, it just live edits on my production server, which sounds like it should go wrong but it just doesn't, it's very careful and only twice in 12 months messed up which meant my site didn't load for 10 seconds which is OK If I wasn't working solo, like at a big company, I' think I'd recommend the same workflow but with a staging server, so it wouldn't touch production, for safety and regulatory reasons etc. but for me it's fine I agree with @theo completely, it's clear to me this is where it's going, also seeing @karpathy with Claude moving to the cloud (via Slack etc), I think AI "agents" and AI coding will operate on servers / from the cloud first P.S. I have 3-2-1 backups, multiple on-site and off-site backups which you should also even if you wouldn't code with AI, safety first!
显示更多
现在用 Hermes 最聪明的做法,不是堆提示词,而是给它搭一个会自己复盘迭代的记忆循环, 越用越贴合你的工作习惯,能力拉满。 核心靠一份 [Memory.md](Memory.md),跑「会话学习 - 记录沉淀 - 迭代优化」闭环,每次对话都承接过往经验,不再重复踩坑、反复重说偏好。 精准落地 4 步流程 1️⃣桌面新建 [Memory.md](Memory.md),固定分层框架 ## 偏好 ## 更正 ## 模式 ## 学到的经验 2️⃣粘贴绑定提示词,接入代理 每次会话开始,阅读 [Memory.md](Memory.md) 并完整应用全部内容。 每项任务结束完成三件事: ・记录有效做法 + 核心原因 ・记录失败问题 + 根源分析 ・总结提炼下次复用规则,不重复堆砌条目,新结论覆盖旧内容 3️⃣每周执行精炼提示词压缩收敛 通读 [Memory.md](Memory.md),提炼零散经验为精简通用规则,移除过时被覆盖内容,压缩留存高质量核心逻辑 4️⃣定期日期命名归档备份文件,避免改写出错丢失历史 不用微调模型、无需开发部署,几分钟就能启动运行。 从零散随机输出,慢慢收敛成贴合你的行文节奏、工作逻辑、纠错记录的专属智能代理,成倍放大日常效率。 收藏留存,立刻就能改造你的代理工作流,把单次会话的临时效果,变成长期滚动成长的核心资产。
显示更多
说个暴论,Git 在游戏开发领域的垄断,今天第一次遇到了真正的对手。 Epic 刚在 Unreal 状态大会上正式放出了 Lore,他们自己打磨了好几年的内部版本控制系统,直接以 MIT 许可全开源,所有人免费用。 做游戏开发的朋友,应该都懂今天这条新闻意味着什么, 之前这个赛道一直是两个烂选项二选一, Git 天生不是给大文件设计的,海量 3D 模型纹理音频塞进去,全靠 LFS 插件凑活,体验稀碎, Perforce 处理大文件靠谱,但年费动辄几万刀,必须连实时服务器,生态封闭根本没法自己搭工具, 没人能同时解决大文件性能,离线工作,开放规范这三个核心问题。 Lore 直接把这三个痛点全捅穿了, 完全离线操作,提交分支切换全在本地跑。 文件唯一指纹去重,相同数据绝不存第二遍, 多 GB 文件拆块存储,改哪传哪不浪费带宽, 按需拉取文件,本地只存你用到的内容, 全链路 Rust 构建,官方自带多语言 SDK。 Perforce 一年的授权费够你雇好几个工程师,Git LFS 从来就只是个临时补丁。 现在 Epic 把自己压箱底的生产级工具直接扔到了公开领域,免费,开源,无商用门槛。 游戏开发的版本控制,以后不再是只有两个选项的死局了
显示更多
0
18
264
37
转发到社区
终于有人把深度 Agent 的底层逻辑讲透了,不靠堆模型参数,通过三大工程化技巧直接解决长任务忘事崩链的问题。 LangChain 官方这套从零构建深度 Agent 的教程, 直接扒透了 Manus 和 Claude Code 这类顶级 Agent 的核心设计, 5 个渐进式 Notebook 手把手带你落地,全程可跑通。 核心就是三套上下文工程模式, 1. 结构化 TODO 任务规划,带状态管理,防止 Agent 跑偏漏步骤。 2. 虚拟文件系统卸载上下文,大幅省 token,实现跨轮次记忆。 3. 子代理委派加上下文隔离,复杂任务拆分并行,互不干扰。 从最基础的 ReAct 循环开始, 一步步叠加任务规划,文件系统,子代理能力, 最后直接搭出一个能联网做深度研究的完整 Agent。 不是那种纸上谈兵的理论,每一步都有可运行的代码。 本质上高级 Agent 的差距其实不在模型本身,主要在上下文工程的架构设计上。 想搞懂长周期 Agent 的朋友,跟着走一遍收获会很大, 配套还有开箱即用的 deepagents 生产库, 学完就能直接复用进自己的项目, 仓库链接放评论区了,推荐用 uv 管理依赖,跟着 Notebook 顺序跑就行。
显示更多
现在用AI做视频可以跟喝水一样简单,不需要再付个700多块的剪映SVIP, 装这6个2026 年最顶的插件和skills就够了, 链接直接丢给你的AI Agent(Claude Code、Cursor、Hermes、OpenClaw 等等)让他们安装就, 老规矩6个安装链接🔗以及使用建议评论区自取⬇️
显示更多
所以科技平权从Fable 5开始转折了吗? 以后我们普通人还能用到顶级AI大模型的机会吗? 感觉Anthropic这条公告官宣的不是模型要恢复,更像是传递一个信号,就是顶级AI全民可用的时代正式结束了😭 最强的网络安全模型Mythos 5,只开放给美国本土的关键基础设施组织。 普通人能用的Fable 5,还在等政府审批,遥遥无期。 以前是花钱订阅就能摸到人类最顶尖的模型能力, 现在是最强的能力,只对特定身份和机构开放, 也就是说分层的墙已经立起来了, 以后普通用户能拿到的,永远是降过级的公开版本, 真正能重构生产力的顶级能力,只会在高墙内流转~
显示更多
Since June 12, we’ve been working closely with the US government to restore access to Claude Mythos 5 and Fable 5. Today, the government notified us that Mythos 5, our strongest cybersecurity model, can be redeployed to a set of US organizations that operate and defend critical infrastructure. We’re restoring access for these organizations quickly, and we’re continuing to work with the government to expand access to Mythos 5 and make Fable 5 available for general use again.
显示更多
这哥们真是个天才, 直接把大模型 API 的商业模式干穿了,OpenAI 大概率不喜欢这个项目🤣
0
11
61
1
转发到社区
Seedance 2.5 这效果, 说是恐怖如斯真的不夸张, 就这十五秒的雪豹镜头, 根根立起的绒毛, 沾在毛尖的细碎雪粒, 瞳孔里的冷光都带着呼吸的起伏, 4K的画质, 写实度已经把市面上绝大多数AI视频碾成了渣。 现在回头看OpenAI停掉Sora, 只能说决策清醒得可怕, 不是说做不下去了, 关键再往下挤牙膏已经挤不出代际差, Seedance这波是实打实的跨代领先, 放眼全球,找不到第二个能打的对手。 这波算是把AI视频的行业基准线, 拔到了绝大多数团队摸不到的高度, 属于看完一眼就知道, 整个赛道的天花板今天换了
显示更多
有人把网红峰哥做成了能实时打电话的 AI 分身, 连说话风格都一模一样。 这是开发者 Leaf 刚开源的项目, 把实时对话、音色克隆、人格注入三件事打通了, 工程延迟压到一秒以内。 最厉害的是拆解式优化思路, 把语音链路拆成三步逐个击破: ・语音识别用 Cartesia ink-whisper, 降噪防误触发 ・大模型选 MiniMax 高速版,首字响应三百六十一毫秒 ・语音合成用 VoxCPM 开源克隆,十五秒素材就能复刻 从最初八到二十秒的语音邮件感, 硬生生优化到实际体感两到三秒, 跟打电话没区别,光声音像还不够,项目用女娲 Skill 做人格蒸馏,从直播语料里提取口头禅、思维方式、表达逻辑, 聊起来真的像本人在跟你说话, 普通人半小时就能跑通: 把项目克隆到本地 扔给 Claude Code 或 Cursor 说帮我配置启动 填两个 API Key 就能用 想换成任何人都可以, 准备十五秒清晰语音加一段人格描述就行。 GitHub 链接放评论区,想做自己 AI 分身的直接拿去用。
显示更多
再也不用挨个官网注册绑卡试模型了, 136个免费LLM被整合成了一个站啦! 53个经过API实时验证,没有失效链接凑数。 DeepSeek V4 Pro,Kimi K2.6,GLM 5.1, Minimax M3,Mistral主流型号全覆盖, 支持按能力维度筛选, 文本代码视觉音频推理一键分类,上下文长度速率限制一目了然, 搭Agent跑实验尤其顺手, 生成API密钥就能直接接入Hermes OpenClaw Codex, 测试阶段能省一大笔API成本, 免费额度普遍带速率限制, 适合开发测试和小流量场景, 生产环境建议自行评估稳定性。 地址放评论区👇
显示更多
内容行业的底裤,被彻底扒掉了。 输入一个产品网址。 一键生成上千条病毒式短视频。 文案,配乐,排期发布,全自动搞定。 以后拼的再也不是剪辑和文案能力, 看谁的产品更能打。
显示更多
Damn,爷青炸了!《半衰期2》现在打开浏览器就能直接玩,不用下载不用安装,完整剧情全流程可玩, 更牛逼的是,两个开发者只花了3个月,就把这款22年前的神作搬进了网页, 此时此刻只想说,有些经典不会死,只会换个方式,重新站在你面前,啊啊啊啊啊!
显示更多
卧槽这个必须分享,一个开源工具,让你用免费 API 密钥池跑出企业级路由的效果, 等于是零成本撸10亿+免费LLM Token,要把把付费网关干碎的节奏, 对比一下:高容量令牌和企业路由,0, 原理很简单,它是个路由框架,不是卖 API 的, 你需要自己去各厂商申请免费密钥,然后填进配置, 工具自动帮你做负载均衡和自动故障切换, 30 秒能跑起来:克隆仓库,配好密钥,把应用指向本地端点,完事, 免费额度用满、用稳,不用自己写回退逻辑, 项目几周前刚发布,现在入坑还能直接给作者提改进意见, GitHub 链接放评论区 👇 有用的记得给仓库加星。
显示更多
0
19
55
7
转发到社区
多数人不知道,新加坡崛起的第一个秘密武器,是空调。 李光耀上台后做的第一件事,不是推出什么宏大经济政策,他给所有政府大楼装上空调。 热带的高温潮湿会让人大脑发昏,效率暴跌,公务员中午打瞌睡,整个国家机器就慢半拍,他看得很明白,空调不是用来享福的奢侈品,是让公共部门正常运转的基础条件,直接决定一个国家的公共服务质量和竞争力。 这件事最让我佩服的是背后实打实的实用主义逻辑。 听起来高大上的国家竞争,根子上往往藏着最朴素的底层条件,就像北方的供暖,数据中心的稳定供电,这些不显眼的基础设施,才是所有高端产业和复杂经济活动的前提,没有这个底子,再多战略规划都落不了地。 放到个人身上也是一样的道理, 很多人觉得热一点忍忍就过去了,其实长期处在不适的温度里,脑力输出和睡眠恢复都会悄悄打折,你以为是意志力不够,其实是底层环境没达标。 真正能改变游戏规则的东西,从来都不是听起来光鲜的概念啊, 那些能让你稳定高效持续输出的底层条件,才是最值得优先投入的生产力杠杆。
显示更多
Lee Kuan Yew was a genius
0
19
50
15
转发到社区
Prompt Engineering已死,Loop Engineering接棒, @karpathy 的做法我感觉最有画面感,晚上设好研究循环,自动改脚本,跑测试,留对的,扔错的,自己去睡觉,早上起来直接看结果,全程几乎不插手。 这就是现在圈里聊的Loop Engineering,从指挥AI一步步走,变成设计一个能自己跑完的系统。 四个支柱,每一个都是生产环境踩出来的血泪坑。 1️⃣知道什么时候停,别信它自己说搞定了,代码跑不通,逻辑有漏洞的情况比比皆是,要加硬性退出条件和独立验证,无数项目从demo到落地就死在这一步。 2️⃣保持上下文干净,循环跑久了旧错误,死胡同,冗余思考堆在一起,决策质量直线下滑,要把上下文当有限预算管,定期压缩,用子Agent隔离子任务。 3️⃣给真正能用的工具,不是堆一百个凑数量,要少而精不重叠,可安全重试,错误信息能被看懂,这是生产环境最容易翻车的地方。 4️⃣有能说不的机制,Agent不会挑自己的毛病,自己改作业永远满分,必须把干活的和检查的分开,也就是Maker-Checker模式,Claude Code团队早就在用了。 @bcherny 说得最直白,我已经不prompt Claude了,我写loops,然后让它们跑。 模型正在慢慢变成标准件, 同一个模型,配上更好的循环设计,效果能从中等拉到顶级。 真正的工程价值,早就从单次对话转移到了长期自治系统的设计上。 做Agent的朋友可以对照着查一遍,什么时候你从写提示词的人,变成了设计系统的人,什么时候才算摸到了下一阶段的门槛。
显示更多
holy shit😭 AI视频脸崩镜头乱的死穴被这个玩法直接干没了, 角色全程不崩,运镜精准到帧, 独立创作者直接能拍院线级镜头!
0
27
208
21
转发到社区
全网都在吹日本Fugu跑分超GPT,但我敢说99%的人没看懂它真正炸场的地方。 首先这玩意儿根本不是什么超大单体大模型, 它全身上下只有0.6B参数,本职工作就其实就是个AI项目经理, 简单任务自己处理,复杂任务自动拆分,从全球顶级模型池里挑最合适的选手,分配思考执行验证三种角色,多轮协作最后合成答案。 你调用它和调普通模型没区别,一行API的事, 但背后的编排策略是训练出来的,不是人手写prompt调路由磨出来的,它可以发掘出人类根本想不到的协作模式。 我觉得最狠的还不是跑分超了Claude和GPT,关键是它直接绕开了scaling law的军备竞赛。 不用堆万亿参数,不用砸超算中心,靠更聪明的协作机制就能摸到前沿模型的天花板,AI的竞争第一次从拼参数变成了拼管理。 当然不是银弹,比如黑箱不透明,复杂任务延迟更高,简单题用它反而更贵。 但这件事的信号意义比跑分数字重要一百倍,意味着多智能体编排从实验室玩具正式变成了可用的生产力工具。 orchestration layer这条新赛道,今天正式开跑咯🚀
显示更多
Introducing Sakana Fugu: A full multi-agent orchestration system accessible via a single model API. Our ‘Fugu Ultra’ model matches the performance of Fable and Mythos, delivering frontier capability without the risk of export controls. Try it: 🐡
显示更多
0
11
40
6
转发到社区
所有大模型排行榜都在骗你。 Cline团队用自己仓库的真实bug,在完全相同的环境下,测了GLM-5.2和Claude Opus 4.8。 结果非常打脸。 Opus速度快3倍,token消耗少一半,价格贵一倍。 它修完了bug,跑通了所有测试。 但生产构建直接崩了,留下了未被发现的类型错误。 GLM速度慢,token多67%,工具调用多2.3倍,价格便宜一半。 它不仅修好了bug,还主动清理了死代码。 最终构建干净通过,没有任何隐患。 这就是排行榜和真实世界的差距。 SWE-bench只能测出能不能修bug。 测不出修完之后会不会偷偷搞崩你的生产环境。 测试过了不等于代码能用。 这在大型项目里,是致命的。 本质不是谁更聪明,因为训练目标完全不一样。 GLM被强化学习训练出了验证文化。 多花的token,全用在了跑构建,查类型,清垃圾,防回归上。 它不是笨,是负责任。 Opus追求高效交差,GLM追求一次做对。 更值得注意的是,这是开源模型。 它不再只是闭源模型的廉价替代品。 它在长周期代码智能体的维度上,找到了自己的差异化优势。 智能体时代的性价比逻辑彻底变了。 以前比每千token多少钱。 现在比每次成功任务多少钱。 多花点token一次做对。 永远比快但要返工两次更划算。 更别说省下的人工排查成本。 给所有做智能体的人两个建议, 第一,别信排行榜,拿自己仓库的真实bug跑一遍。 第二,在你的系统提示里强制加一条,完成前必须跑构建验证,清理死代码。 未来比拼的从来不是谁的模型更聪明,而是看谁的模型更负责任。
显示更多
We've kept hearing how GLM-5.2 beats Opus 4.8, and are skeptical of benchmarks - so we tested them on a real bug from the Cline repo. While both models fixed the issue, GLM was the winner in terms of cost and code quality: - GLM used twice as many tokens (GLM 1.1m vs Opus 660K) but cost half as much (GLM $0.41 vs Opus $0.81) - Opus finished quicker - 1.6 min and 12 tool calls vs GLM 4.7 min and 28 tool calls - GLM cleaned up dead code and verified the build compiled before completing. Opus didn't - it left type errors that passed tests but broke the production build. Both runs used the same Cline harness prompting and tools, so it seems GLM is RL trained to spend more tokens verifying its work before completing. Impressive work by the @Zai_org team!
显示更多
0
37
113
11
转发到社区