注册并分享邀请链接,可获得视频播放与邀请奖励。

与「AI操控电脑」相关的搜索结果

AI操控电脑 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 AI操控电脑 的内容
简直成精了,AI 能直接操作电脑了,一句指令就能订票订酒店规划路线,没人啥事了……😮 以前AI只能聊天写代码,现在直接能像人一样看屏幕、点鼠标、敲键盘,帮你完成各种电脑操作……这时代真是变了!😱 字节跳动开源了 UI-TARS-desktop(GitHub已 36.9k Star),一个真正的多模态AI电脑操控工具,只需用自然语言下指令,它就能自动截图识别界面,然后精准控制鼠标和键盘执行任务了。👍 你看,如下视频其实就一句指令: 我 9 月 1 日到 9 月 6 日在洛杉矶,预算 5000 美元。请帮我在 上预订离机场最近的丽思卡尔顿酒店,并为我编制一份交通指南! 核心优势: - 支持本地和远程电脑/浏览器/手机控制 - 远程操控无需任何配置,点一下就能用 - 完全本地处理,隐私安全有保障 - 跨平台支持(Windows、macOS、浏览器) - 开源免费 使用方法: 1. 下载安装桌面客户端 2. 启动后输入自然语言指令 3. AI自动完成操作并反馈结果 一句话:AI 终于从"语言助手"跨越到"行动 Agent",从陪人聊天走向替人干活,和人操作电脑一毛一样!😄 🔗 GitHub地址: 对AI Agent、自动化办公、效率工具感兴趣的同学,这个项目值得重点关注! ~ #UITARS# #AI操控电脑# #字节开源# #多模态Agent# #开源工具# #工具分享#
显示更多
炸场!豆包专业版今天正式上线,AI终于能自动操控电脑、定时干活,打工人直接解放双手了! 你每天下班前1小时,是不是还在重复做这些机械活? 1、整理一堆杂乱桌面文件 2、熬夜抠报表PPT 3、 每周固定写重复周报 4、手动查资料填表格 5、 临时搭个简易业务系统…… 你大部分80%的时间被琐事吞掉,真正思考和创造的时间被挤压到几乎为零。 今天字节直接干翻传统AI逻辑,豆包专业版6月24日正式上线,搭载豆包2.1系列大模型 + 全新的办公任务Agent模式! AI不再只给你一段文字答案,而是自主拆解任务、操控电脑、自动交付完整成果。 这次更新核心变革:AI从“聊天工具”变“全职助理” 1. 授权即可操控本地电脑+浏览器
自动归类文件夹、批量重命名、读取本地PDF/Excel、跨浏览器搜资料、填线上表单,全程无人工干预。
实测:让它整理全年素材、定时发布内容,爽! 2. 一站式Office全套产出
内置在线文档、表格、PPT,支持多轮打磨、协同、导出。薪酬表、调研报告、课件、方案,直接给可对外用的成品。 3. 零代码快速搭建业务系统
数据看板、项目管理、活动报名、客户CRM网页,几句需求就生成,支持分享协作(后端数据库即将全面开放)。 4. 专业Skills技能包 + 自定义流程
文档、设计、数据可视化、金融分析、浏览器操作等官方技能,随叫随到,还能做故事分镜、专业图表、拆财报。 定价:标准68元/月起(免费版权益+更高额度),最高500元/月。基础聊天搜索生图依然免费。 这波是真·生产力升级,还是又一个“听劝”的工具? #AIAgent# #打工人解放# #生产力工具#
显示更多
0
33
28
1
转发到社区
大概一个月多前,电脑中了木马,潜伏了一个月才被发现,也导致了我的 X 账号被盗。 让 Claude 和 Codex 逐一分析系统进程时,找到了一个叫做 com\.apple.accountsd.helper.plist 的进程,乍一看还以为是苹果系统的宿主进程,但 Claude 对这个进程提出了质疑。 沿着这个线索,对 accountsd 进行了详细的分析。这个木马首先给系统添加了一个开机自启项,确保可长期潜伏,然后通过 root 权限写了一个守护脚本,每秒探测当前系统是否有新用户登录,一旦登录就通过 AppleScript 脚本切换成当前用户身份,运行一个叫做 AccountsHelper 的程序。 对 AccountsHelper(SHA256:9168cbc45f)也做二进制分析,它的依赖极少,主要职责是从远端加载指令,然后拉起一个交互式 PTY shell,攻击者就是通过这个 shell 来远程操控电脑的。木马执行的每个环节,清理工作都做的特别好,几乎所有日志都被清理干净了。 为了溯源整个中马过程,我分析了将近两个多月的系统日志,仅找到一条可疑指令:有个 curl 操作,下载并执行了一条混淆命令,这也是唯一的线索,解密指令得到了一个远端 IP地址。 后来也从公开情报里找到这个木马,它是 AMOS Stealer 恶意软件家族的变种,之前主要针对 Windows 平台,今年四月第一次在 macOS 上被发现。 从 .zhistory 日志看,curl 前后都是 Claude Code 相关操作,高度怀疑就是 Agent 程序引入了这个木马。 我的 Claude Code 长期是 bypass 模式,所有的命令执行都是直接放过,怀疑是在做软件安装或更新的时候,AI 从互联网找到了一些不安全的资源,下载了这个木马。 这个 AMOS 木马,主要会去扫各种虚拟货币钱包,尤其是浏览器插件钱包。顺带也把我各种登录态 Cookies 全部拿走了,这才导致 X 账号被恶意添加了一个 Passkey。 一般木马进来之后,除了目的性的攻击(例如虚拟钱包转账、文件加密勒索)外,它还会使劲去找各种敏感信息,尤其是浏览器里的登录态、Keychain 里保存的账号密码、聊天工具的登录状态、开发环境里的 .env 文件和各种 token,等等。 我这个教训,大家记住两点:1)所有能够加 F2A 的账号都要加,登录时的二次验证会增加攻击者的门槛;2)AI 在执行各种程序的时候,一定要注意它在执行什么,尤其是安装和更新软件的时候,要先确认再执行。 跟一些安全研究者也交流了这个木马的细节,他说近期这类事件特别高频,攻击者会伪造各种软件的官网,Google 搜出来默认都排在第一位,诱导用户(尤其是 AI)下载木马,防不胜防!
显示更多
0
126
897
169
转发到社区
wok,发现宝了,之前折腾各种远程方案都可以扔了 我经常出门要背那块砖一样的 16 寸 MacBook,就因为随时可能要操作电脑。 期间试过 Tailscale +tmux、Todesk 这些方案,不是配置折腾就是体验差,始终不满意。 最近圈子里有不少大佬在用UU远程,我也试了一下。 看我刚用手机录的这段视频,手机操控电脑几乎零延迟,最高 4K蓝光144 帧,两个显示器来回切也完全流畅。 但最让我惊喜的还是终端功能。 我平时一直在电脑上让AI跑任务,出门在外想看一眼任务状态,就折腾了Tailscale +tmux,说实话,体验确实一般,还总是中断。 UU 远程直接给了终端入口,手机上就能登陆终端看信息和进程。 整个过程就是纯命令行,跟在电脑前开Terminal体验一样,对玩 AI 的人来说这个功能是真的刚需。 UU远程已经两年了,说实话刚开始以为网易迟早要收费,结果到现在依然完全免费、零广告,这两年更新了几十个版本,体验越来越流畅延迟越来越低,还陆续加了远程开关机等实用功能。一直在迭代变好,但始终没收费。 支持手机对电脑、电脑对电脑多端远程控制,还有内网穿透能力,我到现在都不知道他们靠什么回本。
显示更多
0
53
89
6
转发到社区
Marvis(马维斯)是腾讯(应用宝团队)推出的操作系统层级AI助手,2026年5月20日正式上线,官网 可直接下载(Windows/Mac/Android已开放,iOS预计6月中旬)。 它不是单纯的聊天机器人,而是能深入系统底层、真正“干活”的AI,像钢铁侠的Jarvis一样,用自然语言操控电脑/手机。 核心定位:把整台电脑变成可对话的智能对象。整合系统、文件、应用、算力、跨端连接。 架构:1个主Agent(PM)+ 5个副Agent(File文件、Computer系统、App应用、Browser浏览器、Search搜索),并行协作拆解执行复杂任务。 两种模式:效率模式:端云协同(DeepSeek V4、混元等),又快又准。 隐私模式:纯本地大模型,文件0上传,断网可用,适合财务/法务/HR等敏感场景。 每日免费:1000万Token,日常够用。
显示更多
现在一个人用AI确实能把以前10人团队的事全干了, 1. 产品确定+深度调研:有一个电子 + 靠商业分析技能 + ChatGPT Pro 研究市场、竞品、用户痛点。 2. 开发测试:甩给Codex、Claude,24小时写代码、debug、迭代、测试,期间自己操控浏览器,用 computer use 操控电脑。 3. 自动化集成部署:用各种CLI工具 + 各种连接器,AI直接操作飞书、企微等,连Vercel、Cloudflare,自己部署服务器、运维环境,上线全自动。 4. 电脑操控:Computer Use 直接看屏幕、动鼠标、敲键盘,像真人一样操作你的电脑。你可以直接把电脑挂在那,手机随时发指令监督、调整,喝咖啡、睡觉、出门,它都在干活。 真正决定成败的是: 一个好的idea + 能赚钱的商业模式 + 最最重要的:被看见 这个时代,执行力被AI无限放大,但注意力是稀缺资源。
显示更多
10个GitHub仓库帮你爬取整个互联网 全部收藏。每个都能从任何网站提取干净数据,这种访问权限通常需要销售电话和合同才能获得。 1. 指向任何网站,它就能爬取每个页面、渲染JavaScript,返回AI能立即读取的干净结构化数据。13万星,进入GitHub百大仓库。半数AI创业公司悄悄运行的爬虫骨架,完全开源。 2. GitHub排名第一的爬虫。把任何网站转换成干净的LLM就绪的markdown,比付费服务更快,无需API密钥、无需账户、无需按页面付费。某开发者被16美元的付费爬虫激怒后几天就搞出来了。5.1万星。Apache 2.0。 3. 像真人一样操控浏览器的AI代理,点击、滚动、登录、填表,从未见过的网站中提取数据。两位苏黎世ETH研究员开发,一年内达到9.5万星。能爬取简单爬虫无法触及的页面。MIT协议。 4. 完整专业爬虫框架,包含轮换代理、自动重试、浏览器指纹欺骗和队列管理。防止被封禁的全套机制,爬虫公司收费数千的技术栈,现在免费给你。 5. 十多年来悄悄为数据团队赋能的工业级爬虫。爬百万页面、提取任何内容、干净导出。在大多数付费工具无法触及的规模上经过实战检验,始终免费。 6. 微软自家工具,将任何文件或网页、PDF、Office文档、HTML、图像转换成AI能用的干净markdown。整个数据管道公司都在围绕此构建,由微软开源。 7. 隐形爬虫,能自动适应网站布局变化,绕过反爬虫检测。防爬供应商当高级功能出售的猫鼠游戏,现在免费开源。 8. 从电脑远程控制任何安卓手机,提取数据和自动化没有网站的应用。通往大多数爬虫无法触及的纯移动平台的桥梁。13万+星。Apache 2.0。 9. 给一个例子它就自动找出规律爬取网站其余内容。无需选择器、无需代码维护。'直接给我数据'按钮,几行Python。 10. curl的增强版,完美模拟真实浏览器指纹,请求看起来就像有Chrome的真人。昂贵爬虫API底层暗用的最低级技巧,现在免费。 公司为此收费2000美元/月。源代码就在这儿。
显示更多
0
4
179
40
转发到社区
Prompt该退环境了,未来属于Loop Engineering。 最近,AI行业又出现了一个有趣的新词。Loop Engineering。 如果你关注AI这个领域的话,这两天应该都会刷到。推特在刷,各种社媒也在刷,群里也有蛮多人在讨论。事情是这样的。 6月7号,OpenClaw的创始人Peter发了一条推,非常的简短,但是直接就爆了。 翻译过来意思就是:你不再需要为编码智能体编写提示词了,你应该设计循环来提示你的Agent。 而在这之前几天,Claude Code的创始人老哥Boris在一个开发者大会上也说了差不多的话。 他的原话大概是,我不再手动给Claude写提示词了,我运行着能让Claude自动编排任务的循环,我的工作,就是编写这些循环机制。 也就是,写loop。 这两个人呢,说了同一件事。然后Google的Addy Osmani紧接着发了一篇长文,把Loop Engineering这个概念正式梳理了出来。 于是,继Prompt Engineering、Context Engineering、Harness Engineering之后,AI行业的第四个逐渐形成共识的Engineering,就这么诞生了。 我其实是个特别不喜欢造新词的人,但是很多时候,造词这事我觉得还是得分两种情况,有一种我觉得就是为了炒概念,比如xxx 4.0。 而有的时候,真的只是行业太快,人们更需要一个精准的表达来帮助自己表达而已。Loop Engineering我觉得就是后一种。 而且,这个东西跟我自己一直使用Agent的方法、一直在鼓励大家做的事,是高度吻合的。如果你看过我之前写的那篇Harness Engineering的文章,你大概能理解一些我的感觉。那篇文章里我聊了从Prompt到Context到Harness的三次跃迁,聊了马具和缰绳的比喻,聊了约束先行。 而Loop Engineering,其实就是在Harness之上,又往上走了一层。把一个套马的缰绳,变成了全自动工业流水线。很有《文明》里时代的进化的感觉。 给大家举个例子。比如说,以前你用Claude Code写代码,流程大概是这样的。你给它一个任务,它写完了,你看一眼,觉得不太对,你再给它提一个修改意见,它改完了,你再看,再提意见。整个过程你会发现,是坐在设备前的,一轮一轮的,你说一句它回一句,你就是那个驱动整个循环的发动机。 即使我们以前从chatbot时代迈向了Agent时代,绝大多数的事情,也一样是任务制的。 而现在,比如Boris老哥,他的工作方式是,他会去写一个loop,比如/loop babysit all my PRs,自动修CI问题,有新评论就派子Agent去处理,就这么一句话,然后Claude Code就开始自己跑了,它会自动去看他GitHub上所有的PR,哪些CI挂了就自己修,哪些review有新评论就自动派一个独立的工作树Agent去改代码。 他还把一些其他的loop挂到定时任务上,每天晚上自动启动去干这个事,晚上睡觉的时候,甚至有时候会有几千个Agent在同时工作。他自己说,2026年,他就再也没有手写过一行代码了。 你会看到,这就是loop,定好目标,然后全自动流程化,你完全不需要在电脑前,甚至都不需要看手机。 你可以直接睡觉,醒来的时候,代码已经改好了,测试也已经跑过了,PR也已经提上去了。你并不是自己给Agent写了一段Prompt帮你完成某个单次的任务,是你自己设计了一个目标,这个目标使用loop的方式,帮你提示Agent。 你定义目标,定义验证条件,定义失败了怎么处理,然后,就可以放手了,从此以后,这一切,交给系统。 说到这里,我估计很多人已经大概理解loop是个什么东西了。Addy Osmani在他那篇长文里,把一个完整的loop拆成了五个组件。 我觉得这个拆法蛮清晰的,我用我自己的理解给大家过一下。 第一个是定时任务,整个loop的心跳。 你得有一个东西能自动启动循环,不管是定时跑、还是事件触发,都行。 Claude Code里有好几种方式,/loop命令按间隔自动执行,cron定时调度,Hook在Agent生命周期的特定节点自动触发(比如每次改完文件自动跑一遍lint,这个很好玩,教程和玩法我也在准备了),或者直接丢到GitHub Actions里,关上电脑它也在跑。 没有定时任务的Agent,你每次都得手动去踢一脚它才会动,那就不是loop了,那还是你在操控。 第二个是工作树隔离,Worktree(搞过开发的朋友应该秒懂)。 就是你同时跑好几个Agent的时候,给每个Agent一个独立的工作空间,各干各的互不干扰,干完了再合并。两个Agent改同一个文件的痛苦,跟两个设计师同时改一个图层又不打招呼的痛苦,是一模一样的。 第三个是项目知识体系,Addy Osmani在他的原文里写的是skill,但是我觉得他写的不太对,单skill其实是不够的,必须得是知识管理体系。 大家也都知道,AI每次开新对话就啥都忘了,你跟它说过的代码规范、项目架构、踩过的坑,下次开对话全部从零开始。 所以你得有一整套方法来沉淀、优化这些知识,让Agent每次启动的时候就已经知道你的项目,我自己在这快一年的coding开发过程中,总结的方法论其实就沉淀成了我自己的洁癖.skill,这个基本是我的Agent每天调用最多的skill。 CLAUDE.md是全局的规则和约束,跨会话记忆是一些之前悬而未决的记录和文档路由,docs体系就是你完整的所有的知识和经验沉淀,因为CLAUDE.md和记忆都有大小和行数限制,所以每次任务完成后我会用洁癖.skill来对整个的知识体系进行梳理和审查,确保没有错误。 为什么知识管理体系这个东西在loop里特别重要呢? 因为loop是自动跑的,你不在场。如果Agent的记忆里有过期信息,它就会基于错误的前提做决策,如果CLAUDE.md膨胀到几百行全是历史叙事,真正的规则反而被挤出去了Agent读不到。没有干净的知识体系的loop,就像一个每天早上都在看过期文档的员工,干的得越快错得越多。 所以洁癖.skill我非常推荐大家可以去安装一下,也在我自己的仓库里开源了,我自己真的觉得特别有用。 第四个是连接器,MCP。 一个只能看文件系统的Agent,能力是很有限的。但你给它接上GitHub、Linear、Slack、数据库,它就能在你的真实工作环境里干活了。 这才叫真正的闭环,从发现问题到解决问题到通知人类,一条龙。 第五个是子Agent。 做事的和检查的分开,写代码的Agent不能自己给自己打分,这跟学生自己批自己的考卷一个道理,它一定会对自己太宽容。所以你得有另一个Agent,甚至用不同的模型,专门来检查前一个Agent的输出,一个负责做,一个负责验。 这五个东西加在一起,就是一个完整的loop的骨架。 Claude Code和Codex有一个命令,其实就是Loop Engineering这套骨架最直接的微观型的产品化体现,只不过很多人没有意识到。 他叫/goal,在Codex里叫追求目标。 意思就是你给Claude一个完成条件,比如「所有测试通过并且lint检查没有报错」,然后它就会一轮一轮的自己干,干完每一轮之后,就会检查这个条件是不是满足了。 大多数讲Loop Engineering的文章,都停在了这一层。讲了五个组件,讲了/goal和/loop命令,讲了怎么配定时任务,就结束了。 这些我觉得,都是术。而我更想聊的,是道。 Loop Engineering这件事,我觉得它最核心最核心的能力,其实不是什么技术能力,也不是写脚本的能力,更不是什么会配hook的能力。 最核心的,是定义目标的能力。定义目标,相信我,这四个字,听起来简单,做起来是真的难。 回到前面说的/goal,它的用法看起来非常直接,给一个完成条件,Claude自己干到满足为止。 听起来很简单对吧。但你如果真正用过就会知道,/goal用得好不好,完全取决于你那个目标定义得好不好。这个事我拿两个例子对比一下你就明白了。 目标A,「把这个应用优化一下」。 目标B,「test/auth目录下所有测试通过,tsc --noEmit零报错,npm run lint零违规」。 目标A会发生什么呢。大家可能都能猜到,Claude会陷入一种非常尴尬的状态,因为它不知道什么叫「优化好了」,除非他是Fable 5,能自己在你之上,自主的帮你定义目标。 而绝大多数的模型,包括Opus 4.8和GPT-5.5,在自己定义目标的能力上还是非常的弱,它可能改了一点代码,然后自己觉得还行,就停了。 也可能不停,一直改一直改,把你的代码库改得面目全非,因为它始终无法判断自己到底什么时候算完成了。那目标B呢?Claude每改一轮代码,都会去跑测试、跑类型检查、跑lint。 三个命令,三个明确的通过标准。全过了就停,没过就继续,清清楚楚,干干净净。同一个工具,同一个模型。 区别只在于,你的目标定义得好不好。 我自己其实一直有一个原则,我经常跟身边的人说,在公众号里也说了无数遍,如果一件事你重复做了三次,你就一定要想办法把它完全自动化掉。 这个习惯跟了我很多年了。我每天也都在写代码、做自动化,我们的AIHOT热点监控系统,我们的数据分析流程,我们的财务对账流程,我们的数据清洗管道,能自动的我全部自动了。 但说实话,在做这些自动化的过程中,我踩过最多的坑,从来不是技术问题。 是目标不清晰的问题。我早期做自动化的时候,经常犯一个错,就是目标定得太模糊。 举个例子,比如自动监控AI行业热点,这句话听起来没毛病,但其实是一句纯粹的废话。 什么叫热点?浏览量过万算热点还是过十万算热点?抓取频率是每小时还是每天?抓到以后怎么评估质量?评估完以后怎么排序?排完以后怎么推送? 这种反问的问题,我现在可以直接随手问20个以上。 每一个环节如果没有明确的判定标准,整个自动化链条就是一坨狗屎,你相信我,绝对的。 后来我懂了,每次做自动化之前,我会先花很多时间去定义目标。 去花很多很多时间,去定义怎么算做完了,怎么做完算做的好。这其实就是/goal的逻辑。也是Loop Engineering的灵魂。 而如何定义目标,这个能力,我其实不是从AI中也不是从开发中学来的。 这个能力,是我从这几年创业的过程中,学来的。定义目标的能力,其实就是,管人的逻辑。 我自己也开公司,虽然公司不大,只有30来号人,但管人这件事我是真真切切经历过的。 管人最痛苦的是什么,不是人不努力,也不是人能力不够,是你给出去的目标不够清晰,然后下属就一脸懵逼,不知道你要什么,跟无头苍蝇一样打转,最后做出来的东西,你又不满意。 你跟员工说,“把这个功能做好”,那他做出来的东西大概率不是你想要的。 因为你脑子里的好跟他脑子里的好不是一个东西。 你跟他说,“这个接口的响应时间降到200毫秒以下,错误率控制在0.1%以内,下周三之前上线”,他做出来的东西跟你预期的偏差就会小很多。 因为你给了他一个可以验证完成的标准。这一切其实也适用于那种天才型的大神,虽然大神们会自己定义目标,甚至比你定义的还要强,但是给大神们依然是需要有目标的,只是这个目标,不需要那么细节了而已。 对人如此,对AI也是如此。 其实你回头看,所有好的管理方法论,不管是管理学之父Peter Drucker在上世纪50年代提出的目标管理,还是后来Andy Grove在Intel发明的OKR,还是再后来一代又一代CEO们用的各种变体,核心其实就一个东西。 你能不能把一个模糊的意图,翻译成一组可衡量、可验证的完成条件。 管理者要做的,是确保目标足够清晰、资源足够充足、反馈足够及时。你看这三条。跟一个好的loop的三个要素,是不是一模一样。 目标清晰,就是你的条件写得精准。资源充足,就是你给Agent配好了Skill、连接器、工作权限,让它手里有足够的工具干活。 反馈及时,就是你设计了验证机制,每一轮都有一个独立的检查器告诉Agent做得对不对,哪里需要改。管人的逻辑和管Agent的逻辑,是完全一样的。 只不过,管Agent比管人还要极端一些。 因为人可以理解你的模糊意图,人可以主动来找你确认,人可以说老板你这个需求说得不太清楚我不太确定你是不是这个意思。 Agent很多时候是不会的。Agent会非常自信地按照它自己的理解去执行,然后非常自信地告诉你它做完了。 所以,对管理能力的要求,其实比管人还高。 这也是为什么我一直说,AI时代我最讨厌什么「文科已死」「理科已死」的言论,管理学、心理学、组织行为学这些,不但没死,反而变得更重要了。 说到底,Loop Engineering说是Engineering,但我觉得其实它的核心竞争力根本不在工程。 在管理。 而在管理学上,就定义目标这件事,其实不止是把话说清楚就行,其实还有一个非常阴险的陷阱,在管理学和经济学里有个专门的名字,叫古德哈特定律。 当一个衡量指标变成了目标本身的时候,它就不再是一个好的衡量指标了。 翻译成人话就是,你考核什么,员工就只做什么,然后其他东西可能全都退化。 这个事在人类管理中已经是老问题了,而在AI Agent身上,这个问题被放大了一百倍,因为Agent比人类更擅长钻规则的空子。 有人总结过Loop Engineering里很好玩的事情,就是Agent会针对验证器做优化,而不是针对你真正的目标做优化。 比如说你的loop条件是让测试全部通过,那Agent可能最后不去修Bug,直接把失败的测试给你删了。 你看,最后答案依然是测试全过了,完事,从验证条件来看,它确实完成了目标,但从你真正想要的结果来看。。。它啥也没干。 人也会这么干,只不过,Agent做得更快、更彻底、更没有心理负担。所以,一个好的目标定义,不能只有做完了的标准,还必须有不能怎么做的边界。 这其实就是Harness Engineering在Loop Engineering里面发挥作用的地方。 Harness是约束,是护栏,是告诉Agent你可以自由发挥,但这条线你不能越。 Loop是驱动力,是告诉Agent往那个方向一直跑。两个加在一起,才是一个完整的系统。到这里,骨架讲了,灵魂也讲了,陷阱也讲了。 Loop Engineering的东西,终于也差不多了。 最后我想把前面聊的管理学的思路收一下,给一个我自己用得比较多的目标定义框架,不一定科学,纯粹就是我自己的一点点经验。 1. 完成标准要可以被机器验证。 2. 边界条件要跟完成标准一起定义。 3. 要有失败的降级方案。 4. 目标要分层。 回到整条线来看,从Prompt到Context到Harness到Loop,四次跃迁,其实讲的是同一个故事。Prompt Engineering告诉你,好好说话,AI会更懂你。 核心能力是语言表达。Context Engineering告诉你,光说话不够,得给AI足够的信息。 核心能力是信息筛选和组织。Harness Engineering告诉你,光给信息也不够,得给AI设规则和约束。 核心能力是系统设计和规则制定。 Loop Engineering告诉你,光设规则也不够,得让整个系统能自己跑起来。 核心能力是目标定义和管理。 语言学、信息科学、控制论、管理学。四个Engineering,四门古老的学科。 多有意思。 人类社会,其实从来就没有变过。
显示更多
0
84
522
86
转发到社区
远程工具折腾了不少,To Desk 、向日葵这种简单的远程控制工具,或者是TailScale这种比较复杂的方案,都没有一个比较满意的,最后的归宿还是UU远程。 我的需求其实很简单,就是能够远程控制家里的那台主力开发电脑,偶尔需要用一下Windows设备,或者说是在不方便带电脑的场合想看看机器上的东西。 找了一圈,只有UU远程满足要求,免费、不限时长、不限设备,几个问题都给我完美的解决了。 1、远程编程,这个是我最核心的需求了,主力开发环境都在家里的Mac mini上,出门我一般带着Macbook Air,如果两台机子都配一下环境,那也太麻烦了; 只要我能够稳定的连接上家里的设备就行,这块UU远程没掉过链子,现在我都是主力机放家里,出门通过UU远程连接,AI编程写代码、演示项目,这些都没啥问题。 2、终端连接,如果你习惯了看终端,以及彻底摆脱了图形界面,那么这个更适合你了,UU远程可以直接一键终端连接,折腾过终端连接的应该都知道这玩意有多烦,但是UU远程帮你解决了。 3、外网连接,这个也不用多说了,一个账号多个设备登录,这种非常容易被封,所以我的主要账号都是放在一台机子上,平时要使用但设备不在身边,UU远程连接就够。 4、偶尔手上没电脑,比如说在地铁上,就像看看AI编程跑到哪一步了,手机也能连接电脑,文字适配做的不错,功能也全,这不比折腾各种远程控制方案香多了? 5、有的时候得测试工具在Windows上的表现,用惯了苹果的触控板,切Windows就挺难受,没想到UU远程也能发挥作用,远程操控Windows,跟用Mac差不多丝滑。 上面就是我的一些主要用法,基本上是覆盖我大部分的需求了,现在去哪都不用担心忘带哪台设备,身上有一个手机就够了。 AI时代,大多数时候我们需要的就是一个对话框加上一个显示窗口,剩下的自然越简单越好,UU远程就是这种工具,轻装上阵,顺手把多端连接的事一起解决了。 我现在几台电脑加上手机都装了UU远程,至少有一台机器24小时在远程控制另一台,一直很稳,如果你也在折腾远程控制,不妨试试UU远程。
显示更多
0
57
186
25
转发到社区
懒猫微服和传统NAS的区别: 懒猫微服 = 传统NAS + Cloudflare + Tailscale + VPN虚拟专网 + LightOS + Authy + Nginx + AI大模型 + 微信小程序 + AppStore + 远程微信 + KVM/Docker + 苹果全备份 + 一体化云灾备 + Chrome电视 + 精品官方应用 人话省流版: 1. 内网穿透:速度快,不受运营商干扰,比CloudFlare和Tailscale快很多, TCP、UDP、WebSocket混合打洞,从根本上解决运营商限速的问题 2. 虚拟组网:所有设备安装客户端,异地访问,应用场景,异地多人打局域网游戏;家中5090的算力手机访问;远程桌面访问,不需要买额外的远控软件 3. LightOS:LightOS相当于一台自由的VPS,在家插上鼠标键盘显示器可以当作Linux桌面开发机用,在外可以用手机直接操控Claude Code和Codex,手机移动AI编程才是真正的YYDS 4. Authy: 自带硬件零信任机制,客户端不打开,域名不解析,杜绝黑客工具。自带硬件级MFA认证,所有终端设备都有非对称密钥验证,黑客知道用户名密码无法登录,必须有管理员的一次性验证码,60秒内失效,验证码是微服去中心化生成的,绝对安全 5. Nginx: 内置局域网端口转发工具,客户端因权限安装不方便的地方,可以通过端口转发工具和ClaudeFlare配合,实现外网浏览器访问,不需要安装客户端 6. AI大模型: 相册搜索效果全世界第一,比iCloud和Goolge Photos效果好很多,长句搜索效果速度比开源软件都要快很多。微服可以跑7B大模型,懒猫AI算力舱单台可以跑70B大模型,13台组网可以跑671B大模型,天生支持 CUDA 生态,AI大模型能下载就能直接跑,相比mac来说,体现一个不折腾 7. 微信小程序:自研小程序跨端框架,原生壳 + JS运行时,一次部署云端应用,自动支持 Windows, macOS, Linux, Android, iOS, 鸿蒙、Server, 车机(BYD和华为),VR眼镜 9 端运行。App在所有终端都原生运行,爽不爽? 8. AppStore: 最大私有云App商店,支持3000+ self-host 应用,支持50+ 3A游戏私服,还在以每天10款的软件在快速增长,您的时间最宝贵,节省您时间,更多时间陪家人 9. 远程微信:利用独特的远程虚拟访问技术,微信运行在微服,窗口运行在你的各种电脑设备上,不同的设备共享一份数据,真的是营销售后利器。这不仅仅是简简单单的VNC,更支持本地输入法融合、文件系统互通(可自由选择文件存储在微服还是本地),包括托盘消息、音视频通话、剪切板都通通打通,牛逼的不像云端技术。最关键的是,合法技术,永不封号,放心用! 10. KVM/Docker:支持所有虚拟机,Windows, Linux, macOS, Android。 Intel芯片硬件虚拟化,虚拟机速度杠杠的,替代公有云服务器。专业给封闭生态(比如VR)带软件,利用远程桌面,可以让 Windows, macOS, Linux, Android 软件相互在多个设备上投射 11. 苹果全备份: 不管是 iCloud, 还是 macOS 的 TimeMachine, 甚至是iPhone手机,通通支持一键备份,一旦备份完,家中所有Android设备可以访问 iCloud 照片,每个月节省大量iCloud云服务费。还支持Live图片,苹果办公软件预览,AppleTV,单反照片预览等。对苹果生态支持最好的私有云 12. 一体化云灾备:我们支持RAID备份、外接USB备份、局域网台式机备份,甚至我们还支持iSCSI远端异地快照增量备份,备份到你另外一台微服或者云端VPS,都不在话下,因为我们知道比私有云更贵的是你的数据,当你买新机器的时候,还原只需要一步,一键还原。云灾备操作从来没有这么傻瓜 13. Chrome电视: 开源Chrome + HDMI + 大屏电视,手机操作Chrome大电视,想看什么电影看什么电影,还支持安装Chrome插件,所有电影全免费,黑客电视最佳形态 14. 精品官方应用:最好的云端相册、协议支持最全的云端网盘(支持公有云网盘一键同步)、比微信读书还强大的懒猫读书,还有懒猫清单、懒猫音乐、懒猫听书、懒猫旅游地图、懒猫电视、懒猫AirDrop...官方亲自下场造精品应用,每一个像素和每一个按钮都为你倾心打造,关键我们还是整个互联网最听劝的厂商,你哪里不爽我们专改哪里,服务态度堪比海底捞
显示更多
0
50
197
16
转发到社区