注册并分享邀请链接,可获得视频播放与邀请奖励。

与「llm」相关的搜索结果

llm 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 llm 的内容
怎么低成本搭建自己的AI助手? deepseek R1模型发布以来,各种AI应有又有了一波大的爆发,但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手,可以自己调试生成限制,调试输出文本内容,数据不外传,成本尽可能低,不知道是不是可行。 本文详细介绍如何通过Dify和Chrome MCP的结合,在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤,展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用,并解释了工作原理、问题排查及进阶技巧,让读者能够零代码实现网页自动化任务。 你是否想过让AI不仅能回答问题,还能直接操作浏览器帮你做事?比如自动填写网页表单、抓取特定数据、或者点击按钮?现在,通过Dify和Chrome MCP的结合,你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。 本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器,打造你的私人网页自动化助手。 准备工作:确保你的环境就绪 在开始前,请确保你的系统已安装: •Docker 和 Docker Compose(用于快速部署Dify) •**Node.js 18+**(用于运行Chrome MCP服务器) •Git(用于克隆项目仓库) 第一步:快速部署Dify(仅需1分钟) Dify是一个强大的LLM应用开发平台,我们通过Docker快速部署: # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右,访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。 第二步:安装Chrome MCP服务器(1分钟) 打开新的终端窗口,安装并启动Chrome MCP服务器: # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务(会自动打开Chrome浏览器) server-chrome 服务启动后,你会看到类似下面的输出,表示MCP服务器正在9999端口监听: Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步:在Dify中配置Chrome MCP(1分钟) 现在回到Dify管理界面,进行关键配置: 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息: •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存,看到绿色成功提示 效果验证:让AI帮你操作网页 配置完成后,你就可以在Dify的Playground中测试你的网页自动化AI助手了。 试试这些实用场景: 场景1:自动网页搜索 请打开百度首页,在搜索框中输入"最新AI技术发展",点击搜索按钮,然后告诉我第一页的搜索结果标题。 场景2:自动填写表单 请打开"张三",邮箱栏填写"zhangsan@email.com",在留言区填写"咨询产品信息",然后点击提交按钮。 场景3:数据抓取与分析 请打开 工作原理:为什么这很厉害? 这个组合的厉害之处在于分工明确: •Dify:负责与LLM对话,理解你的自然语言指令,并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器:负责实际控制Chrome浏览器,执行具体的网页操作命令 •LLM(大语言模型):作为大脑,理解你的意图并规划操作流程 常见问题排查 server-chrome 2.连接失败:检查Dify和Chrome MCP服务器是否在同一个网络环境下,防火墙是否允许9999端口通信 3.操作超时:复杂网页加载需要时间,可以增加超时设置:server-chrome --timeout=60000 4.权限问题:在MacOS/Linux上可能需要权限:sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧 掌握了基础用法后,你还可以尝试这些高级功能: •多页面管理:同时控制多个浏览器标签页,完成更复杂的任务 •用户身份保存:让AI记住登录状态,下次直接操作无需重新登录 •定时任务:结合Dify的工作流功能,设置定时自动化任务 •异常处理:教会AI识别操作失败的情况并自动尝试替代方案 如何学习大模型 AI ? 由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。 但是具体到个人,只能说是: 最先掌握AI的人,将会比较晚掌握AI的人有竞争优势。 这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。 #AI# #AIAgent# @grok @xai
显示更多
AI时代,真的「只要你学得够慢,你就不用学了」吗? 最近网络上有个说法还挺火的 「AI时代,只要你学得够慢,你就不用学了。」 我第一反应是,这话听起来很有道理。 我想起自己两年前熬夜学LoRA微调,想着可以用来模仿我的写作风格,然而skills出来了,发现效果可能还比我训的LoRA更好。 所以「等」赢了?「学得慢」赢了? 如果你只是一个普通的AI用户,那这句话可能没错。但如果你不甘于只当个「时代喂你啥你就吃啥」的被动者,你想主动把握AI行业发展的脉络,你就不能等。 我仔细想了想,我感觉不是这样的,我想分享下自己的看法。 「等」赢了,但不是因为等 LoRA的故事是真的,类似的情况我遇到过不止一次。两年追热点下来,确实有不少「当年要做没做,后来发现不用做了」的案例。 但有个问题值得反问自己:你知道LoRA是什么、你知道skills出现了、你知道两者可以做横向对比,这个判断力是哪来的? 不是从「等」里来的。 是从两年每天追热点的积累里来的。 因为很多人把「某件具体的事没做」等同于「不用学习」,这两件事完全不在同一个维度上。你「等」到了更好的方案,是因为你有足够的背景知识认出了它。一个完全不了解这个领域的人,他的「没做」只是「不知道」,不是「有判断力的等待」。 工具层可以等,认知层不能等 我2016年开始做机器学习和深度学习,做了好几年数据科学家。到了大模型时代,周围的人都在聊LLM,我一度觉得当年学的那套东西废了。 sklearn怎么调、XGBoost怎么训,这部分确实边缘化了,我不否认。 但我后来发现,真正值钱的东西没废:怎么设计评估体系、怎么防止数据泄露、怎么把一个业务问题转化成模型问题。这些判断力,大模型时代反而更稀缺(因为99%的「AI应用开发者」根本没有这个训练,看到模型输出「看起来对」就交付了)。 工具层的东西,半衰期确实很短,可能18个月就轮换一批。这部分确实可以「等等看」,等生态稳定了再下场,往往比头一批踩坑的人省力。 认知层的东西,没有捷径,也没有办法「等别人替你建立」。你在等的时候,别人在建立判断力的坐标系,你进来以后只能接受别人嚼过的知识,创造空间已经被占了。 比AI工具本身更有价值的 追了两年热点,我发现有一件事比「学到了什么具体技能」更值钱,那就是,我比周围大多数人更能「春江水暖鸭先知」。 某个技术出来,我大概知道它处在哪个演化节点,是真风口还是炒作,值得深入还是等等就过了。 但我一度很困惑,这种「看清楚行业方向」的能力,对我一个打工人有啥用?又不是创业者也不是投资人,判断对了趋势,我也只是回去开早会。 这个落差是真实存在的,不想粉饰。 但仔细想,这个能力其实在影响三件事: 第一,在组织里的位置。大多数团队里,「知道该做什么」比「把事做完」稀缺得多。能帮团队过滤噪音、判断方向的人,话语权不一样。 第二,选雇主的质量。能判断一家公司的技术方向是不是真的对,让你在上升期公司和下沉期公司之间选对的概率高很多。这个差距,可能比一次跳槽涨薪重要得多。 第三,这个认知要是有地方输出,是可以变现的。其实就是把「春江水暖」的判断力转成内容,内容建立影响力,影响力长期会带来预料不到的机会。 所以「只要你学得够慢,你就不用学了」,这话对不对? 我的观点是:对了一半,但被大多数人用来当借口的那一半,恰好是错的那半。 工具层,确实可以等,工具肯定越来越先进,越来越好用,「等等党」在执行层有合理性。 而且在AI时代,这句话本意其实是在说,不要因为错过一个热点而着急,不用FOMO,在AI时代,应该少点焦虑。 但是认知层面,并不会因为你用过的某个AI工具过期了而没学到东西。你追热点的过程看起来很多东西「白学了」,但那个过程本身在建立一张地图,这张地图才是真正的资产。 把「某些工具不用学」误读成「可以少学、慢学、躺着等」,两年后你会发现,你确实等到了更好的工具,但差距在于,人家积极学习的,拿到新工具是真的能做出新东西,等等党拿到新工具,也就是跑个demo自嗨一下,感觉自己站在了时代前沿,实际上还在原地。 而且还有一个时间差的问题值得说。 新工具出来之前,积极的人早就在用当时条件下能用的东西硬拼出来了。RAG还很粗糙的时候,他们已经在生产环境里跑起来了,踩完了坑,知道哪里会出问题。Agent框架还不稳定的时候,他们已经用LangChain拼出了第一版,虽然屎山,但用户在用、反馈在收、迭代在跑。 等等党在等什么?等一个「更成熟的方案」。方案成熟了,他们入场,发现已经是红海。不是因为他们来晚了几个月,是因为那几个月里,积极的人已经建立了用户认知、跑通了商业模式、或者单纯地把某个领域的坑全踩完了,护城河就这么起来的。 更关键的是,这种「拥抱新技术」的习惯本身会复利。积极的人用惯了在局限条件下想办法,新工具一出来,他们比任何人都先知道怎么用好它。等等党等到了新工具,还是原来那个姿势,demo跑一跑,然后继续等下一个。 #AI# #AIAgent# @grok @xai
显示更多
吴说获悉,Vitalik Buterin 更新其本地化 AI 进展,称 DeepSeek V4 已推出可在约 90 GB 显存内运行的 2-bit 量化版本,在 Apple 硬件上速度约为 35 tok/s,AMD 硬件约为 7 tok/s。他表示,真正的“CROPS AI”应支持多种硬件平台,而不仅是“去中心化 AI”。Vitalik 还提出,“CROPS Ethereum access layer”与“CROPS AI”存在交集,例如通过零知识证明实现付费远程 LLM 调用及 Ethereum 私有 RPC 读取,并表示未来应出现更多针对 Ethereum 场景微调的 AI 模型,以提升智能合约与协议代码安全性。
显示更多
Updates since then: * Deepseek v4 is out. There *is* a 2-bit quant that can run within 90 GB ( ), and it works, however it's only fast on Apple hardware (I've head ~35 tok/s). On AMD, it's ~7 tok/s. IMO actually taking the effort to properly support more than one hardware manufacturer is a great example of the difference between mere "decentralized AI" and genuine "CROPS AI". I hope we can become better at this. * also has alpha telegram support now. However, the path to adding your account is quite janky * looks promising as a way to run "dense" models (eg. Qwen 27B) more efficiently. It's janky, but on my 5090 laptop it seems to be ~2x more tok/s than llama.cpp * VoxTerm (local AI recording, no third-party servers) continues to be developed And there's a lot more projects coming on the horizon. One other thing that has been on my mind is that there's actually a lot of intersection between "CROPS ethereum access layer" and "CROPS AI". For example, we want a ZK way to make (paid) calls to remote LLMs. But if we have this, then it's just as useful for solving another problem: private RPC reads in Ethereum. Another example: application-specific finetuned LLMs. Leanstral ( ; I get ~38 tok/s on AMD) fits into < 70 GB, but can hold its own against 1T models on writing Lean code. Things like this are a huge boon for writing more secure code ( ). We should have models finetuned for Ethereum-related use cases as well.
显示更多
0
151
750
90
转发到社区
7. Anthropic - Applied AI Architect(Startups 团队) - 角色: 帮助创业公司构建 Claude 应用的技术架构师 - 要求: 有 LLM 应用开发经验,能与创始人对话 - 中国讨论度: 低 - 🔗 8. Stripe - Staff Full Stack Engineer - 角色: 创业公司级别的早期员工,设定技术方向 - 薪资: 高端(未公开具体数字) - 中国讨论度: 低 - 🔗 --- 校招/实习信息差 9. Cloudflare - 2026 年招聘 1,111 名实习生 - 背景: 从原来 60 人项目暴增至 1,111 人 - 目标: "培养下一代技术领袖" - 中国讨论度: 低 - 🔗 10. - 2026 校招(New Grads) - 岗位: 计算机视觉 / 算法工程师 - 地点: San Jose, CA - 公司: 自动驾驶上市公司 - 中国讨论度: 低 - 🔗 11. Databricks - 2026 New Grad + 实习 - 岗位: 多个 AI/ML 研究、工程岗位 - 地点: SF / NYC / Mountain View / Berlin / Amsterdam / Bengaluru - 中国讨论度: 低 - 🔗 12. IBM - 2026 年校招扩招 3 倍 - 背景: IBM 人力资源官表示将"重写每一个岗位" - 原因: AI 能做入门级工作,但需要能驾驭 AI 的新人 - 中国讨论度: 极低 - 🔗 13. Google DeepMind - Student Researcher Program - 项目: 付费研究实习,覆盖 BS/MS/PhD - 团队: DeepMind / Google Research / 其他 AI 团队 - 中国讨论度: 低 - 🔗
显示更多
终端编程 Agent(最接近 Claude Code) 1. OpenCode ⭐ 165k+ - 协议: MIT | 语言: Go/TypeScript - 免费: 完全免费开源,支持 75+ LLM 提供商 - 特色: - 事实上的开源 Claude Code 替代品 - 本地优先架构,支持本地模型(Ollama 等) - Provider-agnostic:同一会话可切换 Claude/Gemini/GPT/本地模型 - 精美 TUI 界面,支持桌面端和 IDE 扩展 - 中国讨论度: 低,国内媒体很少报道 - 🔗 2. Pi ⭐ 54k+ - 协议: MIT | 语言: Python - 作者: Armin Ronacher(Flask/Jinja2 作者) - 免费: 完全免费开源 - 特色: - 系统提示 < 1,000 tokens,极简设计 - "Lazy Skills" 机制:技能按需加载 - 专为 fork 和二次开发设计 - 增长速度惊人(短时间内突破 54k stars) - 中国讨论度: 极低 - 🔗 3. Crush ⭐ 25k+ - 协议: FSL(2年后转MIT)| 语言: Go - 团队: Charm(Bubble Tea 团队) - 免费: 免费使用 - 特色: - 终端美学标杆,极其流畅的 TUI - 多模型支持,会话中可切换模型 - 原生 LSP 和 MCP 支持 - 适合追求终端体验的开发者 - 中国讨论度: 低 - 🔗 4. Qwen Code ⭐ 25k+ - 协议: Apache-2.0 | 语言: TypeScript - 免费: 免费,配合 Qwen 模型有免费额度 - 特色: - 阿里巴巴出品,Gemini CLI 的开源 fork - Gemini CLI 6月停服后,这是其开源延续 - 专门优化 Qwen-Coder 模型 - 国内用户访问友好 - 中国讨论度: 中等(但远低于其价值) - 🔗 --- 通用 Agent 框架 5. OpenClaw - 协议: 开源 | 免费: 完全免费,云版待定 - 特色: - 自托管 AI Agent,50+ 原生集成 - 零外部 API 调用,隐私优先 - 连接 Slack/GitHub/Notion 等无需第三方 API - 支持 Docker 部署 - 中国讨论度: 低 - 🔗 6. Agno - 协议: 开源 | 语言: Python - 免费: 开源免费,平台版 $99/月起 - 特色: - 2 微秒 Agent 运行时间,极致轻量 - 内置记忆、存储、多模态工具 - 生产级 Python 框架 - 适合需要高性能的场景 - 中国讨论度: 极低 - 🔗 7. Hermes Agent ⭐ 60k+ - 协议: 开源 - 免费: 开源免费 - 特色: - 2个月内突破 60k stars,增速最快 - 持久多层记忆:长期语义记忆 + 工作记忆 + 情景日志 - 云优先架构,独立于本地设备 - 30天学习期后能理解用户工作模式 - 与小米 MiMo V2 Pro 合作 - 中国讨论度: 中等(小米合作有报道,但产品本身讨论少) - 🔗 --- MCP 生态工具 8. MCPX (IBM) - 协议: 开源 - 免费: 开源免费 - 特色: - MCP 网关,统一管理多个 MCP 服务器 - Tool Groups:不同团队看到不同工具子集 - Agent 访问控制 + 实时 Prometheus 指标 - 支持 Cursor/Claude Code/VS Code/Copilot 等 - 中国讨论度: 极低 - 🔗 9. ContextForge (IBM) - 协议: 开源 - 免费: 开源免费 - 特色: - 联邦化 AI 网关,跨多集群 Kubernetes - 支持 MCP/A2A/REST-to-MCP/gRPC-to-MCP - 40+ 插件 - OpenTelemetry 追踪 - 中国讨论度: 极低 - 🔗 --- 多 Agent 编排 10. Microsoft Conductor ⭐ 新项目 - 协议: MIT | 版本: v0.1.1 - 免费: 完全免费开源 - 特色: - 微软出品,GitHub Copilot SDK + Anthropic Agents SDK - YAML 定义工作流 + Web 仪表板 - 适合企业级多 Agent 场景 - 中国讨论度: 极低 - 🔗 11. Agent Skills (by Addy Osmani) ⭐ 43.8k+ - 协议: 开源 - 免费: 完全免费 - 特色: - 23 个生产级工程技能 - 7 个斜杠命令覆盖完整开发生命周期 - 编码 Google 工程文化(Hyrum's Law、trunk-based development) - 渐进式披露设计 - 中国讨论度: 低 - 🔗
显示更多
Behind the MiMo API Price Reduction: The deepest price cut, up to 99%, is for Input (Cache Hit). The core reason is our inference framework now supports hierarchical KV cache optimization for SWA. Production inference engine tests show this optimization increases cached token capacity by 5x, equivalent to an 80% reduction in caching costs. Combined with Cache Read Overlap among multiple Full Attention modules in the Hybrid model, actual costs are further reduced. Prices for Input (Cache Miss) and Output are also reduced by 60%-80%. This mainly benefits from the extreme 1:7 Full:SWA sparsity ratio brought by the model architecture (the prefill compute of the 70-layer MiMo-V2.5-Pro roughly equals a 10-layer GQA model). This kept our original inference costs well below the industry average, naturally leaving a 2x-3x profit margin in pricing. This price adjustment simply reflects our decision to pass these structural cost efficiencies directly to developers. Operating at these newly reduced API prices, our production inference engine is running at near full capacity, and we can still essentially break even. We previously advised LLM companies not to "blindly cut prices" precisely because very few model architectures and inference optimizations can keep API costs from running at a loss. If more architectures that save compute and KV cache emerge, along with better inference Infra to drive down API costs, this will form an excellent virtuous cycle in the industry. More crucially, affordable, high-performance model APIs will drive real, sustained, and at-scale inference demand. This upstream demand pulls forward the development of the entire AI infrastructure chain—including chips, servers, optical transceivers, PCBs, liquid cooling, power, energy storage, and data centers—serving as a strategic fulcrum for a systemic revaluation of AI hardware. In the long run, this injects more affordable and accessible compute into both training and inference pipelines, accelerating the parallel evolution of global AGI across multiple regions and technical routes. For more technical details, we will release a detailed Blog post later.
显示更多
0
56
470
63
转发到社区
5月28日起,#币安钱包# 将联合Spark、Sky、Venus Flux、Lista DAO、Lorenzo、UniSwap及PancakeSwap多个协议举办钱包DeFi季活动。 总奖池价值2,000,000美元,活动覆盖理财、借贷、流动性池三大板块。 该活动将于本周开始,并在后续三周内围绕各主题上线系列活动。请持续关注钱包官方账号公告,获取更多活动消息。 了解更多👇
显示更多
Token usage reduction means cutting down the number of text units (tokens) that large language models process, which directly lowers costs, speeds up responses, and makes scaling easier —  @meisshaily #ArtificialIntelligence# #TechNEws# #Tech# #Technology# #LLMs#
显示更多