搜索 DeepSeek 相关的推文与用户

2026.05.29 08:14

各位用大模型的，有商业机密和小秘密的，一定记得关闭下面这些配置项： 1，ChatGPT——设置——数据管理——为所有用户改进模型：关！ 2，Claude——设置——Privacy——Help improve Claude：关！ 3，DeepSeek——设置——数据管理——数据用于优化体验：关！

显示更多

0

3

2

0

转发到社区

唐华斑竹🦅@uniswap12

2026.05.29 02:53

怎么低成本搭建自己的AI助手？ deepseek R1模型发布以来，各种AI应有又有了一波大的爆发，但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手，可以自己调试生成限制，调试输出文本内容，数据不外传，成本尽可能低，不知道是不是可行。本文详细介绍如何通过Dify和Chrome MCP的结合，在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤，展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用，并解释了工作原理、问题排查及进阶技巧，让读者能够零代码实现网页自动化任务。你是否想过让AI不仅能回答问题，还能直接操作浏览器帮你做事？比如自动填写网页表单、抓取特定数据、或者点击按钮？现在，通过Dify和Chrome MCP的结合，你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器，打造你的私人网页自动化助手。准备工作：确保你的环境就绪在开始前，请确保你的系统已安装： •Docker 和 Docker Compose（用于快速部署Dify） •**Node.js 18+**（用于运行Chrome MCP服务器） •Git（用于克隆项目仓库）第一步：快速部署Dify（仅需1分钟） Dify是一个强大的LLM应用开发平台，我们通过Docker快速部署： # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右，访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。第二步：安装Chrome MCP服务器（1分钟）打开新的终端窗口，安装并启动Chrome MCP服务器： # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务（会自动打开Chrome浏览器） server-chrome 服务启动后，你会看到类似下面的输出，表示MCP服务器正在9999端口监听： Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步：在Dify中配置Chrome MCP（1分钟）现在回到Dify管理界面，进行关键配置： 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息： •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存，看到绿色成功提示效果验证：让AI帮你操作网页配置完成后，你就可以在Dify的Playground中测试你的网页自动化AI助手了。试试这些实用场景：场景1：自动网页搜索请打开百度首页，在搜索框中输入"最新AI技术发展"，点击搜索按钮，然后告诉我第一页的搜索结果标题。场景2：自动填写表单请打开"张三"，邮箱栏填写"zhangsan@email.com"，在留言区填写"咨询产品信息"，然后点击提交按钮。场景3：数据抓取与分析请打开工作原理：为什么这很厉害？这个组合的厉害之处在于分工明确： •Dify：负责与LLM对话，理解你的自然语言指令，并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器：负责实际控制Chrome浏览器，执行具体的网页操作命令 •LLM（大语言模型）：作为大脑，理解你的意图并规划操作流程常见问题排查 server-chrome 2.连接失败：检查Dify和Chrome MCP服务器是否在同一个网络环境下，防火墙是否允许9999端口通信 3.操作超时：复杂网页加载需要时间，可以增加超时设置：server-chrome --timeout=60000 4.权限问题：在MacOS/Linux上可能需要权限：sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧掌握了基础用法后，你还可以尝试这些高级功能： •多页面管理：同时控制多个浏览器标签页，完成更复杂的任务 •用户身份保存：让AI记住登录状态，下次直接操作无需重新登录 •定时任务：结合Dify的工作流功能，设置定时自动化任务 •异常处理：教会AI识别操作失败的情况并自动尝试替代方案如何学习大模型 AI ？由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。但是具体到个人，只能说是：最先掌握AI的人，将会比较晚掌握AI的人有竞争优势。这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。 #AI# #AIAgent# @grok @xai

显示更多

0

转发到社区

链研社｜AI First🔶💧@lianyanshe

2026.05.28 10:07

最近大模型更新的隐式缓存为什么可以把缓存价格降低，命中率大大提高。传统推理里，你每调一次API，GPU都得把整个输入prompt重新算一遍。固定System Prompt、历史对话、RAG知识库，这些重复内容每次都重新预填充，按全价收费。隐式缓存做了什么？它自动检测本次输入和之前请求的公共前缀。命中了，就把之前算好的KV Cache从SSD硬盘直接加载出来，只对新增部分重新计算。重复劳动，直接砍掉。效果立竿见影。多轮对话、Agent、代码补全这类场景，重复前缀往往占输入Token的70%-90%。命中后，input价格直接打到一折。对长文本多次对话的推理的成本和内存的压力都大大降低。但这里有个关键问题：之前为什么不行？ KV Cache太大了。传统Multi-Head Attention架构下，百万Token的KV可能要上百GB显存。存盘？I/O延迟完全没法接受。GPU必须全程Hold住所有KV，成本根本降不下来。 DeepSeek的MLA架构把KV Cache压缩了10-28倍。百万Token从80-200GB变成4-10GB。这才让硬盘级缓存成为可能，压缩后的KV可以经济地落盘到分布式SSD，需要时再快速加载。本质上，是把最贵的GPU显存从按最大上下文全量占用变成了按实际新增Token动态使用，类似动态更新的模式。这里有个反直觉的点：虽然对高速内存需求大幅下降，但并不是完全转向硬盘。更像是分层存储，GPU只保留热数据，冷前缀卸载到SSD。类似CPU的分页机制，只是这次发生在大模型推理层。 DeepSeek率先把这套机制默认开启，给出极致低价。其他厂商不得不跟进，竞争驱动技术扩散，技术扩散又进一步压低价格。要想最大化缓存命中需要做什么？想最大化省钱，把重复内容尽量放在prompt开头，保持前缀一致性，命中率会更高。API响应里有prompt_cache_hit_tokens字段，直接看命中率。这轮降价潮是真实的架构创新，算法效率优化带来的成本下降。MLA压缩KV、分布式SSD存储、Radix-Tree前缀索引，这些工程突破把原来需要重复劳动浪费的算力，优化到极致尤其是 DeepSeek，降价这么多还能赚钱，还是永久降价，这是真本事，那之前的原价是耍我们玩得吗，第一天用原价 API 的人是有点冤大头了。

显示更多

0

转发到社区

币天天@xiaofeilong99

2026.05.28 08:08

兄弟们，Claude Code 省钱神器来了。 Claude Code Router，GitHub 3.4万星，干的事很简单：把 Claude Code 的请求转到不同模型上。不是每个任务都需要最贵的模型。改文档、跑小修复、整理代码，可以走便宜模型；长上下文、复杂推理，再切回强模型；甚至能接 OpenRouter、DeepSeek、Ollama、Gemini 等多个提供商。这东西适合重度用 Claude Code 的人。以前是模型牵着你走，现在是你自己给任务分档位。用得好，一个月 AI 编程成本真能省不少。链接：

显示更多

0

转发到社区

比特币大手子@CryptoBigHand

2026.05.28 07:26

【怎么让AI更聪明的完成任务？】这是一个在AI快速发展的现在，最常遇见的问题。因为现在AI发展的很快，每个模型都在不停的迭代版本，并且不同的模型都有自己的特性，如何去挑选适合自己需求的模型，如何去调教不同模型的prompt，这会直接决定产品最终呈现效果的优劣。之前做过好几个AI交易的辅助工具，模型尝试用过GPT、Deepseek、Claude，AI工具用过n8n、小龙虾、骡子，但是最后呈现的效果和自己预期的总是差很多，虽然最后做出来的不错的版本，但是消耗了太多的时间精力和Token，我也在寻求更好的解决方案，直到用了dappos！ dappos简单来说，就是：AI 替用户使用 AI，AI学习AI 你不需要再纠结选哪个模型、怎么写 prompt、要不要写 skill，你只需要说一句简短请求，剩下的交给 xBubble。其中的核心是Bubble Pilot帮用户去完成任务，取用户的简短请求，识别任务类型，检索匹配的 SOP 并分发到最优路径 Bubble Engine帮你去学习AI，针对特定任务，使用 AI 编程 Agent 生成解决方案变体，构建测试框架，组合候选模型与工具，将最优路径固化为可复用 SOP。就比如说我想做一个Defi赛道的投资机会速览，同一套提示词，xBubble和豆包生成的图片可以说是天差地别，豆包连文字都是马赛克，而xBubble不仅逻辑清晰还有数据作为支撑，信息的详细程度和豆包不是一个层级上的！只有两个字，好用！总的来说，你有了dappos，就相当于有了一个AI秘书，直接跟秘书去提需求，秘书会帮你把剩下的流程全部走完，你等着接收汇报就行了！用dappos，当AI的老板，有事就让秘书干！

显示更多

0

47

31

0

转发到社区

吴说区块链@wublockchain12

2026.05.27 23:48

吴说获悉，Vitalik Buterin 更新其本地化 AI 进展，称 DeepSeek V4 已推出可在约 90 GB 显存内运行的 2-bit 量化版本，在 Apple 硬件上速度约为 35 tok/s，AMD 硬件约为 7 tok/s。他表示，真正的“CROPS AI”应支持多种硬件平台，而不仅是“去中心化 AI”。Vitalik 还提出，“CROPS Ethereum access layer”与“CROPS AI”存在交集，例如通过零知识证明实现付费远程 LLM 调用及 Ethereum 私有 RPC 读取，并表示未来应出现更多针对 Ethereum 场景微调的 AI 模型，以提升智能合约与协议代码安全性。

显示更多

0

转发到社区

vitalik.eth@VitalikButerin

2026.05.27 20:51

Updates since then: * Deepseek v4 is out. There *is* a 2-bit quant that can run within 90 GB ( ), and it works, however it's only fast on Apple hardware (I've head ~35 tok/s). On AMD, it's ~7 tok/s. IMO actually taking the effort to properly support more than one hardware manufacturer is a great example of the difference between mere "decentralized AI" and genuine "CROPS AI". I hope we can become better at this. * also has alpha telegram support now. However, the path to adding your account is quite janky * looks promising as a way to run "dense" models (eg. Qwen 27B) more efficiently. It's janky, but on my 5090 laptop it seems to be ~2x more tok/s than llama.cpp * VoxTerm (local AI recording, no third-party servers) continues to be developed And there's a lot more projects coming on the horizon. One other thing that has been on my mind is that there's actually a lot of intersection between "CROPS ethereum access layer" and "CROPS AI". For example, we want a ZK way to make (paid) calls to remote LLMs. But if we have this, then it's just as useful for solving another problem: private RPC reads in Ethereum. Another example: application-specific finetuned LLMs. Leanstral ( ; I get ~38 tok/s on AMD) fits into < 70 GB, but can hold its own against 1T models on writing Lean code. Things like this are a huge boon for writing more secure code ( ). We should have models finetuned for Ethereum-related use cases as well.

显示更多

0

151

750

90

转发到社区

ahhhhfs@abskoop

2026.05.27 11:51

想在本地跑 Qwen、Llama、DeepSeek，但不确定电脑能不能带得动？🥲 Can I Run AI ：一个本地大模型硬件检测网页工具可以通过浏览器识别 CPU、GPU、内存信息，再匹配不同模型的显存需求、量化方案和运行等级适合在下载 Ollama / LM Studio / GGUF 模型之前，先判断一下： 8G 显存适合跑什么？ Mac 统一内存能不能撑住 14B？ 32B 模型是不是已经超出当前设备范围？不能替代真实跑分，但很适合用来排除明显不合适的模型，少走一些下载完才发现跑不动的弯路

显示更多

0

4

11

2

转发到社区

大宇@BTCdayu

2026.05.27 10:02

当前各AI最新使用评分 GPT 9分，think模式就很好用了，快、准、新。 claude 8.5分，可能是算力不够，偷懒、出错 manus 7.5分优化不错，但太费钱 kimi 7分多Agent集群确实不错，但错误很多豆包 6.5分能力很弱，但照顾老人小孩情绪… gemini 6分非常偷懒，可能是在学走豆包路线 GROK 6分胜在X搜索，但算力多，估计 @elonmusk 后面会发力千问 6 deepseek 5分混元 2分文心一言 1分如果只能选一个的话，我会推荐gpt，如果claude没有被封的风险，也可以claude作为主力——这两个随时哪边更新一下，就超过另外一个，得分很近。

显示更多

0

转发到社区

Bohu@BohuTANG

2026.05.27 09:27

为什么 deepseek 要出自己的 code agent，估计是看不下去了😂。别的 agent 确实很难发挥出他们模型的威力。比如 claude code 在 deepseek v4 pro 上效果其实很差劲，感觉都在浪费 token和时间🤣

显示更多

0

46

317

13

转发到社区

与「DeepSeek」相关的搜索结果