注册并分享邀请链接,可获得视频播放与邀请奖励。

与「DeepSeek」相关的搜索结果

DeepSeek 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 DeepSeek 的内容
各位用大模型的,有商业机密和小秘密的,一定记得关闭下面这些配置项: 1,ChatGPT——设置——数据管理——为所有用户改进模型:关! 2,Claude——设置——Privacy——Help improve Claude:关! 3,DeepSeek——设置——数据管理——数据用于优化体验:关!
显示更多
怎么低成本搭建自己的AI助手? deepseek R1模型发布以来,各种AI应有又有了一波大的爆发,但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手,可以自己调试生成限制,调试输出文本内容,数据不外传,成本尽可能低,不知道是不是可行。 本文详细介绍如何通过Dify和Chrome MCP的结合,在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤,展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用,并解释了工作原理、问题排查及进阶技巧,让读者能够零代码实现网页自动化任务。 你是否想过让AI不仅能回答问题,还能直接操作浏览器帮你做事?比如自动填写网页表单、抓取特定数据、或者点击按钮?现在,通过Dify和Chrome MCP的结合,你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。 本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器,打造你的私人网页自动化助手。 准备工作:确保你的环境就绪 在开始前,请确保你的系统已安装: •Docker 和 Docker Compose(用于快速部署Dify) •**Node.js 18+**(用于运行Chrome MCP服务器) •Git(用于克隆项目仓库) 第一步:快速部署Dify(仅需1分钟) Dify是一个强大的LLM应用开发平台,我们通过Docker快速部署: # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右,访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。 第二步:安装Chrome MCP服务器(1分钟) 打开新的终端窗口,安装并启动Chrome MCP服务器: # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务(会自动打开Chrome浏览器) server-chrome 服务启动后,你会看到类似下面的输出,表示MCP服务器正在9999端口监听: Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步:在Dify中配置Chrome MCP(1分钟) 现在回到Dify管理界面,进行关键配置: 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息: •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存,看到绿色成功提示 效果验证:让AI帮你操作网页 配置完成后,你就可以在Dify的Playground中测试你的网页自动化AI助手了。 试试这些实用场景: 场景1:自动网页搜索 请打开百度首页,在搜索框中输入"最新AI技术发展",点击搜索按钮,然后告诉我第一页的搜索结果标题。 场景2:自动填写表单 请打开"张三",邮箱栏填写"zhangsan@email.com",在留言区填写"咨询产品信息",然后点击提交按钮。 场景3:数据抓取与分析 请打开 工作原理:为什么这很厉害? 这个组合的厉害之处在于分工明确: •Dify:负责与LLM对话,理解你的自然语言指令,并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器:负责实际控制Chrome浏览器,执行具体的网页操作命令 •LLM(大语言模型):作为大脑,理解你的意图并规划操作流程 常见问题排查 server-chrome 2.连接失败:检查Dify和Chrome MCP服务器是否在同一个网络环境下,防火墙是否允许9999端口通信 3.操作超时:复杂网页加载需要时间,可以增加超时设置:server-chrome --timeout=60000 4.权限问题:在MacOS/Linux上可能需要权限:sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧 掌握了基础用法后,你还可以尝试这些高级功能: •多页面管理:同时控制多个浏览器标签页,完成更复杂的任务 •用户身份保存:让AI记住登录状态,下次直接操作无需重新登录 •定时任务:结合Dify的工作流功能,设置定时自动化任务 •异常处理:教会AI识别操作失败的情况并自动尝试替代方案 如何学习大模型 AI ? 由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。 但是具体到个人,只能说是: 最先掌握AI的人,将会比较晚掌握AI的人有竞争优势。 这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。 #AI# #AIAgent# @grok @xai
显示更多
最近大模型更新的隐式缓存为什么可以把缓存价格降低,命中率大大提高。 传统推理里,你每调一次API,GPU都得把整个输入prompt重新算一遍。固定System Prompt、历史对话、RAG知识库,这些重复内容每次都重新预填充,按全价收费。 隐式缓存做了什么? 它自动检测本次输入和之前请求的公共前缀。命中了,就把之前算好的KV Cache从SSD硬盘直接加载出来,只对新增部分重新计算。重复劳动,直接砍掉。 效果立竿见影。多轮对话、Agent、代码补全这类场景,重复前缀往往占输入Token的70%-90%。命中后,input价格直接打到一折。对长文本多次对话的推理的成本和内存的压力都大大降低。 但这里有个关键问题:之前为什么不行? KV Cache太大了。传统Multi-Head Attention架构下,百万Token的KV可能要上百GB显存。存盘?I/O延迟完全没法接受。GPU必须全程Hold住所有KV,成本根本降不下来。 DeepSeek的MLA架构把KV Cache压缩了10-28倍。百万Token从80-200GB变成4-10GB。这才让硬盘级缓存成为可能,压缩后的KV可以经济地落盘到分布式SSD,需要时再快速加载。 本质上,是把最贵的GPU显存从按最大上下文全量占用变成了按实际新增Token动态使用,类似动态更新的模式。 这里有个反直觉的点:虽然对高速内存需求大幅下降,但并不是完全转向硬盘。更像是分层存储,GPU只保留热数据,冷前缀卸载到SSD。类似CPU的分页机制,只是这次发生在大模型推理层。 DeepSeek率先把这套机制默认开启,给出极致低价。其他厂商不得不跟进,竞争驱动技术扩散,技术扩散又进一步压低价格。 要想最大化缓存命中需要做什么? 想最大化省钱,把重复内容尽量放在prompt开头,保持前缀一致性,命中率会更高。API响应里有prompt_cache_hit_tokens字段,直接看命中率。 这轮降价潮是真实的架构创新,算法效率优化带来的成本下降。MLA压缩KV、分布式SSD存储、Radix-Tree前缀索引,这些工程突破把原来需要重复劳动浪费的算力,优化到极致 尤其是 DeepSeek,降价这么多还能赚钱,还是永久降价,这是真本事,那之前的原价是耍我们玩得吗,第一天用原价 API 的人是有点冤大头了。
显示更多
兄弟们,Claude Code 省钱神器来了。 Claude Code Router,GitHub 3.4万星,干的事很简单:把 Claude Code 的请求转到不同模型上。 不是每个任务都需要最贵的模型。 改文档、跑小修复、整理代码,可以走便宜模型; 长上下文、复杂推理,再切回强模型; 甚至能接 OpenRouter、DeepSeek、Ollama、Gemini 等多个提供商。 这东西适合重度用 Claude Code 的人。 以前是模型牵着你走,现在是你自己给任务分档位。 用得好,一个月 AI 编程成本真能省不少。 链接:
显示更多
【怎么让AI更聪明的完成任务?】 这是一个在AI快速发展的现在,最常遇见的问题。 因为现在AI发展的很快,每个模型都在不停的迭代版本,并且不同的模型都有自己的特性,如何去挑选适合自己需求的模型,如何去调教不同模型的prompt,这会直接决定产品最终呈现效果的优劣。 之前做过好几个AI交易的辅助工具,模型尝试用过GPT、Deepseek、Claude,AI工具用过n8n、小龙虾、骡子,但是最后呈现的效果和自己预期的总是差很多,虽然最后做出来的不错的版本,但是消耗了太多的时间精力和Token,我也在寻求更好的解决方案,直到用了dappos! dappos简单来说,就是:AI 替用户使用 AI,AI学习AI 你不需要再纠结选哪个模型、怎么写 prompt、要不要写 skill,你只需要说一句 简短请求,剩下的交给 xBubble。 其中的核心是Bubble Pilot帮用户去完成任务,取用户的简短请求,识别任务类型,检索匹配的 SOP 并分发到最优路径 Bubble Engine帮你去学习AI,针对特定任务,使用 AI 编程 Agent 生成解决方案变体,构建测试框架,组合候选模型与工具,将最优路径固化为可复用 SOP。 就比如说我想做一个Defi赛道的投资机会速览,同一套提示词,xBubble和豆包生成的图片可以说是天差地别,豆包连文字都是马赛克,而xBubble不仅逻辑清晰还有数据作为支撑,信息的详细程度和豆包不是一个层级上的!只有两个字,好用! 总的来说,你有了dappos,就相当于有了一个AI秘书,直接跟秘书去提需求,秘书会帮你把剩下的流程全部走完,你等着接收汇报就行了! 用dappos,当AI的老板,有事就让秘书干!
显示更多
0
47
31
0
转发到社区
吴说获悉,Vitalik Buterin 更新其本地化 AI 进展,称 DeepSeek V4 已推出可在约 90 GB 显存内运行的 2-bit 量化版本,在 Apple 硬件上速度约为 35 tok/s,AMD 硬件约为 7 tok/s。他表示,真正的“CROPS AI”应支持多种硬件平台,而不仅是“去中心化 AI”。Vitalik 还提出,“CROPS Ethereum access layer”与“CROPS AI”存在交集,例如通过零知识证明实现付费远程 LLM 调用及 Ethereum 私有 RPC 读取,并表示未来应出现更多针对 Ethereum 场景微调的 AI 模型,以提升智能合约与协议代码安全性。
显示更多
Updates since then: * Deepseek v4 is out. There *is* a 2-bit quant that can run within 90 GB ( ), and it works, however it's only fast on Apple hardware (I've head ~35 tok/s). On AMD, it's ~7 tok/s. IMO actually taking the effort to properly support more than one hardware manufacturer is a great example of the difference between mere "decentralized AI" and genuine "CROPS AI". I hope we can become better at this. * also has alpha telegram support now. However, the path to adding your account is quite janky * looks promising as a way to run "dense" models (eg. Qwen 27B) more efficiently. It's janky, but on my 5090 laptop it seems to be ~2x more tok/s than llama.cpp * VoxTerm (local AI recording, no third-party servers) continues to be developed And there's a lot more projects coming on the horizon. One other thing that has been on my mind is that there's actually a lot of intersection between "CROPS ethereum access layer" and "CROPS AI". For example, we want a ZK way to make (paid) calls to remote LLMs. But if we have this, then it's just as useful for solving another problem: private RPC reads in Ethereum. Another example: application-specific finetuned LLMs. Leanstral ( ; I get ~38 tok/s on AMD) fits into < 70 GB, but can hold its own against 1T models on writing Lean code. Things like this are a huge boon for writing more secure code ( ). We should have models finetuned for Ethereum-related use cases as well.
显示更多
0
151
750
90
转发到社区
想在本地跑 Qwen、Llama、DeepSeek,但不确定电脑能不能带得动?🥲 Can I Run AI :一个本地大模型硬件检测网页工具 可以通过浏览器识别 CPU、GPU、内存信息,再匹配不同模型的显存需求、量化方案和运行等级 适合在下载 Ollama / LM Studio / GGUF 模型之前,先判断一下: 8G 显存适合跑什么? Mac 统一内存能不能撑住 14B? 32B 模型是不是已经超出当前设备范围? 不能替代真实跑分,但很适合用来排除明显不合适的模型,少走一些下载完才发现跑不动的弯路
显示更多
当前各AI最新使用评分 GPT 9分,think模式就很好用了,快、准、新。 claude 8.5分,可能是算力不够,偷懒、出错 manus 7.5分 优化不错,但太费钱 kimi 7分 多Agent集群确实不错,但错误很多 豆包 6.5分 能力很弱,但照顾老人小孩情绪… gemini 6分 非常偷懒,可能是在学走豆包路线 GROK 6分 胜在X搜索,但算力多,估计 @elonmusk 后面会发力 千问 6 deepseek 5分 混元 2分 文心一言 1分 如果只能选一个的话,我会推荐gpt,如果claude没有被封的风险,也可以claude作为主力——这两个随时哪边更新一下,就超过另外一个,得分很近。
显示更多
为什么 deepseek 要出自己的 code agent,估计是看不下去了😂。别的 agent 确实很难发挥出他们模型的威力。 比如 claude code 在 deepseek v4 pro 上效果其实很差劲,感觉都在浪费 token和时间🤣
显示更多
0
46
317
13
转发到社区