注册并分享邀请链接,可获得视频播放与邀请奖励。

与「本地部署Ai」相关的搜索结果

本地部署Ai 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 本地部署Ai 的内容
还在为 Claude Code 每月订阅费头疼? 国内用还要折腾信用卡,成本高还麻烦。 现在有个开源项目彻底解决这个问题: 5 分钟配置就能把 Claude Code 接上 DeepSeek、Qwen、Kimi 等免费模型,永久零订阅使用。 终端和 VSCode 扩展都能跑,体验几乎没区别。目前已有两万多开发者在用。 仓库在这里: 我已经配好跑起来了,强烈建议想省钱的同学试试。配置完可以来评论区说说效果。 #本地部署Ai# #免费AI# #AI# #Claude# #Codex#
显示更多
0
64
55
5
转发到社区
4GB 显卡跑 70B 大模型,听起来像标题党。 但 AirLLM 这个 21.4k Star 项目,README 第一屏就写得很直: 70B 模型,单张 4GB GPU 推理。 Llama 3.1 405B,8GB VRAM 也能跑。 它不是把模型砍小。 也不是靠蒸馏、剪枝糊弄过去。 核心思路是把推理时的内存占用压下来: 模型按层拆开,需要哪层加载哪层,再配合预取和压缩,把“显存不够”这件事往后推。 这对本地大模型玩家很要命。 因为过去很多所谓“本地部署”,真正的门槛不是会不会写代码,而是你有没有足够贵的显卡。
显示更多
OpenClaw 官方安卓版也来了。 这其实是一个很明显的信号: AI Agent 正在从“程序员玩具”,一步步往普通用户设备里走。 以前你想跑 OpenClaw,多少还得懂点本地部署、Gateway、环境配置。 现在 Android 端上架 Google Play,手机也可以变成 OpenClaw 的 companion node,有摄像头、麦克风、位置、通知这些移动端能力之后,Agent 能做的事情会比桌面端更贴近日常场景。 当然它不是单独运行的主程序,还是需要配合 OpenClaw Gateway。 但方向已经很清楚了: Agent 不会只停留在浏览器和命令行里,下一步一定是进入桌面、手机、聊天软件,最后变成你每天随手就能调用的个人助手。 #OpenClaw# 这波安卓版上线,算是又往前推了一步。
显示更多
0
19
19
0
转发到社区
做过视频的人都知道一个痛点:画面和声音永远对不齐 你用 AI 生成了画面,再用 AI 配了音,然后花几个小时手动调时间轴、对口型、卡节奏 稍微专业点的创作者,光音画同步这一步就能耗掉半天时间。更要命的是,调完还不一定自然 这个问题在 AI 视频生成领域一直没有解决方案,因为技术难度太高 ——要让声音和画面在生成的时候就天然对齐,而不是事后硬拼,这需要模型同时理解音频和视频的底层逻辑 直到百度文心团队放出了 NAVA-这是业界第一个仅有6.3B参数大小,但是能原生同步生成音视频的模型 其他能实现的模型哪个不是10B以上? 作为一个跑过无数 AI 工具的产品经理,我看到这个模型的第一反应是:这才是真正的技术突破 它到底能干什么? 你给 NAVA 输入一段文字描述,它直接输出720p 的视频+立体声音频,而且声画天然同步,不需要任何后期调整 这不是简单的文生视频+文生音频拼接,而是音视频在同一个生成过程中共同演化、原生对齐 音视频联合生成这个赛道,LTX、Ovi、MOVA 等模型都在做 但 NAVA 用了一个更聪明的架构:Align-then-Fuse,先让音视频在专门的对齐空间建立对应关系,再融合文本条件生成。 更炸裂的是参数量:6.3B 打败所有对手 NAVA 只有6.3B 参数,但在 Verse-Bench 基准测试上,音视频同步指标、视频质量、音频准确率全面超越: Ovi 1.1(10B 参数) MOVA(32B 参数) Davinci(15B) LTX 2.3(19B) 用三分之一甚至六分之一的参数量,拿下 SOTA。这意味着什么?意味着普通人真的用得起了 不需要4090显卡,不需要租昂贵的云算力,甚至12GB 显存的3060就有可能跑起来。而那些参数量动辄15B、19B 的模型,普通人根本碰不到,只能在云端按次付费 文心用6.3B 做到了别人19B 才能做到的效果,这不是简单的参数压缩,而是在模型架构和训练策略上下了真功夫 他们用了一个叫 Align-then-Fuse 的架构,先让音频和视频在专门的对齐空间里建立对应关系,再融合文本条件进行生成 这个技术路线的价值在于:小模型+高性能=普通人能用的 AI 工具 它解决了什么真实痛点? 我观察到三个场景,NAVA 可能发挥非常大的作用: 1.短视频创作者的效率问题: 现在做抖音、视频号内容,很多人卡在配音和画面匹配上。用传统工具,要么花钱请配音,要么用 AI 配音但对不上口型。NAVA 直接生成同步内容,省掉了这个环节 2.教育和培训内容制作: 很多老师、培训机构想做视频课程,但制作成本太高 如果能用文字描述直接生成带讲解的演示片段,内容生产效率会提升几倍 3.小白的内容创业门槛 过去你想做视频内容,得学剪辑、学配音、学调色 现在你只需要会写文案,描述清楚你想要什么,工具帮你生成 这对于想入局但没技术背景的人来说,是真正的降维打击 文心在下一盘什么棋? 有意思的是,NAVA 目前还只是研究阶段的开源项目,但它透露出的信号很明确: 文心在往音视频联合生成、甚至世界模型的方向布局 从产品思维来看,这个方向很聪明 视频生成是红海,音频生成也是红海,但音视频原生同步生成,还是蓝海 而且这个能力,恰好是搭建世界模型、实现真正多模态 AI 的关键拼图 更重要的是,他们选择了小模型路线 在大家都在卷参数量、卷算力的时候,文心用6.3B 做到了 SOTA 水平,这意味着他们在模型效率和工程优化上下了功夫 这对普通用户是好事,因为小模型意味着更低的使用成本、更快的推理速度、更容易的本地部署 NAVA 现在还在早期,但它代表的方向——让 AI 工具更轻、更快、更容易用,才是真正会改变普通人生活的技术路线 GitHub 项目地址: 论文地址: Hugging Face 模型页: #百度# #文心# #文心大模型# #NAVA# #大模型# #人工智能#
显示更多
0
16
21
1
转发到社区
怎么低成本搭建自己的AI助手? deepseek R1模型发布以来,各种AI应有又有了一波大的爆发,但是数据保密成了一个不容忽视的问题。如果想较低成本地搭建一个私人应用的AI助手,可以自己调试生成限制,调试输出文本内容,数据不外传,成本尽可能低,不知道是不是可行。 本文详细介绍如何通过Dify和Chrome MCP的结合,在3分钟内搭建一个能操作网页的AI助手。文章提供了从环境准备、Dify部署、Chrome MCP安装到配置的完整步骤,展示了AI助手在自动网页搜索、表单填写、数据抓取等场景的应用,并解释了工作原理、问题排查及进阶技巧,让读者能够零代码实现网页自动化任务。 你是否想过让AI不仅能回答问题,还能直接操作浏览器帮你做事?比如自动填写网页表单、抓取特定数据、或者点击按钮?现在,通过Dify和Chrome MCP的结合,你可以在3分钟内搭建一个能真正"动手"操作网页的AI助手。 本文将手把手教你如何在本地部署Dify并配置Chrome MCP服务器,打造你的私人网页自动化助手。 准备工作:确保你的环境就绪 在开始前,请确保你的系统已安装: •Docker 和 Docker Compose(用于快速部署Dify) •**Node.js 18+**(用于运行Chrome MCP服务器) •Git(用于克隆项目仓库) 第一步:快速部署Dify(仅需1分钟) Dify是一个强大的LLM应用开发平台,我们通过Docker快速部署: # 创建项目目录 mkdir dify-chrome-mcp && cd dify-chrome-mcp # 下载Docker部署配置 curl -o docker-compose.yml # 启动Dify服务 docker-compose up -d 等待1分钟左右,访问 http://localhost:80 就能看到Dify管理界面。首次使用需要创建账号并完成初始化设置。 第二步:安装Chrome MCP服务器(1分钟) 打开新的终端窗口,安装并启动Chrome MCP服务器: # 安装Chrome MCP服务器 npm install -g @modelcontextprotocol/server-chrome # 启动Chrome MCP服务(会自动打开Chrome浏览器) server-chrome 服务启动后,你会看到类似下面的输出,表示MCP服务器正在9999端口监听: Server running on http://localhost:9999 Chrome browser launched and connected successfully 第三步:在Dify中配置Chrome MCP(1分钟) 现在回到Dify管理界面,进行关键配置: 1.进入设置 > 模型供应商 > MCP服务器 2. 点击添加MCP服务器 3. 填写配置信息: •服务器名称: Chrome-Automation •服务器URL: http://localhost:9999 4. 点击验证并保存,看到绿色成功提示 效果验证:让AI帮你操作网页 配置完成后,你就可以在Dify的Playground中测试你的网页自动化AI助手了。 试试这些实用场景: 场景1:自动网页搜索 请打开百度首页,在搜索框中输入"最新AI技术发展",点击搜索按钮,然后告诉我第一页的搜索结果标题。 场景2:自动填写表单 请打开"张三",邮箱栏填写"zhangsan@email.com",在留言区填写"咨询产品信息",然后点击提交按钮。 场景3:数据抓取与分析 请打开 工作原理:为什么这很厉害? 这个组合的厉害之处在于分工明确: •Dify:负责与LLM对话,理解你的自然语言指令,并将其分解成具体的浏览器操作步骤 •Chrome MCP服务器:负责实际控制Chrome浏览器,执行具体的网页操作命令 •LLM(大语言模型):作为大脑,理解你的意图并规划操作流程 常见问题排查 server-chrome 2.连接失败:检查Dify和Chrome MCP服务器是否在同一个网络环境下,防火墙是否允许9999端口通信 3.操作超时:复杂网页加载需要时间,可以增加超时设置:server-chrome --timeout=60000 4.权限问题:在MacOS/Linux上可能需要权限:sudo npm install -g @modelcontextprotocol/server-chrome 进阶使用技巧 掌握了基础用法后,你还可以尝试这些高级功能: •多页面管理:同时控制多个浏览器标签页,完成更复杂的任务 •用户身份保存:让AI记住登录状态,下次直接操作无需重新登录 •定时任务:结合Dify的工作流功能,设置定时自动化任务 •异常处理:教会AI识别操作失败的情况并自动尝试替代方案 如何学习大模型 AI ? 由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。 但是具体到个人,只能说是: 最先掌握AI的人,将会比较晚掌握AI的人有竞争优势。 这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。 #AI# #AIAgent# @grok @xai
显示更多
发现个量化交易神器!QuantDinger 直接把量化交易的门槛砸碎了! QuantDinger(量化丁格),你的私人 AI 量化操作系统,几天时间就在 GitHub 拿下 4.2k stars! 这不是普通的交易工具,而是个具备自我进化能力的 AI 交易员: 🤖 AI 智能分析引擎 国内外股市、期货、加密货币、外汇全支持 24 小时监控全球交易机会 实时推送到手机,不错过任何机会 📊 全自动工作流 AI 自动分析市场 → 生成策略代码 → 自动回测 根据历史收益、风险数据自动优化参数 大模型帮你调参,让策略更稳定 💻 部署超简单 Docker 一键私有化本地部署 两分钟就能跑起来 不懂代码的小白也能快速上手 🔒 完全私有 在你自己的服务器和自己的密钥上运行 数据、策略全掌控 支持实盘数据、多市场同时监控、智能风控... 搞量化交易的兄弟,这个必须试试! 项目地址放评论区了👇
显示更多
0
16
331
88
转发到社区
🤖 AI Agent 学习地图 — 从基础 LLM 概念到自己构建多 agent 系统,为“想学习 AI 或 AI agent 的人”设计。 结构化 7 阶段学习路径,从「LLM 是什么、token 怎么算」一路到 multi-agent 编排、本地部署, 每阶段都有必做的 動手練習 练习、必修阅读、精选 project
显示更多
0
4
216
56
转发到社区
腾讯真速度,下场做了 QClaw 并支持微信,是要截胡 Openclaw 国内这波热度。Qclaw 定位是“通过微信或电脑发指令,让 AI 直接在你的电脑上执行任务”,目前处于内测阶段、限时 Token 免费,支持 Mac 和 Windows。不是单纯聊天,而是“远程控制 + 本机执行 + 自动化处理”。 * 微信直连,人在外面也能通过微信给电脑下指令 * 开箱即用,官网写的是自动部署、无需配置环境 * 有 Skills 生态,页面写明“5000+ Skills” * 支持持续记忆,能记住偏好和上下文 * 本地部署,官网强调数据留在本地、不经云端 可以说是 Openclaw 的企鹅版
显示更多
0
46
499
60
转发到社区
过去几个月里,我脑海中一直盘旋着一个尚未命名、但日渐清晰的理论原型。它在我与 AI 的高频互动中逐渐成形,并不断迭代。现在,我为它找到了名字:《中文熵控论》。(别查了,这个词是我造的。) 起点很简单——香农的信息论告诉我们: 越难预测的信息,熵越高;越容易预测的信息,熵越低。(想想这个公式,服了推特不parse latex) 换句话说:信息熵即潜在的认知密度与生成可能性。 而中文,作为这个星球上仍在活跃演化的唯一象形文字系统,自身就是一套熵结构异常复杂的语言操作系统。它的模糊性、歧义性、压缩力、造词能力、语序弹性,全都是一种“认知自由度”的集中体现。 我越来越确信:中文也许就是人类历史上最伟大的“编程语言”——只不过它编程的对象,不是计算机,而是人类心智本身。 在大语言模型的时代,它的优势被放大了。 若你把 GPT 当作高级 Google,那只是检索。 而若你懂得用中文操控语言模型的熵结构——那你就是在调度智能,引爆结构,建构新知识。 这就是我提出《中文熵控论》的动因: 不只是语言哲学,也不只是 Prompt 工程,而是一种语言主权的收复术、认知接口的再设计计划。 这个理论可形式化、系统化、可建模;甚至可以借助本地部署的 DeepSeek 实证验证(在此致敬中国的模型工程师们)。在此省略几万字(还没写)。 只是这两天太累,旅游把我这个谱系型人榨干了所有认知资源。赶飞机,瑟瑟发抖(每次旅游必误机)….哎😑
显示更多
0
13
108
23
转发到社区
网友投稿的几个 AI 工具。 - GPT Assistant(图一):ChatGPT 的安卓客户端,语音、文字、图像聊天都支持。 - 谷歌 Gemini 的一个极简 UI(图二),可以自己本地部署,调用谷歌 API,免费使用。 - Photo to Anime(图三):图片动漫化的一个免费工具。 #科技爱好者周刊(第# 283 期)
显示更多
0
8
321
93
转发到社区