注册并分享邀请链接,可获得视频播放与邀请奖励。

与「RAG」相关的搜索结果

RAG 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 RAG 的内容
AI时代,真的「只要你学得够慢,你就不用学了」吗? 最近网络上有个说法还挺火的 「AI时代,只要你学得够慢,你就不用学了。」 我第一反应是,这话听起来很有道理。 我想起自己两年前熬夜学LoRA微调,想着可以用来模仿我的写作风格,然而skills出来了,发现效果可能还比我训的LoRA更好。 所以「等」赢了?「学得慢」赢了? 如果你只是一个普通的AI用户,那这句话可能没错。但如果你不甘于只当个「时代喂你啥你就吃啥」的被动者,你想主动把握AI行业发展的脉络,你就不能等。 我仔细想了想,我感觉不是这样的,我想分享下自己的看法。 「等」赢了,但不是因为等 LoRA的故事是真的,类似的情况我遇到过不止一次。两年追热点下来,确实有不少「当年要做没做,后来发现不用做了」的案例。 但有个问题值得反问自己:你知道LoRA是什么、你知道skills出现了、你知道两者可以做横向对比,这个判断力是哪来的? 不是从「等」里来的。 是从两年每天追热点的积累里来的。 因为很多人把「某件具体的事没做」等同于「不用学习」,这两件事完全不在同一个维度上。你「等」到了更好的方案,是因为你有足够的背景知识认出了它。一个完全不了解这个领域的人,他的「没做」只是「不知道」,不是「有判断力的等待」。 工具层可以等,认知层不能等 我2016年开始做机器学习和深度学习,做了好几年数据科学家。到了大模型时代,周围的人都在聊LLM,我一度觉得当年学的那套东西废了。 sklearn怎么调、XGBoost怎么训,这部分确实边缘化了,我不否认。 但我后来发现,真正值钱的东西没废:怎么设计评估体系、怎么防止数据泄露、怎么把一个业务问题转化成模型问题。这些判断力,大模型时代反而更稀缺(因为99%的「AI应用开发者」根本没有这个训练,看到模型输出「看起来对」就交付了)。 工具层的东西,半衰期确实很短,可能18个月就轮换一批。这部分确实可以「等等看」,等生态稳定了再下场,往往比头一批踩坑的人省力。 认知层的东西,没有捷径,也没有办法「等别人替你建立」。你在等的时候,别人在建立判断力的坐标系,你进来以后只能接受别人嚼过的知识,创造空间已经被占了。 比AI工具本身更有价值的 追了两年热点,我发现有一件事比「学到了什么具体技能」更值钱,那就是,我比周围大多数人更能「春江水暖鸭先知」。 某个技术出来,我大概知道它处在哪个演化节点,是真风口还是炒作,值得深入还是等等就过了。 但我一度很困惑,这种「看清楚行业方向」的能力,对我一个打工人有啥用?又不是创业者也不是投资人,判断对了趋势,我也只是回去开早会。 这个落差是真实存在的,不想粉饰。 但仔细想,这个能力其实在影响三件事: 第一,在组织里的位置。大多数团队里,「知道该做什么」比「把事做完」稀缺得多。能帮团队过滤噪音、判断方向的人,话语权不一样。 第二,选雇主的质量。能判断一家公司的技术方向是不是真的对,让你在上升期公司和下沉期公司之间选对的概率高很多。这个差距,可能比一次跳槽涨薪重要得多。 第三,这个认知要是有地方输出,是可以变现的。其实就是把「春江水暖」的判断力转成内容,内容建立影响力,影响力长期会带来预料不到的机会。 所以「只要你学得够慢,你就不用学了」,这话对不对? 我的观点是:对了一半,但被大多数人用来当借口的那一半,恰好是错的那半。 工具层,确实可以等,工具肯定越来越先进,越来越好用,「等等党」在执行层有合理性。 而且在AI时代,这句话本意其实是在说,不要因为错过一个热点而着急,不用FOMO,在AI时代,应该少点焦虑。 但是认知层面,并不会因为你用过的某个AI工具过期了而没学到东西。你追热点的过程看起来很多东西「白学了」,但那个过程本身在建立一张地图,这张地图才是真正的资产。 把「某些工具不用学」误读成「可以少学、慢学、躺着等」,两年后你会发现,你确实等到了更好的工具,但差距在于,人家积极学习的,拿到新工具是真的能做出新东西,等等党拿到新工具,也就是跑个demo自嗨一下,感觉自己站在了时代前沿,实际上还在原地。 而且还有一个时间差的问题值得说。 新工具出来之前,积极的人早就在用当时条件下能用的东西硬拼出来了。RAG还很粗糙的时候,他们已经在生产环境里跑起来了,踩完了坑,知道哪里会出问题。Agent框架还不稳定的时候,他们已经用LangChain拼出了第一版,虽然屎山,但用户在用、反馈在收、迭代在跑。 等等党在等什么?等一个「更成熟的方案」。方案成熟了,他们入场,发现已经是红海。不是因为他们来晚了几个月,是因为那几个月里,积极的人已经建立了用户认知、跑通了商业模式、或者单纯地把某个领域的坑全踩完了,护城河就这么起来的。 更关键的是,这种「拥抱新技术」的习惯本身会复利。积极的人用惯了在局限条件下想办法,新工具一出来,他们比任何人都先知道怎么用好它。等等党等到了新工具,还是原来那个姿势,demo跑一跑,然后继续等下一个。 #AI# #AIAgent# @grok @xai
显示更多
5/31(日)23:59まで送料無料キャンペーン開催中〜🐇🍃🌷 ともに残りわずかの2型👖 デニムは身長160cmでSizeMを着用しています☺️ Raglan denim blouson Washed wide denim
显示更多
0
0
91
22
转发到社区
澳洲有个raging bull cream,通过涂抹会增加充血量,从而达到增大的效果。当然这个只是使用一段时间后能达成的,效果远不如手术来的好。
显示更多
最近大模型更新的隐式缓存为什么可以把缓存价格降低,命中率大大提高。 传统推理里,你每调一次API,GPU都得把整个输入prompt重新算一遍。固定System Prompt、历史对话、RAG知识库,这些重复内容每次都重新预填充,按全价收费。 隐式缓存做了什么? 它自动检测本次输入和之前请求的公共前缀。命中了,就把之前算好的KV Cache从SSD硬盘直接加载出来,只对新增部分重新计算。重复劳动,直接砍掉。 效果立竿见影。多轮对话、Agent、代码补全这类场景,重复前缀往往占输入Token的70%-90%。命中后,input价格直接打到一折。对长文本多次对话的推理的成本和内存的压力都大大降低。 但这里有个关键问题:之前为什么不行? KV Cache太大了。传统Multi-Head Attention架构下,百万Token的KV可能要上百GB显存。存盘?I/O延迟完全没法接受。GPU必须全程Hold住所有KV,成本根本降不下来。 DeepSeek的MLA架构把KV Cache压缩了10-28倍。百万Token从80-200GB变成4-10GB。这才让硬盘级缓存成为可能,压缩后的KV可以经济地落盘到分布式SSD,需要时再快速加载。 本质上,是把最贵的GPU显存从按最大上下文全量占用变成了按实际新增Token动态使用,类似动态更新的模式。 这里有个反直觉的点:虽然对高速内存需求大幅下降,但并不是完全转向硬盘。更像是分层存储,GPU只保留热数据,冷前缀卸载到SSD。类似CPU的分页机制,只是这次发生在大模型推理层。 DeepSeek率先把这套机制默认开启,给出极致低价。其他厂商不得不跟进,竞争驱动技术扩散,技术扩散又进一步压低价格。 要想最大化缓存命中需要做什么? 想最大化省钱,把重复内容尽量放在prompt开头,保持前缀一致性,命中率会更高。API响应里有prompt_cache_hit_tokens字段,直接看命中率。 这轮降价潮是真实的架构创新,算法效率优化带来的成本下降。MLA压缩KV、分布式SSD存储、Radix-Tree前缀索引,这些工程突破把原来需要重复劳动浪费的算力,优化到极致 尤其是 DeepSeek,降价这么多还能赚钱,还是永久降价,这是真本事,那之前的原价是耍我们玩得吗,第一天用原价 API 的人是有点冤大头了。
显示更多
♨️#สล็อต# เว็บสล็อต Api เเท้♨️ 🔴สล็อตเว็บตรง แตกง่าย ไม่มีล็อคยูส🔴 🔥ทุuหลักร้oย กำไsหลักหมื่u ต้องที่นี่🔥 📲สมัครเลย👉 💦ฝากแรกรับเครดิตฟรี50%💦 ✍️LlNE👉 @xa77 มี@ด้วยนะคะ 🍒สล็อต🍒เว็บตรง🍒ปั่นสล็อต🍒สล็อตเกมส์🍒 18 vidoes 🔞
显示更多
GitHub 上一个 7.4w star 的项目,最近刷屏了。 项目名字叫 generative-ai-for-beginners,是微软官方推出的生成式 AI 入门课程。 我本来以为又是那种“看起来很全、实际全是概念”的合集,结果点进去看了两节,直接被惊艳到。 这不是东拼西凑的博客整理,而是真正按照 「怎么一步步做出 AI 应用」 的逻辑来设计的课程体系。 它从 Prompt Engineering 开始教你怎么和模型高效对话、如何精准控制输出;然后自然过渡到 RAG、向量数据库、Fine-tuning、AI Agent、安全等内容。 顺序特别重要。 很多人学 AI 最大的痛苦不是学不会,而是一上来就被 RAG、MCP、Function Calling、Agent、LoRA 等一堆名词砸懵,完全不知道该先学什么、整个链路怎么串起来。 这个课程最牛的地方就在于,它把「为什么先学这个,后学那个」讲得特别清楚,每一节都有明确的 Learning Goals,不会让你学着学着就迷路。 更关键的是——它极度注重实操。 几乎每节都配了 Jupyter Notebook,打开就能跑。你改几个 Prompt,调一下 temperature、top_p,模型输出立刻变化;RAG 那部分更是手把手带你: • 如何切分本地文档 • 如何生成 Embedding • 如何存入向量数据库 • 如何检索 + 喂给模型生成答案 后面 Fine-tuning 讲 LoRA 轻量微调,Agent 部分演示模型如何调用工具完成多步任务。 刷到后面你会突然明白:现在市面上很多 AI 产品,本质上就是把这些模块聪明地拼在一起而已。 最离谱的是,这套课程完全免费,还有中文翻译。 现在很多人一想学 AI,第一反应就是去报各种付费课。但很多付费课其实也是把官方文档换个说法重新讲一遍。 而微软自己做的这套体系化内容,反而更适合想真正从零构建知识框架的人。 我的建议是: 如果你想系统地学生成式 AI,与其每天刷碎片信息、被各种新名词牵着鼻子走,不如直接把这个仓库从头过一遍。 至少你脑子里会先有一张清晰的地图。 仓库地址: 强烈推荐给正在学 AI 的朋友
显示更多
开源 AI 股票研究代理系统,提供证据溯源报告、工作流编排和 RAG 评估能力。FinSight 把公告、财报、研究笔记、市场数据转成有证据支撑的回答和版本化的研究报告。
显示更多
之前招后台的研发的实习生项目都是 秒杀、电商。如今招 AI Agent 开发的实习生项目都是 Langchain + Rag。 话说 X 上有想找 AI Agent 开发实习生方向的工作的不? 我这里在招实习生。
显示更多
The Boys finale successfully rage baited Elon Musk and pissed off all the incels who loved the show/worshipped Homalander, all while the official The Boys twitter account is making Charlie Kirk jokes. This is the best send off the show could have ever gotten, it’s beautiful
显示更多
0
205
45K
5.1K
转发到社区
LLM-Wiki 正在终结低效的 RAG 检索模式。 传统的 RAG 每次提问都要重新检索,本质上是在碎片化地“翻书”,无法形成深度的知识沉淀。LLM-Wiki 的核心逻辑是“增量构建”:它让 AI像人类整理百科全书一样,将新知识编译进一个结构化的 Wiki 体系中。 这意味着你的知识库不再是散乱的文档集合,而是一个会随着输入持续进化的有机体。目前该项目在 GitHub 上已获得 2800+ Star,是构建深度知识资产的理想方案。 项目地址:
显示更多