搜索 RAG 相关的推文与用户

2026.05.29 02:26

AI时代，真的「只要你学得够慢，你就不用学了」吗？最近网络上有个说法还挺火的「AI时代，只要你学得够慢，你就不用学了。」我第一反应是，这话听起来很有道理。我想起自己两年前熬夜学LoRA微调，想着可以用来模仿我的写作风格，然而skills出来了，发现效果可能还比我训的LoRA更好。所以「等」赢了？「学得慢」赢了？如果你只是一个普通的AI用户，那这句话可能没错。但如果你不甘于只当个「时代喂你啥你就吃啥」的被动者，你想主动把握AI行业发展的脉络，你就不能等。我仔细想了想，我感觉不是这样的，我想分享下自己的看法。「等」赢了，但不是因为等 LoRA的故事是真的，类似的情况我遇到过不止一次。两年追热点下来，确实有不少「当年要做没做，后来发现不用做了」的案例。但有个问题值得反问自己：你知道LoRA是什么、你知道skills出现了、你知道两者可以做横向对比，这个判断力是哪来的？不是从「等」里来的。是从两年每天追热点的积累里来的。因为很多人把「某件具体的事没做」等同于「不用学习」，这两件事完全不在同一个维度上。你「等」到了更好的方案，是因为你有足够的背景知识认出了它。一个完全不了解这个领域的人，他的「没做」只是「不知道」，不是「有判断力的等待」。工具层可以等，认知层不能等我2016年开始做机器学习和深度学习，做了好几年数据科学家。到了大模型时代，周围的人都在聊LLM，我一度觉得当年学的那套东西废了。 sklearn怎么调、XGBoost怎么训，这部分确实边缘化了，我不否认。但我后来发现，真正值钱的东西没废：怎么设计评估体系、怎么防止数据泄露、怎么把一个业务问题转化成模型问题。这些判断力，大模型时代反而更稀缺（因为99%的「AI应用开发者」根本没有这个训练，看到模型输出「看起来对」就交付了）。工具层的东西，半衰期确实很短，可能18个月就轮换一批。这部分确实可以「等等看」，等生态稳定了再下场，往往比头一批踩坑的人省力。认知层的东西，没有捷径，也没有办法「等别人替你建立」。你在等的时候，别人在建立判断力的坐标系，你进来以后只能接受别人嚼过的知识，创造空间已经被占了。比AI工具本身更有价值的追了两年热点，我发现有一件事比「学到了什么具体技能」更值钱，那就是，我比周围大多数人更能「春江水暖鸭先知」。某个技术出来，我大概知道它处在哪个演化节点，是真风口还是炒作，值得深入还是等等就过了。但我一度很困惑，这种「看清楚行业方向」的能力，对我一个打工人有啥用？又不是创业者也不是投资人，判断对了趋势，我也只是回去开早会。这个落差是真实存在的，不想粉饰。但仔细想，这个能力其实在影响三件事：第一，在组织里的位置。大多数团队里，「知道该做什么」比「把事做完」稀缺得多。能帮团队过滤噪音、判断方向的人，话语权不一样。第二，选雇主的质量。能判断一家公司的技术方向是不是真的对，让你在上升期公司和下沉期公司之间选对的概率高很多。这个差距，可能比一次跳槽涨薪重要得多。第三，这个认知要是有地方输出，是可以变现的。其实就是把「春江水暖」的判断力转成内容，内容建立影响力，影响力长期会带来预料不到的机会。所以「只要你学得够慢，你就不用学了」，这话对不对？我的观点是：对了一半，但被大多数人用来当借口的那一半，恰好是错的那半。工具层，确实可以等，工具肯定越来越先进，越来越好用，「等等党」在执行层有合理性。而且在AI时代，这句话本意其实是在说，不要因为错过一个热点而着急，不用FOMO，在AI时代，应该少点焦虑。但是认知层面，并不会因为你用过的某个AI工具过期了而没学到东西。你追热点的过程看起来很多东西「白学了」，但那个过程本身在建立一张地图，这张地图才是真正的资产。把「某些工具不用学」误读成「可以少学、慢学、躺着等」，两年后你会发现，你确实等到了更好的工具，但差距在于，人家积极学习的，拿到新工具是真的能做出新东西，等等党拿到新工具，也就是跑个demo自嗨一下，感觉自己站在了时代前沿，实际上还在原地。而且还有一个时间差的问题值得说。新工具出来之前，积极的人早就在用当时条件下能用的东西硬拼出来了。RAG还很粗糙的时候，他们已经在生产环境里跑起来了，踩完了坑，知道哪里会出问题。Agent框架还不稳定的时候，他们已经用LangChain拼出了第一版，虽然屎山，但用户在用、反馈在收、迭代在跑。等等党在等什么？等一个「更成熟的方案」。方案成熟了，他们入场，发现已经是红海。不是因为他们来晚了几个月，是因为那几个月里，积极的人已经建立了用户认知、跑通了商业模式、或者单纯地把某个领域的坑全踩完了，护城河就这么起来的。更关键的是，这种「拥抱新技术」的习惯本身会复利。积极的人用惯了在局限条件下想办法，新工具一出来，他们比任何人都先知道怎么用好它。等等党等到了新工具，还是原来那个姿势，demo跑一跑，然后继续等下一个。 #AI# #AIAgent# @grok @xai

显示更多

0

6

3

0

转发到社区

勝田里奈@rinakatsuta_

2026.05.28 13:20

5/31(日)23:59まで送料無料キャンペーン開催中〜🐇🍃🌷 ともに残りわずかの2型👖 デニムは身長160cmでSizeMを着用しています☺️ Raglan denim blouson Washed wide denim

显示更多

0

91

22

转发到社区

一枝独秀SJ/苏静@sujing110

2026.05.28 11:47

澳洲有个raging bull cream，通过涂抹会增加充血量，从而达到增大的效果。当然这个只是使用一段时间后能达成的，效果远不如手术来的好。

显示更多

0

1

0

转发到社区

链研社｜AI First🔶💧@lianyanshe

2026.05.28 10:07

最近大模型更新的隐式缓存为什么可以把缓存价格降低，命中率大大提高。传统推理里，你每调一次API，GPU都得把整个输入prompt重新算一遍。固定System Prompt、历史对话、RAG知识库，这些重复内容每次都重新预填充，按全价收费。隐式缓存做了什么？它自动检测本次输入和之前请求的公共前缀。命中了，就把之前算好的KV Cache从SSD硬盘直接加载出来，只对新增部分重新计算。重复劳动，直接砍掉。效果立竿见影。多轮对话、Agent、代码补全这类场景，重复前缀往往占输入Token的70%-90%。命中后，input价格直接打到一折。对长文本多次对话的推理的成本和内存的压力都大大降低。但这里有个关键问题：之前为什么不行？ KV Cache太大了。传统Multi-Head Attention架构下，百万Token的KV可能要上百GB显存。存盘？I/O延迟完全没法接受。GPU必须全程Hold住所有KV，成本根本降不下来。 DeepSeek的MLA架构把KV Cache压缩了10-28倍。百万Token从80-200GB变成4-10GB。这才让硬盘级缓存成为可能，压缩后的KV可以经济地落盘到分布式SSD，需要时再快速加载。本质上，是把最贵的GPU显存从按最大上下文全量占用变成了按实际新增Token动态使用，类似动态更新的模式。这里有个反直觉的点：虽然对高速内存需求大幅下降，但并不是完全转向硬盘。更像是分层存储，GPU只保留热数据，冷前缀卸载到SSD。类似CPU的分页机制，只是这次发生在大模型推理层。 DeepSeek率先把这套机制默认开启，给出极致低价。其他厂商不得不跟进，竞争驱动技术扩散，技术扩散又进一步压低价格。要想最大化缓存命中需要做什么？想最大化省钱，把重复内容尽量放在prompt开头，保持前缀一致性，命中率会更高。API响应里有prompt_cache_hit_tokens字段，直接看命中率。这轮降价潮是真实的架构创新，算法效率优化带来的成本下降。MLA压缩KV、分布式SSD存储、Radix-Tree前缀索引，这些工程突破把原来需要重复劳动浪费的算力，优化到极致尤其是 DeepSeek，降价这么多还能赚钱，还是永久降价，这是真本事，那之前的原价是耍我们玩得吗，第一天用原价 API 的人是有点冤大头了。

显示更多

0

转发到社区

เว็บสล็อต เว็บตรง@janoeruby

2026.05.28 01:36

♨️#สล็อต# เว็บสล็อต Api เเท้♨️ 🔴สล็อตเว็บตรง แตกง่าย ไม่มีล็อคยูส🔴 🔥ทุuหลักร้oย กำไsหลักหมื่u ต้องที่นี่🔥 📲สมัครเลย👉 💦ฝากแรกรับเครดิตฟรี50%💦 ✍️LlNE👉 @xa77 มี@ด้วยนะคะ 🍒สล็อต🍒เว็บตรง🍒ปั่นสล็อต🍒สล็อตเกมส์🍒 18 vidoes 🔞

显示更多

0

7

转发到社区

董小姐@xue55888

2026.05.25 07:52

GitHub 上一个 7.4w star 的项目，最近刷屏了。项目名字叫 generative-ai-for-beginners，是微软官方推出的生成式 AI 入门课程。我本来以为又是那种“看起来很全、实际全是概念”的合集，结果点进去看了两节，直接被惊艳到。这不是东拼西凑的博客整理，而是真正按照「怎么一步步做出 AI 应用」的逻辑来设计的课程体系。它从 Prompt Engineering 开始教你怎么和模型高效对话、如何精准控制输出；然后自然过渡到 RAG、向量数据库、Fine-tuning、AI Agent、安全等内容。顺序特别重要。很多人学 AI 最大的痛苦不是学不会，而是一上来就被 RAG、MCP、Function Calling、Agent、LoRA 等一堆名词砸懵，完全不知道该先学什么、整个链路怎么串起来。这个课程最牛的地方就在于，它把「为什么先学这个，后学那个」讲得特别清楚，每一节都有明确的 Learning Goals，不会让你学着学着就迷路。更关键的是——它极度注重实操。几乎每节都配了 Jupyter Notebook，打开就能跑。你改几个 Prompt，调一下 temperature、top_p，模型输出立刻变化；RAG 那部分更是手把手带你： • 如何切分本地文档 • 如何生成 Embedding • 如何存入向量数据库 • 如何检索 + 喂给模型生成答案后面 Fine-tuning 讲 LoRA 轻量微调，Agent 部分演示模型如何调用工具完成多步任务。刷到后面你会突然明白：现在市面上很多 AI 产品，本质上就是把这些模块聪明地拼在一起而已。最离谱的是，这套课程完全免费，还有中文翻译。现在很多人一想学 AI，第一反应就是去报各种付费课。但很多付费课其实也是把官方文档换个说法重新讲一遍。而微软自己做的这套体系化内容，反而更适合想真正从零构建知识框架的人。我的建议是：如果你想系统地学生成式 AI，与其每天刷碎片信息、被各种新名词牵着鼻子走，不如直接把这个仓库从头过一遍。至少你脑子里会先有一张清晰的地图。仓库地址：强烈推荐给正在学 AI 的朋友

显示更多

0

6

0

转发到社区

Geek@geekbb

2026.05.23 11:26

开源 AI 股票研究代理系统，提供证据溯源报告、工作流编排和 RAG 评估能力。FinSight 把公告、财报、研究笔记、市场数据转成有证据支撑的回答和版本化的研究报告。

显示更多

0

转发到社区

Leo Xiang@leeoxiang

2026.05.22 09:13

之前招后台的研发的实习生项目都是秒杀、电商。如今招 AI Agent 开发的实习生项目都是 Langchain + Rag。话说 X 上有想找 AI Agent 开发实习生方向的工作的不？我这里在招实习生。

显示更多

0

5

20

1

转发到社区

Josef@Slither2006

2026.05.21 09:06

The Boys finale successfully rage baited Elon Musk and pissed off all the incels who loved the show/worshipped Homalander, all while the official The Boys twitter account is making Charlie Kirk jokes. This is the best send off the show could have ever gotten, it’s beautiful

显示更多

0

205

45K

5.1K

转发到社区

Bill The Investor@billtheinvestor

2026.05.21 01:31

LLM-Wiki 正在终结低效的 RAG 检索模式。传统的 RAG 每次提问都要重新检索，本质上是在碎片化地“翻书”，无法形成深度的知识沉淀。LLM-Wiki 的核心逻辑是“增量构建”：它让 AI像人类整理百科全书一样，将新知识编译进一个结构化的 Wiki 体系中。这意味着你的知识库不再是散乱的文档集合，而是一个会随着输入持续进化的有机体。目前该项目在 GitHub 上已获得 2800+ Star，是构建深度知识资产的理想方案。项目地址：

显示更多

0

1

0

转发到社区

与「RAG」相关的搜索结果