注册并分享邀请链接,可获得视频播放与邀请奖励。

与「LLM」相关的搜索结果

LLM 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 LLM 的内容
目前存储市场正是烈火烹油的热闹景象,科技巨头们的长期订单似乎让存储摆脱了之前“猪周期”的尴尬局面,其高昂的成本正在被云基础设施提供者和大语言模型服务商吸收。 今年以来,美光科技和 SK 海力士的股价以美元计均上涨了约 290%,三星电子上涨了 166%,而微软和 Meta 等所谓的超大规模云服务提供商股价下跌,亚马逊股价持平, Alphabet 股价仅上涨了 8%。 面对存储涨价,按照经济规律,未来会如何发展呢? 1. 将成本转移给消费者,如苹果做的那样。但人工智能还处在消费者普及和争夺市场份额的阶段,没有人有苹果那样的护城河。而且随着科技公司限制员工token使用量,市场的增速可能开始放缓,除非能渗透到制造业。这条路大概率行不通。 2.牺牲利润,扩大亏损。也就是行业目前的状态,但能维持多久?投资者的耐心有多久?会出现破坏性创新颠覆目前的僵局吗?如果LLM路线被证明只是人工智能发展历程上的一段弯路,又会如何呢? 3. 提高效率以减少需求。如同谷歌在今年3月发布TurboQuant算法,将大模型运行时的键值缓存(KV Cache)内存占用减少至少6倍,让全球主要内存巨头在单日蒸发900亿美元市值。类似谷歌这样的技术引领者是否还有这样的“黑科技”? 4. 等待更多存储的供应。苹果已经在游说美国政府放宽对中国存储的管制,若能成行将给现有消费级存储市场带来巨大冲击,并对企业级存储市场带来一定压力,HBM和AI存储市场短期没有影响。目前来看也还好。 我的投资策略: 1. 持续买入谷歌这样在泛人工智能领域有多年技术积累且现金流稳健的公司; 2. 逢低买入微软亚马逊这样的云基础服务供应商; 3. 观望存储巨头和LLM技术路线的公司。 大家觉得呢? #羊羊学理财# #存储# #AI#
显示更多
Fine-tuning massive LLMs used to be painfully slow, but not anymore! 4 open source libraries that accelerate fine-tuning of Large Language Models 1. Unsloth AI • Fine-tune models like Qwen3, Llama 4, and Gemma 3 up to 2× faster with 70% less VRAM • Uses optimized Triton kernels and manual backprop for exact accuracy • Supports low-resource setups and runs on consumer GPUs or even Colab/Kaggle with ~3 GB VRAM GitHub repo → 2. LLaMA Factory • Fine-tune over 100 models (LLaMA, Mistral, Gemma, etc.) using a simple CLI or WebUI • Supports LoRA, QLoRA, full or frozen fine-tuning across 2–8‑bit precision • Includes built-in dataset templates, training monitors, and model export options GitHub repo → 3. DeepSpeed • Built for large-scale distributed fine-tuning with ZeRO and FSDP • Optimized for multi-GPU and multi-node training with advanced memory management • Trusted in production environments for scalable LLM training GitHub repo → 4. Axolotl • Yaml-based setup for fine-tuning, LoRA/QLoRA, DPO, GRPO, and multimodal workflows • Includes kernel optimizations for memory-efficient training • Actively maintained with support for Hugging Face, model export, and inference GitHub repo →
显示更多
别再用单体 AI 跑股票量化交易了! 大模型做股票交易最大的弱点:不是幻觉,就是无法应对高频变盘的单向思维风暴。 分享一个真正懂金融行为学的硬核 GitHub 开源项目 —— TradingAgents-CN 它专为股票分析设计,核心逻辑极其优雅:用多智能体社会学模拟,把单 LLM 的交易偏见彻底干碎! 核心杀手锏: 多角色盘前模拟辩论:框架内由宏观分析师、技术交易员、风控官等多个 Agent 角色组成。在系统内展开多轮激烈辩论,通过交叉验证寻找更稳妥的决策点。 全链路金融行为学模拟:从宏观新闻感知、盘前技术面交叉对齐,到模拟盘中的动态仓位控制,完美还原专业投资机构的决策工作流。 中文本地化与回测支持:无缝对接 A股、港股、美股 等核心市场的数据与交易逻辑,而且完美适配 Claude、ChatGPT (OpenAI) 以及国内主流大模型底层。 一站式回测支持:内置高频交易环境模拟与标准量化指标评估,直接输出带思维链(CoT)的决策报告。 感兴趣的可以看看~dyor~ 地址:
显示更多
0
45
120
29
转发到社区
Cursor / Codex / Claude Code 用户,这个仓库能帮你快速配好免费模型! open-free-llm-api/awesome-freellm-apis 它把各种免费 LLM API 的信息整理成一张清晰的表,省去了自己到处翻找的麻烦。 平时想找免费模型用,得一个 provider 一个 provider 去搜,注册账号,查有没有免费额度,要不要绑信用卡,找 base URL、model ID,还得看 rate limit,最后手动配到 Cursor、Codex、Claude Code 这些工具上。挺折腾的。 这个仓库直接把这些全整理好了: 哪些 provider 有免费 tier,像 Groq、Gemini、NVIDIA NIM、Mistral、Cohere、Hugging Face、OpenRouter 这些,都列得明明白白。 哪些不用绑信用卡,个人开发者用着更省心。 每个模型的 context window 和 rate limit 也写清楚了,能快速判断适合短任务、长文档、代码生成还是批量测试。 每个 provider 的 base URL 和 API Key 获取方式,都写得清清楚楚,直接告诉你怎么接。 还针对 Cursor、Codex、Claude Code、Aider 这些 AI Coding 工具,准备了对应的配置方法。 用这个仓库,就是把免费模型当成一个模型池来用。简单的事情,比如代码解释、README 总结、写测试用例、打 prompt 草稿、生成小工具,交给免费模型处理。真正重要的活儿,像架构设计、复杂重构、安全审查、生产级代码决策,还是留给主力模型。 这样一来,AI Coding 的整体成本就能明显降下来。 当然,免费 API 到底还是有局限的。rate limit 会变,模型可能突然下架,tool calling 也未必稳定。别把私有代码、API Key、数据库结构、客户数据这些敏感信息往免费 provider 扔。 我把它定位成 AI Coding 的低成本实验层,适合平时试东西、跑简单任务。如果你正在用 Cursor、Codex、Claude Code 这些工具,这个仓库值得收藏。 它帮你省下的,主要是你在几十个 provider 文档里反复搜索、注册、试错的时间!
显示更多
刚刚在 Chat 垃圾箱翻到一封邮件,做 llm api 中转站的,咨询合作。 好奇点进网站,首页赫然写着「Claude Fable 5」,第一反应是它们可能曾经接过,后来下架后没调。 手贱我用他们给的邀请码注册了,让 Codex 跑一下 Fable 5 的调用,居然通了 😂 这。。到底是背景太硬,还是嘴太硬。。
显示更多
How to keep AI spend flat while token usage grows exponentially: Not with friction and spend alerts. With better defaults, routing, and caching. Better Defaults (not Usage Caps) – Engineers can choose any model they want, but defaults matter. We’re experimenting with defaulting to open weight models like GLM 5.2 and Kimi 2.7 through our LLM gateway, while still encouraging engineers to choose the right model for the task. 91% of our employees were never hitting their usage caps, so instead of lowering caps and driving up alerts, we're moving to cheaper defaults. Note that code reviews use a diversity of models, so they can check each other's work. Better Routing – In our custom harnesses, we preprocess prompts and route to the best model for the job, considering cache hits and model pricing. For instance, you may want a frontier model for planning, but not for execution where they can be overkill. Ultimately, humans shouldn't be choosing models - AI can automate this task. Better Caching – Cache misses are the easiest way to drive your cost up. All of our requests are cache aware, so we’re reusing a warm cache wherever possible. For example, our cache hit rate went from 5% → 60% in LibreChat once properly implemented. Keep Context Lean – Start fresh sessions when switching tasks. Scope file context narrowly. Disconnect unused tools. Don't just compact. The goal isn't fewer tokens used, it's fewer tokens wasted. Better Visibility – Our engineers can use as many tokens as they want, from whatever model they want, but we’ve made usage visible – and the more you spend on AI, the more impact we expect. The goal isn't to suppress usage. It's to build the infrastructure that makes exponential growth sustainable. Putting this into practice has cut our AI spend nearly in half, while our token usage continues to grow.
显示更多
0
428
5.6K
669
转发到社区
🚨 Agent Swarms - Build Complex SaaS Apps With One Prompt Achieve fable like intelligence with a multi-LLM strategy Combine the best of Opus 4.8, GPT 5.5 and open source models and build end to end software systems A master agent delegates tasks to worker agent. Each agent has a special task like app building, mobile apps, testing and monitoring
显示更多
0
11
144
21
转发到社区
还在每天手动翻新闻、看K线、查资金流、盯自选股?😩 GitHub上这个49k星的项目,用LLM每天自动帮你干完所有事: ✅ A股/港股/美股/日股/韩股全覆盖 ✅ 行情 + 技术指标 + 资金流 + 实时新闻 + 基本面 ✅ LLM直接给出评分、买卖点、风险提示、催化因素 ✅ 支持15种策略(均线、缠论、波浪理论等)多轮问股 ✅ 每天自动生成决策仪表盘,推送到企微/飞书/Telegram 零成本!用GitHub Actions定时跑,不用买服务器。 5分钟配置完就能用,开源免费。 最近GitHub Trending上榜,强烈建议star收藏! 你还在手动分析股票吗?评论区说说你的痛点? 非投资建议。
显示更多
0
55
61
10
转发到社区
Claude Fable 5 está muerto y GPT-5.6 retrasando el lanzamiento… Microsoft ha cambiado el juego Han liberado bitnet.cpp como código abierto, un marco de inferencia de LLM de 1 bit. Te permite ejecutar modelos de 100B parámetros en tu CPU local sin GPUs. - 6.17x inferencia más rápida - 82.2% menos energía en CPUs 100% Código Abierto.
显示更多
0
8
72
11
转发到社区
NOBODY IS TALKING ABOUT THE MOST EXPENSIVE STEP IN EVERY AI PIPELINE.. It isn't the model. It isn't the embeddings. It's PDF extraction and most teams are still feeding their LLMs flattened garbage. @nutrientdocs CLI quietly fixed this: → Messy PDF in, clean structured markdown out. Headings, tables, lists preserved, not mangled. → Runs locally. No signup, no API key. Free up to 1,000 docs/month. → One command: npm install -g @ pspdfkit/pdf-to-markdown. Point it at a file or a whole folder. → On Claude Code or Cursor? Install it as a skill and your agent calls it automatically when it sees a PDF. Your retrieval is only as good as your chunks. Your chunks are only as good as your extraction. Everyone is optimizing the top of the stack. The real unlock is at the bottom.
显示更多