lifcc (@mylifcc) — TopicDigg

2026.06.28 15:51

苹果官方开源神器来了！ container v1.0.0 正式发布！在 Mac（Apple Silicon + macOS 26）上，用轻量级虚拟机原生运行 Linux 容器！ Swift 编写、Apple 虚拟化框架深度优化、OCI 完全兼容。再也不用忍受 Docker Desktop 吃资源、兼容问题了！ ✨ 新增 container machine 功能支持持久化 Linux 开发环境，与宿主机深度集成，丝滑到飞起～ GitHub（已 44k+ Stars）：快去 Star + 下载试用！支持苹果开源，一起把 Mac 容器体验推向新高度！ #AppleContainer# #macOS开发# #Swift# #容器技术# #开源项目# #WWDC#

显示更多

转发到社区

lifcc@mylifcc

2026.06.27 06:43

最近看了下 Warp 开源仓库里的 agent 指导设计。我觉得它最值得学的地方不是某个 AGENTS.md 写得多好，而是它把开源项目维护做成了一套 agent-native workflow： issue triage、spec、实现、review、CI 诊断，都被流程化了。

显示更多

244

转发到社区

lifcc@mylifcc

2026.06.23 10:21

LiteLLM 正式迁移到 Rust 了！🦀 AI Gateway 迎来史诗级性能升级： ⚡ 单请求开销降低 150 倍（~0.05ms vs Python 7.5ms） 📈 吞吐量提升 15 倍 💾 内存占用降低 11 倍（峰值仅 32MB） 📦 单个 ~65MB 二进制文件，开销 <1ms 保持完全相同的 Python SDK、config.yaml、数据库和 100+ LLM 提供商，零破坏性变更！

显示更多

转发到社区

lifcc@mylifcc

2026.06.22 10:05

发现一个不错的网站，每天更新一次codex模型的能力，比如今天，gpt5.5-xhigh的能力就不如medium 这个我是有体会的，他不一定准，但可以作为参考

显示更多

138

转发到社区

lifcc@mylifcc

2026.06.19 08:43

LLM 底层到底在干什么？这篇 0xkato 的《How LLMs Actually Work》可能是目前最清晰的从头讲解现代大模型工作机制的文章了。没有一堆公式，但把 transformer 的每个零件都拆得明明白白。 Step 1: Tokenization（分词）模型不认识汉字或字母，它只认识数字。 Tokenization 把文本切成词表里的子词片段（subword），映射成整数 ID。比如 "running" 可能变成 ["run", "ning"]。好处是能处理新词，平衡效率和覆盖。小贴士：这就是为什么有些模型数字母会出错——token 边界不是按字符。 3

显示更多

242

转发到社区

lifcc@mylifcc

2026.06.18 20:38

GLM-5.2 终于能本地跑了！🔥 Unsloth 把这个 1.51TB 的前沿 open weights 模型压到 238GB（-84%），2-bit 量化后还保留 ~82% 准确率。256GB Mac / 大内存机器就能跑，当前最强 open model 之一落地了。尤其是 coding + agentic 能力提升明显，1M context + MIT license，配合本地 agent harness 潜力巨大。 Unsloth 又一次把“local”推向新边界。

显示更多

Unsloth AI@UnslothAI

2026.06.18 12:40

GLM-5.2 can now be run locally!🔥 The 2-bit model retains ~82% accuracy after we shrunk it from 1.51TB to 238GB (-84% size). Run on a 256GB Mac or RAM/VRAM setups. GLM-5.2 is the strongest open model to date. Guide: GGUF:

显示更多

转发到社区

lifcc@mylifcc

2026.06.18 03:55

很难想象glm-5.2一个不能看图的模型，能把ui做成这样

131

388

转发到社区

lifcc@mylifcc

2026.06.16 14:51

【小模型再次震撼！3B参数VibeThinker-3B数学推理直逼前沿】 Weibo AI刚放出的VibeThinker-3B（基于Qwen2.5-Coder），在AIME26拿到94.3（+CLR后97.1），LiveCodeBench v6 80.2，LeetCode近赛96.1%通过率……这成绩直接干翻一堆远大于它的模型。核心是Spectrum-to-Signal后训练策略：多样性蒸馏 + RL优化，专注verifiable reasoning，没走通用知识堆参数的老路。这类高效小模型太香了——本地跑得动、成本低、推理强，特别适合数学/算法密集的子任务。 HuggingFace: 小模型时代真的来了，参数不是万能的，post-training才是王道。你们觉得这个3B能直接上生产吗？

显示更多

Francesco Bertolotti@f14bertolotti

2026.06.16 05:20

Stellar performance from a 3B model. These results were achieved primarily through post-training refinements on Qwen2.5-Coder. The paper doesn't provide many details, but it appears they distill from RL ckpts and then do a final RL-based instruct RL. 🔗

显示更多

转发到社区

lifcc@mylifcc

2026.06.06 03:41

Google再次发力，昨天Google 丢出了Gemma4 系列的QAT模型，直接让16GB MAC可以跑256k上下文的agent了。之前有人说Gemma 4 12B 本地部署30k上下文没啥用，我用 Google QAT 尝试了一下，只要增加1.5GB内存就能打开256k上下文！左边：常规 Q4_K_M @ 32K 右边：Google QAT Q4_0 @ 256K 同一台 Mac、同一 prompt、两个 llama-server 同时跑，实时对比内存、CPU、tok/s。

显示更多