注册并分享邀请链接,可获得视频播放与邀请奖励。

lifcc 的个人资料封面
lifcc 的头像

lifcc (@mylifcc)

@mylifcc
每天用 AI 写代码的工程师 Claude Code | Codex深度用户 |Agentic engineering 在这里分享 AI 工具实测和开发者工作流
248 正在关注    3.7K 粉丝
苹果官方开源神器来了! container v1.0.0 正式发布! 在 Mac(Apple Silicon + macOS 26)上,用轻量级虚拟机原生运行 Linux 容器! Swift 编写、Apple 虚拟化框架深度优化、OCI 完全兼容。 再也不用忍受 Docker Desktop 吃资源、兼容问题了! ✨ 新增 container machine 功能 支持持久化 Linux 开发环境,与宿主机深度集成,丝滑到飞起~ GitHub(已 44k+ Stars): 快去 Star + 下载试用! 支持苹果开源,一起把 Mac 容器体验推向新高度! #AppleContainer# #macOS开发# #Swift# #容器技术# #开源项目# #WWDC#
显示更多
最近看了下 Warp 开源仓库里的 agent 指导设计。 我觉得它最值得学的地方不是某个 AGENTS.md 写得多好,而是它把开源项目维护做成了一套 agent-native workflow: issue triage、spec、实现、review、CI 诊断,都被流程化了。
显示更多
0
8
244
49
转发到社区
LiteLLM 正式迁移到 Rust 了!🦀 AI Gateway 迎来史诗级性能升级: ⚡ 单请求开销降低 150 倍(~0.05ms vs Python 7.5ms) 📈 吞吐量提升 15 倍 💾 内存占用降低 11 倍(峰值仅 32MB) 📦 单个 ~65MB 二进制文件,开销 <1ms 保持完全相同的 Python SDK、config.yaml、数据库和 100+ LLM 提供商,零破坏性变更!
显示更多
0
10
58
4
转发到社区
发现一个不错的网站,每天更新一次codex模型的能力,比如今天,gpt5.5-xhigh的能力就不如medium 这个我是有体会的,他不一定准,但可以作为参考
显示更多
0
32
138
8
转发到社区
LLM 底层到底在干什么? 这篇 0xkato 的《How LLMs Actually Work》可能是目前最清晰的从头讲解现代大模型工作机制的文章了。没有一堆公式,但把 transformer 的每个零件都拆得明明白白。 Step 1: Tokenization(分词) 模型不认识汉字或字母,它只认识数字。 Tokenization 把文本切成词表里的子词片段(subword),映射成整数 ID。 比如 "running" 可能变成 ["run", "ning"]。 好处是能处理新词,平衡效率和覆盖。 小贴士:这就是为什么有些模型数字母会出错——token 边界不是按字符。 3
显示更多
0
4
242
55
转发到社区
GLM-5.2 终于能本地跑了!🔥 Unsloth 把这个 1.51TB 的前沿 open weights 模型压到 238GB(-84%),2-bit 量化后还保留 ~82% 准确率。256GB Mac / 大内存机器就能跑,当前最强 open model 之一落地了。 尤其是 coding + agentic 能力提升明显,1M context + MIT license,配合本地 agent harness 潜力巨大。 Unsloth 又一次把“local”推向新边界。
显示更多
GLM-5.2 can now be run locally!🔥 The 2-bit model retains ~82% accuracy after we shrunk it from 1.51TB to 238GB (-84% size). Run on a 256GB Mac or RAM/VRAM setups. GLM-5.2 is the strongest open model to date. Guide: GGUF:
显示更多
很难想象glm-5.2一个不能看图的模型,能把ui做成这样
0
131
388
6
转发到社区
【小模型再次震撼!3B参数VibeThinker-3B数学推理直逼前沿】 Weibo AI刚放出的VibeThinker-3B(基于Qwen2.5-Coder),在AIME26拿到94.3(+CLR后97.1),LiveCodeBench v6 80.2,LeetCode近赛96.1%通过率……这成绩直接干翻一堆远大于它的模型。 核心是Spectrum-to-Signal后训练策略:多样性蒸馏 + RL优化,专注verifiable reasoning,没走通用知识堆参数的老路。 这类高效小模型太香了——本地跑得动、成本低、推理强,特别适合数学/算法密集的子任务。 HuggingFace: 小模型时代真的来了,参数不是万能的,post-training才是王道。你们觉得这个3B能直接上生产吗?
显示更多
Stellar performance from a 3B model. These results were achieved primarily through post-training refinements on Qwen2.5-Coder. The paper doesn't provide many details, but it appears they distill from RL ckpts and then do a final RL-based instruct RL. 🔗
显示更多
Google再次发力,昨天Google 丢出了Gemma4 系列的QAT模型,直接让16GB MAC可以跑256k上下文的agent了。 之前有人说Gemma 4 12B 本地部署30k上下文没啥用,我用 Google QAT 尝试了一下,只要增加1.5GB内存就能打开256k上下文! 左边:常规 Q4_K_M @ 32K 右边:Google QAT Q4_0 @ 256K 同一台 Mac、同一 prompt、两个 llama-server 同时跑,实时对比内存、CPU、tok/s。
显示更多
0
13
103
10
转发到社区