注册并分享邀请链接,可获得视频播放与邀请奖励。

anonymous 的个人资料封面
anonymous 的头像

anonymous (@youyouAllen)

@youyouAllen
Nothing
1.2K 正在关注    3.1K 粉丝
bn上美股,伊威胁中断对话,saylor卖出btc,又是一次对btc的三连击。 前边的主要三连击:关税,通胀预期,议息会议。 这市场和AI相比太复杂了。
我的推理引擎在本地Mac mini 4,让Qwen 1.7B模型跑四个小时的长程推理,目标是把kv cache 存储空间控制在7.4 MB大小。
衡量世界观最可计算的方式就是你的投资支出,衡量价值观最可计算的方式就是朋友社交支出,衡量人生观最可计算的方式就是个人生活支出。所以人的很多维度都在变得可计算。从信息量,注意力,再到三观。等把记忆力计算性维度补上,我们普通人在AI面前没有任何胜算。
显示更多
但是就AI健康问题领域而言,AI现在最适合的还是可以快速准确验证的领域。健康领域在可验证性方面,一个无法做到准确,另外一个无法做到低成本(出了健康问题很严重)。 只能成为一种资讯建议。这个可能会阻碍AI健康的真正交付质量。
显示更多
现在人与AI的交互增长速度大于人与app交互的增长,而且未来三五年这个加速趋势不太会改变,过去但是人与app交互完成人找人,人找商务,人找信息流这些需求。并不意味着完全平移到人与AI的交互关系里。AI打开的新维度,人通过AI找到了可信助手。如果仍然用这个助手去找人,商务,信息流,会显得市场辨识度很差。去找情感解答,coding,健康护理,3d设计,文书写作,法律咨询,这些原先专业saas软件覆盖的市场更加个体化。
显示更多
15个月后再来看当时的这个逻辑链条,可以逐一验证:外汇中rmb/usd 汇率趋势已经完全改变了,然后就跟着黄金在2026年初新高,现在已经轮动到美债波动性明显放大,随着warsh上台开始对利率市场进行调整。 btc从2025年10月份之后还没有建立起对利率的进一步反应计价。目前只是对伊朗战争进行反应。
显示更多
关税->外汇->黄金->美债->利率->btc 这个时候就看黄金和美债谁是避险,谁是对冲了。如果都避险,btc也会进入避险模式。如果黄金避险,美债对冲,那btc就进入被迫对冲模式。如果黄金对冲,美债避险,那btc就进入被迫避险模式。
显示更多
HW如果tao定律如果只是高维度堆叠起来,散热会是个大问题。cpu的封装早已经不是2维度的了。intel很早就开始3维封装了,一直被散热问题困扰。如果tao定律把整个计算存储立体封装起来,为了解决散热问题,估计还需要走类似cerebras的技术路线,就是先把芯片做大,再把频繁访问的部分堆叠起来。所以短期内对消费端的芯片设计影响应该不大。还是对AI服务器端芯片设计有影响。但是intel似乎一直都有类似技术路线。intel的Craig barratt 这个人很关键,背景估计与何庭波提出的tao定律涉及到封装和设计有关。 如果越来越多堆叠封装场景,那么cxl,光互连,system foundry将是不可避免的。
显示更多
注意力可计算性和记忆力可计算性三定理。 第一都需要对齐,但对齐对象不一样。第二都需要稀疏化,但是稀疏化方式不一样。第三两者在计算过程中相互依赖。
显示更多
在何恺明的ELF模型上做proposer训练,分别在最新的qwen3.6,gemma4,DeepSeek v4上带来的kv cache存储节省的净收益14-60倍。何恺明会不会在AI存储上再次搞出当年AI ResNet的效应? 😂
显示更多
何恺明的新模型通过diffusion完成语言推理,最大优势就是不需要海量的kv cache了。存储的故事估计要开始出现裂缝了。
最近准备vibe coding一个不需要全局kv cache的LLM推理引擎。看看实际效果怎么样
拉长五年周期看,AI相关的半导体相关的基础设施一定是通缩的。这是因为AI越强大,越接近一种基本人权。在当前这个剧烈分化的社会结构面前,一个通缩的基础设施成为民生工程的基础。东大已经在过去二十年从信息高速公路上通过降费增速多次把基础设施做成了民生保障系统。当然这有一定的zz考量因素。但是如果放到漂亮国,剧烈的k型分化导致AI成为一种民生基础要求,那么基础设施必须要进入affordability范围内。AI越强大,市场反推的需求越强大。
显示更多
很多未来要发生的事情,在新技术出现后前三年大部分已经都出现了。未来也是过去的一种隐喻。并不是完全石头缝里蹦出来的。
过去一段时间研究kv cache 压缩发现一个计算与存储的矛盾:因为当前AI存储需求是基于计算妥协导致,长期看计算慢慢吃掉多余存储空间,导致存储供应过剩。所以如果计算下跌,存储会跌的更多,如果存储上涨,计算会涨的更多。如果计算没存储涨的多,说明市场存储泡沫进一步放大,只需要加仓计算就行了。
显示更多
我看很多人把agentic os理解成cron,loop,context管理。我最近感觉更接近agentic os的是推理引擎,virtual file for page attention,kv cache状态管理,prefill/decode i/o 管理。本地模型部署。
显示更多
刚刚刷到Hugging Face上这个gpt-oss-20b-tq3,真的有点爽啊! OpenAI自己开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化 + MLX优化后,竟然能直接在普通MacBook上本地丝滑跑起来。 完全不用联网、不用交月费,还支持131K超长上下文。 日常聊天、写作、写代码这些日常需求,现在都能在自己笔记本上搞定。 非常适合公司的一些部门使用啊! 以前本地跑大模型还得配高端显卡,现在一台M系列Mac就够了。 模型直达👉
显示更多
感觉段永平彻底转向了消费领域。手里股票除了伯克希尔,西方石油,基本上都是消费股。苹果,腾讯是数字消费,pdd,阿里是电商消费,ppmt和茅台是情绪消费
显示更多
低利率环境非常适合流动性扩散,特别是符合进入商业化阶段的带有护城河的早期标的。
现在笼统相关分析,btc就是在两条宏观线之间反复被预期和情绪交易。一条是战争,包括伊朗战争,也包括贸易战。另一条就是货币政策,财政政策其实相关性都很模糊。尽管很多宏观分析把美国财政操作覆盖在内。而货币政策现在基本上被通胀牵制。这里有一点感叹:战争总会结束的,即使不结束也会被遗忘。但是通胀不会,而且时不时出来刺激一下市场。而btc somehow总是可以提前对这些宏观因素进行计价。对普通人来讲是黑天鹅,但是对有的人可能不是。这也没有办法。 而美股的交易主题就是AI了。AI的供需紧张已经可以无视宏观上的干扰,但是市场对基本面风吹草动的扰动非常敏感。也就会经常发生事后矫正的情况。相比现代战争,产业供需关系算是一个年度为单位的长周期事件,price in的过程需要好几个季度的基本面正面。所以关键的前瞻性思考需要聚焦在产业的主题上。 想想现在市场的这种微妙感受也挺有趣的。
显示更多
saylor 打破只买不卖的人设预期,应该是对btc相关的宏观前瞻性有一定的预设。strategy的mnav 变成btc市场波动性的一个放大因子。btc的波动性是价值储备的负面因素,swing交易的正面因素。零和博弈的宿命。
显示更多
从四个维度判断自己是否在投资/投机的路上进步: 开始阶段:知道自己知道 ego/fomo阶段:不知道自己不知道 fomo/ego阶段:不知道自己知道 系统阶段:知道自己不知道 ego/fomo->fomo/ego 有点loop性质,很容易来回切换。
显示更多