搜索 latepost 相关的推文与用户

2026.05.22 13:00

前几天跟潘乱和老编辑吃饭，登味超标的开了一下怀旧服，把晚点LatePost在2023年写的「还原字节跳动HR体系」那篇稿子重新讨论了一遍，尤以老编辑的评价甚高——我从来没有见到他这么吹过其他媒体和作者——认为文章的非线性写法非常独特，开创了商业报道的新体裁。我对老编辑说法的理解未必准确，但确实也能察觉到小晚整个团队在文本训练方面的优越性，并不是纯粹的基于材料的写作，有非常坚定的内在逻辑，同时具有工程化的结构和人文化的感性，可以无视时效性。昨天更新的「AI抢人大战，批量制造这个时代的流量明星」也是相当具有代表性的例子，AI研究员如同球星那样被开价和交易早就不是新闻了，市面上的同题作文泛滥成灾，但晚点就是能用信息的再组织写出新意、立意，这很厉害。还是总结一下这篇稿子，对我来说也是一种愉快的练笔： - 在中国，真正能靠个人技能年入过亿的群体，少之又少，以明星艺人为例，在娱乐业最鼎盛的时期，也只有十几个人能够达到这个标准，但在这波大模型热浪里，顶级研究员的身价以史无前例的速度被抬到了以亿为单位的年薪级别，而这批人的总数只有几百人，也就是说，大厂的你争我抢，总盘子其实就这么大，中国最贵的几百号人，就是在这么一个供给严重不足的环境里产生的； - 在ChatGPT发布之后的一年多时间里，因为局势尚不明朗，各家公司投入尚且谨慎，国内AI研究员的收入比较稳定，顶薪也就在百万级人民币，直到2023年底，两家公司打破了「规矩」，一个是DeepSeek开始用高于市场价的扩人，另一个是曾被视为落后半步的字节，通过饱和式投入启动追赶，以2倍薪水涨幅为起价，从月之暗面、阿里、百度、智谱等公司挖人； - 其中标志性的事件是2024年下半年阿里Qwen的核心技术负责人周畅带着竞业协议加入字节，职级从P9跳到4-2（实际上对标P11），千万级人民币的总包，而字节也很快得到了回报，周畅入伙之后，在极短时间内提高了豆包的多模态基模能力，这是抢人大战的关键驱动力，只要找到对的人，就能立竿见影的带来技术进步，事半功倍； - 很重要的是，一个靠谱的Infra专家，最多可以提高50%的算力利用率，考虑到大厂每年几百亿的算力投入，这种效率优化创造的经济收益，要远远胜过那笔薪水开支，一个正确的判断，也能决定模型在几个月内拉开巨大差距，「懂得在哪里划线」的知识价值，变得无比稀缺； - 到了2025年，DeepSeek的爆火让全行业都意识到模型质量的差距本质在于人，于是更多的公司开始加入，推动工资水平继续水涨船高，千万级薪酬包下沉到了普通研究员群体，字节甚至能给应届生开出500万年包，而DeepSeek也把内推奖金提高到了20万，猎头行情更是以月为更新周期，「三月给的价四月就不够用了」； - 但是，当其他大厂都相继启用钞能力后，强如字节也会沦为被掠夺的鱼肉，2025年下半年，腾讯开始盯着字节大模型团队挖人，用的是字节本就很熟悉的方式：工资翻倍，来不来？而且腾讯也兼具策略性，会主攻字节内部面临工资倒挂的老员工，因为位置长期不动，他们没能赶上职级膨胀的春风，于是选择投奔腾讯涨薪的为数不少； - OpenAI的姚顺雨和DeepSeek的郭达雅在前后半年的时间分别拿到过亿年薪加入腾讯和字节——这个数字同时被两家否定了——再次引发行业躁动，两人属于完全不同的样本，姚顺雨是标准的精英路线，从姚班天才到普林斯顿博士，履历辉煌，而郭达雅是完全的本土人才，没有镀金过程，但他们都以极为年轻的年龄，打破了大厂原有的年限体系和汇报关系； - 郭达雅意味着用已有成绩倒推价值也是可以成立的，因为DeepSeek的模型牛逼，所以参与制作这个模型的人同样牛逼，这个逻辑被大厂以实际行动买单了，当郭达雅决定离开DeepSeek时，阿里、腾讯、字节都在第一时间去接触了，包括老板亲自去谈，最后因为字节的投入方向和他的发展预期最吻合，成功签下入职合同； - 骨干的持续流失，给了DeepSeek相当大的压力，梁文锋选择启动融资，给员工手里的期权一个定价机会，对内安抚军心，为了留人，字节设计了豆包虚拟股，以及阳光普照的每人每月最低9万元额外津贴，反倒是已经上市的智谱和MiniMax，因为期权暴涨加上解禁期，不必太操心员工的稳定性； - 横向来看，最近一年里，字节和腾讯的饥渴度是最高的，字节愿意因人设岗，从张一鸣到HR，全都奉行「笼络最聪明的头脑」这一原则，腾讯因为自身的进度原因，被迫成为市场上后出价的那个人，虽然要当冤大头，但对于家大业大的鹅厂储备来说，问题也不大，先去拿字节的offer、再用字节的offer去敲腾讯的门要更多的钱，成了一些研究员的财富密码，有猎头说得很透彻，大厂不怕花钱，是为了把对手能用的人，提前从市面上清掉； - 阿里就比较保守了，Qwen以团队氛围优秀著称，90%的员工都是阿里自己培养的校招生，工作自由度很高，但阿里严格的职级体系，还是对Qwen参与人才争夺制造了障碍，2025年下半年，林俊旸曾让Qwen的研究员主动出去面试，以求得涨薪的机会，避免人才外流，可见有多无奈； - 当给够钱已经不具备稀缺性之后，大厂争取研究员的技巧也开始转向软实力，比如扎克伯格会把Meta想挖的人请到自家别墅吃饭，用「真诚」作为必杀技，张一鸣也会亲自去和自己看上的论文作者见面谈话，Anthropic之所以成为研究员离职率最低的AI公司，是因为它被公认为文化建设独树一帜，老板本身就是一种信仰； - 研究员之间的竞争必然激烈，以前抬高身价的方式是发论文，后来各家公司发现只要发完论文就会让作者接到的猎头电话直线上升，又不太乐意让研究员「抛头露面」了，但是上有政策、下有对策，研究员们也很灵活，不让发论文，那就去上播客、发推特、做小红书，总之就是加强主动「营业」，持续的获取个人流量，确保在需要的时刻能被看见； - 为了对得起高薪待遇，同时防止掉队，这几百个顶级研究员普遍睡眠不足、高压工作，即便没有KPI和OKR，他们也会自己驱动自己，就像从小到大的做题路径，这是天才避免泯然众人的唯一出路，「这个行业最终会变成，前5%的人拿着从前10倍的工资，干着100个人的活。」

显示更多

0

14

72

13

转发到社区

宝玉@dotey

2026.04.02 18:22

晚点 LatePost 发了一篇 DeepSeek 深度报道《V4 发布前的 DeepSeek：特质、组织和梁文锋的独特目标》时间点卡在 V4 发布前夕。信息密度很高，摘几个最值得关注的点。【1】核心成员离职，但没有成组流失四位已确认离开的成员里，分量最重的是 DeepSeek-R1 核心作者郭达雅，近期正式离职，可能入职某大厂。另外还有去年底被腾讯姚顺雨挖走的王炳宣（第一代 LLM 核心作者），以及 OCR 系列核心作者魏浩然、多模态方向的阮翀。猎头给 DeepSeek 成员开出的条件是“翻 2 到 3 倍”，有公司直接给 8 位数总包。加上智谱、MiniMax 上市股价高涨，阶跃和 Kimi 的 IPO 也提上日程，DeepSeek 那份没有明确标价的期权让一些成员产生了疑问。梁文锋正在想办法给公司估值，给团队更多确定性。【2】V4 可能 4 月发布，大概率开源最强但不会碾压 1 月左右，V4 的小参数版本已经给到一些开源框架社区做适配。原本乐观预期是春节前后发大参数版，现在推迟到 4 月。晚点的判断是：V4 大概率仍是开源最强模型，但很难是碾压级的强。原因是进入 Agent 时代后，“强”的标准越来越多元，不同场景、不同用户的体感差异很大。【3】DeepSeek 的“反主流”路线梁文锋有两个不太主流的优先级：一是基于国产芯片生态做大模型，DeepSeek 已经在做国产 GPU 适配，把底层算子库从 CUDA/Triton 换成了北大开源的 TileLang；二是做“原创式创新”，包括统一多模态的 Janus 系列、形式化证明的 Prover 系列、用图片方式理解文字的 OCR 方案，甚至招了神经科学和脑科学顾问来探索仿生学习机制。代价是，DeepSeek 在 Agent 和编程这条当前最热的赛道上投入相对少。R1 之后，智谱更新了 5 版模型，MiniMax 4 版，Kimi 3 版，都在针对 Agent 和 coding 强化。OpenRouter 过去 30 天的 token 消耗排名里，DeepSeek-V3.2 排第 12，前 10 中有 6 个来自中国公司。【4】不过，变化已经开始 DeepSeek 最近首次在招聘启事中提到了具体产品名，要招 Agent 方向的“模型策略产品经理”，岗位要求里写着“熟悉并深度使用过 Claude Code、OpenClaw、Manus 等知名 Agent”。梁文锋从去年秋天起开始更多提产品化和商业化。DeepSeek 已有小几十人的产品团队，但目前 C 端仍然只有一个标准 Chatbot。【5】不卷文化依然在 DeepSeek 可能是全球唯一一个“不卷”的核心 AI Lab。多数员工下午 6 到 7 点走人，早上不打卡，没有明确的绩效考核和截止时间。梁文锋的逻辑是：一个人每天能高质量输出的时间很难超过 6 到 8 小时，加班疲劳下的昏庸判断反而浪费算力。研究团队约 100 多人，只有梁文锋和研究员两个层级。梁文锋本人参与最多的是基模架构团队，会出席每个团队的会议，是串起不同模块的“粘合剂”。研究员可以自由组队，“有时开始一个新方向，就是因为三五个人都觉得一个 idea 不错，然后就一起做了。” 接近 DeepSeek 的人说：“留下的人多少还是有些理想的。” 在当前这个所有 AI 公司都在拼命卷 Agent 和编程的窗口期，DeepSeek 选择花精力做国产芯片适配和仿生学习，这到底是远见还是错过了最佳出手时机？完整内容：

显示更多

0

39

372

49

转发到社区

阑夕@foxshuo

2026.03.05 13:52

看到晚点LatePost也更新了谈千问换帅事件的播客，深度依然是全网无出其右，确实单口播客这种媒介形式也更适合即兴的去跟一些热点选题，比文稿生产的效率要高。总之，光速听完之后，阑心一言咔咔启动： - 简单化的去理解林俊旸的离职，一定会被牵着鼻子走，比如我们看到投放的料五花八门，有把阿里HR挂成万恶之源的，也有对冲说林俊旸在搞独立王国的，这些都是噪音，不是说对错不重要，只是很多时候你很难用对错来评价所有事情，需要接受个人意志和组织生长之间的摩擦必然有概率发展到不相容的地步； - 三个需要厘清的事实是，其一，林俊旸不是被离职的，阿里不可能主动开掉这个级别的Leader，其二，DAU是和千问App的产品团队捆绑，这是吴嘉/智能信息事业群的工作，不太可能牵扯到从属于阿里云的模型团队，其三，今年1月空降的周浩，是接替已经确定要走的后训练负责人喻博文，并不是来管林俊旸的； - 所以林俊旸的离职，更接近于一种「道心破碎」的结果，晚点主播曼琪的用词很微妙——「长期知其不可为而为之的付出」——最后被组织架构调整这根最后的稻草给弄崩了，宣布离职的整个过程，就是没考虑给阿里的管理层留太多反应时间，是铁了心不想干下去了； - 千问的模型团队属于通义实验室，而通义实验室又属于阿里云，最后阿里云再属于集团，这个嵌套关系已经很复杂了，在叠加了千问模型作为阿里全村希望的战略定位，资源匹配问题就很大了，所以才有了连阿里CEO吴泳铭也不知道千问模型团队被卡资源的说法； - 林俊旸这边的人马高度依赖阿里云的Infra支持，但实际上他们觉得阿里云在服务外部团队上甚至好于服务自家千问基模——这也太离谱了——于是去年年底林俊旸绕过阿里云直接找吴泳铭争取了自建Infra的权限，这个越级操作也为后来发生的事情埋下了伏笔； - 还有一个比较难绷的是，去年春节前后，o1带动推理模型开始崛起，千问在后训练方面遇到了瓶颈，然而转用字节开源的强化学习框架veRL来做训练，发现效果有了比较明显的提升，相当于通过控制变量，发现了问题是在Infra上，这才有了林俊旸对Infra一直不满意的根源，要做垂直一体化的建设； - 但阿里云的判断不是这样的，因为混合多模态已经是明显的趋势，把各个模态、预训练和后训练都拆出来搞单元制，是一定要做到事情，但对原千问模型团队来说，这就是在被收窄范围，尤其是时间点卡在Qwen 3.5训练完成后不久，大家都很疲惫，突然又得到了这种不太像是奖励的调整； - 阿里的管理层比较懵逼，或者说被动，也有反思组织变动没有考虑办公室政治的因素，把明明是要扩大对基模投入的事情，干成了让基模团队觉得是要收缩的效果，沟通上没有把控好，现在尽量要去平稳解决矛盾； - 千问在开源社区赢得的名声，到底怎么转化成阿里的资产，这个量尺很难找到，在2B市场，开源意味着很难卖API，在2C市场，开源⋯⋯好像也没啥意义，用户不会因为你开源了就来用你的App，然而林俊旸是一个相当理想主义的Leader，万亿参数的Qwen Max旗舰模型是阿里没有选择开源的，但他也想推动开源； - 千问的模型团队从创建之初就保有着一个相对独立的工作环境，少被拉扯和打断，这种专注力被视为千问模型屡出成果的原因，但是当AI行业进入一场谁也输不起的All In战局后，这种与真实市场保持距离的自驱型团队还能不能存在，既是一个原则问题，也是一个选择问题。

显示更多

0

23

207

20

转发到社区

阑夕@foxshuo

2026.02.08 07:27

之前有张「中国AI vs 美国AI」的图（图1）很火，就在OpenAI和Anthropic齐发新模型的同时，元宝和千问正在开打红包大战，对比起来讽刺性拉满了。但这个笑话的保质期很短，也不怎么好笑了，因为很快赶上了字节和快手同样先后的发了新一代视频模型，在外网刷屏的程度再次引起洋人对于中国AI实力深不可测的「刻板印象」。所以说钱钟书老爷子写「围城」是有道理的，寰宇就是一个围城，里头的人眼馋外边，外边的人羡慕里头。字节的Seedance 2.0很牛逼，可以说是完全改写了视频生成的方法，而且因为字节这家公司自带的外围声量一直很大，所以虽然发布更晚，评价增长却更快，但快手的Kling 3.0也非常强，我已经烧掉三个号了，保证绝对不是在强行塑造「双星闪耀」的概念。这也和两个模型的路线差异有关，综合能力肯定都要对标视频大模型的Sota、也就是谷歌的Veo模型，但Seedance 2.0更侧重于Sora 2的那套运镜、理解、模仿、转场等效果，极大的利好短视频创作者生态，而Kling 3.0则更偏向于Runway代表的影视化、真实化和工业化的能力，是冲着专业导演和工作室去的。所以博主和用户天然会对Seedance 2.0更有感觉，这没毛病，但我对Kling 3.0的上限期待很高，它真的是在抹平真实和虚拟之间的界限，不过从长期来看，路线差异必然是暂时的，最后大家都会殊途同归，解决抽卡问题的同时，全方位无死角的替代掉现有视频生产管线的一半以上，甚至更多。相比「闷声发大财」的AI Coding，多模态才是AI接近普通人的破圈手段，去年ChatGPT和Gemini的两次「翻倍级」增长（图2），一个是因为GPt-4o的「吉卜力风潮」，一个是基于Nano Banana的降维打击，都是多模态在立功。到了今年，战场开始继续前移，除了Seedance 2.0和Kling 3.0，同样是在这个月，马斯克发布了Grok专有的视频模型Imagine 1.0，谷歌也发布了打掉游戏引擎市值的Genie 3，发现共同点了吗？全，是，视，频。人是视觉动物，所见即所得的信息量，是远超文本和语言的，视频模型以前主要吃亏在能力不足，训练难度居高不下，生成质量良莠不齐，无法形成类似「一键P图」的稳定性玩法，但是到了2026年，这个瓶颈期目测已经快要跨过去了。还记得威尔·史密斯吃意大利面吗？那也不过是两三年前的事情，时间过得很快，也很扁平，技术的进化效率太可怕了。多说几句开头那个对比吧，如果说中国AI公司眼馋Claude Opus 4.6和GPT-5.3-Codex，倒也确实没毛病，但这也不只是纯粹的技术代差，中美的商业环境决定了AI渗透的发力点不一样。表面上看，美国的AI巨头都在发力AI Coding，容易货币化是一回事，再往深了想，Coding自由的终点是什么？是工具、软件甚至系统的零成本化，需要什么让AI去写代码就好了，所以美股里的SaaS赛道突然就崩了。 SaaS是一个积累了快30年的万亿级规模市场，非常适合拿来当作回应「AI投入太大、回报不足」的靶子，想象空间太大了，而大厦将倾的此情此景，实在是有种见证时代的残酷美学。王慧文在即刻上发了一条非常精辟的动态（图3）：「我们曾经以为，中国SaaS会像美国SaaS那么值钱，现在看，美国SaaS会像中国SaaS这么不值钱。」大佬就是大佬，几句话就说到点上了，中国的AI公司在产业化方面有苦难言，尤其是面对美国同行的高歌猛进，原因就在于：你不可能去替代一个不存在的市场，拿走一份不存在的产值，讲述一篇不存在的故事⋯⋯ 但在多模态尤其是视频模型方面，就不是这样了，中国互联网的短视频、直播和创作者生态，是全球领先的，这是真的存在巨大的市场、产值和故事可以被AI接上的，所以字节和快手为视频模型的投入动力，是完全不虚美国大厂的。快手Kling有先发优势，ARR涨得很快，在海外一直处于第一梯队，字节属于后来居上，多模态能力对豆包的留存拉动明显，更不用说GPU储备量是国内大厂里Top级的，真想做成事情，很难不做成。昨晚很多字节的朋友都在转梁汝波和张楠用AI合拍的视频（图4），用来宣传搭载了Seedance 2.0的即梦，张楠的性格搞这个不意外，意外的是梁汝波也配合了，你们很少会看到他给字节的其他产品这么站台。晚点LatePost的稿子里提过，字节内部是期待AI这波能有「下一个抖音」跑出来的，而且是完全用字节的方法去做选择——数据决定地位——也就是说，赛马机制已经启动了，目前至少有三拨势力在争这个「太子」： - 即梦，负责人张楠是把抖音做起来的第一人，她先去剪映，再到即梦，一直是被安放在从0到1的最前线，代表了字节在创业场景下最强的战斗力； - 豆包，所属的Flow团队负责人朱骏是 - 抖音自己，是的，抖音部门也希望「下一个抖音」能由自己孵化出来，而不是假手于人，比如抖音搜索团队做了一个名字就叫AI抖音的App，用户量不大，但占位置的意图很明显；还是那句话，字节这家公司的活力之高和欲望之强，在大厂里真的很少见，丝毫看不到老化的痕迹。最后我还想说，大的在后面，中国AI公司在这个月的重量级发布还没结束，我知道一些但是暂时不能说，等着吧，用心感受这神仙打架的一个月。

显示更多

0

16

220

35

转发到社区

Sandara Park@krungy21

2024.06.21 05:16

#다라투어# with #천둥# #미미# #이준# 편 아직 안끝났대요~ 오늘 마지막편 업로드됩니다!!! 😁 ㅋㅋㅋ 이 사진은 Thunder & Mimi’s Wedding Party #latepost# 내 생일파티가 아닌, 웨딩파티를 준비해본건 첨인데 넘 이뻤당🥹 #flashbackfriday# 🥰🤵🏻👰🏻‍♀️🎈🎉💕

显示更多