注册并分享邀请链接,可获得视频播放与邀请奖励。

与「那什么」相关的搜索结果

那什么 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 那什么 的内容
再特么感受到了在 AI 时代,创意的重要性了,看看这个网友使用 AI 制作的历史视频,太有意思了。 AI 时代,当把技能门槛踩到地板上之后,剩下的就是纯粹的创意较量了。 以前你想做一个历史题材的视频,得会剪辑、会画分镜、会配音、会调色,光是学这些工具就够劝退九成人。现在这些全被 AI 接管了,谁都能上手,技术不再是护城河。 那什么是护城河?是你脑子里那个别人想不到的点子。是"把秦始皇扔进直播间带货"这种荒诞又精准的嫁接能力,是"让李白和杜甫用说唱 battle"这种让人拍大腿的脑洞。工具人人平等了,但想法天生参差。 说白了,AI 把"能不能做"变成了"想不想得到"。执行力贬值,想象力通胀。以前创意好但手艺差的人被埋没,现在他们翻身了;以前靠手艺吃饭但创意平庸的人,反而开始慌了。 这可能是第一次,"有趣"比"专业"更值钱。
显示更多
【Codex保姆级教程!零基础从入门到精通】第7条---多任务管理:排队、插队和并行。这三个是桌面APP日常使用中非常高频的操作。 先说任务排队。 假设Codex正在帮你做任务A,比如生成一个网站。这时候你突然想起来:做完之后帮我总结一下设计思路。 你不需要等他做完才说,直接在输入框里打字发出去就行。 你发出去的新消息,会出现在输入框上方,排在任务A后面。 Codex会先做完A,再自动开始做B,这就是任务排队。你可以排很多个任务,他会按顺序一个一个执行。 那什么是任务插队? 比如,有时候你排了一个任务在队列里,突然又改主意了。你不想等到后面再执行,你想让当前正在跑的任务立刻考虑到你的新要求。 比如Codex正在帮你做网站,你排了一个总结设计思路的任务。但这时你突然想起来:我想要iOS风格的UI设计。 如果你正常发这条消息,他会排在总结设计思路后面,等做完总结才轮到他,这样就太晚了,网站都做完了。 这时候,你点消息旁边的引导按钮,这条消息就会跳过排队,直接注入到当前正在执行的任务里。正在做网站的AI,会立刻把iOS风格的UI设计这个要求考虑进去,边做边调整。 那说完了排队和插队,最后说一说什么是多任务并行。 排队和插队,都是在同一个对话里发生的。但如果你想让多个任务同时进行,互不影响,怎么办呢? 很简单,开一个新对话就行。 在左侧栏你当前项目名字旁边,点击创建新对话,开一个新的对话窗口,在里面布置另一个任务。这个新任务会和之前的任务同时跑,互不干扰。 你可以在左侧栏看到两个对话条目,旁边各有一个滚动图标,表示他们都在同时执行。 你甚至可以跨项目并行,去另一个项目里也布置一个任务。不同项目之间的任务同样可以并行。 需要注意的一点,不同对话之间聊天记忆上下文是不共享的。也就是说,对话A里聊了什么,对话B不知道。 但他们都可以看到当前项目文件夹里的所有文件,因为文件夹是同一个。
显示更多
#那什么#... 说是 codex一个大bug爆了 在流式传输和自动化任务的时候,以5M/s的速度,持续往磁盘写日志。 每年大概要写640TB。要不了一年,就可以耗尽部分消费级SSD标的写入寿命。 ... Linux/Mac下直接看: $ ls -lh ~/.codex/logs_2.sqlite $ sqlite3 ~/.codex/logs_2.sqlite "SELECT level, COUNT(*) FROM logs GROUP BY level ORDER BY COUNT(*) DESC" 要是TRACE占了一大半、文件还在不停长,那就是中招了。 ... 目前止血的办法有三个,从糙到稳。 最暴力的,直接拿sqlite触发器把日志写入掐死。反正这文件里只有诊断日志,没有你的对话历史,删了、屏蔽了都不心疼: $ sqlite3 ~/.codex/logs_2.sqlite "CREATE TRIGGER IF NOT EXISTS block_log_inserts BEFORE INSERT ON logs BEGIN SELECT RAISE(IGNORE); END;" 温和一点的,把这个文件软链到内存盘(tmpfs),让它在内存里折腾,不碰你的SSD,重启自动清空: $ mv ~/.codex/logs_2.sqlite ~/.codex/logs_2.sqlite.bak $ ln -s /tmp/logs_2.sqlite ~/.codex/logs_2.sqlit 实在不想动命令行、家里又有第二块机械硬盘的,把这文件挪过去就行。 机械盘耐写,磨就磨吧。 俺的 VPS 中的查询: $ sqlite3 ~/.codex/logs_2.sqlite "SELECT level, COUNT(*) FROM logs GROUP BY level ORDER BY COUNT(*) DESC" TRACE|4330 INFO|628 DEBUG|412 WARN|3 ERROR|1 看起来主要都是 TRACE, 立即禁止了...
显示更多
0
9
121
17
转发到社区
看到 Redis 的作者 X 上发声,说总有人反复说中国的模型是蒸馏出来的,是根本不懂机器学习。 之前看到有人说中国的模型是蒸馏出来的我还都会辩驳一番,后来实在是见到太多了,累了不想说了,干脆写出来算了。 很多人说蒸馏其实根本不知道蒸馏是什么,他们背后的意思可能是收集了大量的 Claude/ChatGPT 的对话就能让自己的模型能力也变成和 Claude/ChatGPT 一样,但根本没考虑技术上的可行性。 举个图像识别的例子,如果有一个模型可以识别动物,我想把它蒸馏到我自己的模型。如果我只是拿图片和老师模型分类结果给到学生模型,那这个蒸馏毫无意义。因为这和我直接拿标注好的样本进行训练没有区别,甚至标注结果比老师模型更准确,用老师模型的结果反而会降低准确性。 如果老师模型的分类结果对蒸馏没有意义,那什么对蒸馏有意义?有意义的是最终结果前一层各个分类的权重。例如分类识别结果是猫,那前一层可能是猫的概率 80%,老虎概率 5%,豹子概率 7%,狗概率 0% ...,这一层其实才是模型的预测概率分布,是学生模型要学的。因为这里面比最后一个单一的结果包含了更多的隐含信息,比如猫和豹子更像,和狗更不像,这个更接近真实世界的概率分布。 在 LLM 里也是类似的,看似 LLM 是生成下一个 Token,其实生成的是下一个 Token 的一个概率分布。本质上 LLM 的参数是固定的,那么同样的输入,对应输出也是固定的。现在之所以每次对话生成都不一样,是因为在输出的时候并不是选择概率最大的那个 Token,而是在一定概率范围内随机挑一个 Token 导致的输出随机性。这也就是 Temperature, Top-k 这些参数干的事情,调整最后的概率分布,增加输出的随机性。 所以只是收集 Claude/ChatGPT 的大量对话输出并没有办法做严格意义的蒸馏,因为无法获得概率分布的信息,也就没有办法让模型快速收敛到 Claude/ChatGPT 的样子。 那么用这些对话输出做 SFT 呢,蒸馏概念扩张后也有人把这一类叫做语料蒸馏。理论上是可以的,但是 SFT 通常作用是把语言风格和偏好进行对齐,一般认为 SFT 会牺牲大模型本身的泛化能力和智能水平,变得更像一个专业模型,我个人倾向于认为这种方式无法让模型获得能力上的提升。 再有一种可能就是把这些对话内容直接作为预训练语料的一部分。在现有的模型论文里也可以看到预训练的时候已经开始使用生成数据了。但是一般认为这种工具调用和 agent 能力需要通过大规模的 RL 才能激发出来,在预训练阶段能发挥多大作用我比较怀疑。而且预训练其实更需要通用的能力,不可能让大量生成数据污染整体的数据质量。我个人倾向猜测预训练阶段会有一部分从 Claude/ChatGPT 来的数据,甚至很难避免,因为他们已经大量成为这个世界数据的一部分了,但靠这个是远远无法实现类似的编码和 agent 能力的。 你看别人只是说一句模型蒸馏,我要费那么大劲去解释,真的是不想再说了。
显示更多
0
10
53
4
转发到社区
🚨 一家卖二手手机的破公司 $INHD,蹭了个 300 万美金的 AI 项目,股价直接飞了 3,660%。 我的判断: 这不叫投资。这叫 看见“AI”两个字就冲。 300 万美金的合同,在一家上市公司层面连个水花都算不上。结果呢?市值翻了几十倍。 你说这不是泡沫?那什么是泡沫?非要等到归零了才承认吗? 📌 狂欢的时候,没人觉得自己在裸泳。但水退了之后,第一个冻死的就是这种人。
显示更多
天哪天哪天哪,Gemini 这次真的炸了 😳😳 🚨 Gemini Omni:全新视频模型 这是首个生成结果,看看它的文字连贯性。如果这都不是视频领域的 “Nano Banana 时刻”,那什么才是??
显示更多
自媒体里所有暴露出来的问题,其实都是你人生卡点。做不了的不是内容,是人很难去面对和思考自己的人生问题,因为这是对自己的全盘否定。 有人说我疯了。 在评论区免费帮人看号,坚持了一年多。看号这件事在行业里是收费业务,别人最多坚持一个月。他说他怀疑我是不是在修行。 说实话,被他说中了。 我一直觉得做自媒体本身就是一场修行。为什么?因为你在自媒体里暴露出来的所有问题,其实都是你人生卡点被放大了。 你不敢出镜,不是出镜的问题,是你不敢面对自己。你不知道拍什么,不是选题的问题,是你没有认真生活。你数据焦虑,不是流量的问题,是你没搞清楚自己到底为了什么在做这件事。 懂吗?自媒体就像一面放大镜,你人生里那些逃避的、含糊的、没解决的东西,在这里全都会暴露出来。 所以很多博主会卡住。 我观察到一个现象。很多百万粉丝的博主开小号,没什么流量。三个月涨几十万粉的人,后来也没流量了。甚至有些头部矩阵的小号,大多数也是死的。 我自己也一样,2个多月做到小红书5万粉丝,可卡在5万多已经10个月了。 那到底为什么呢?按理说这些人不缺创作技术啊。 你想想看,就像一个最强王者玩家开小号去青铜组炸鱼塘,一开始确实容易有流量。但你数据变好之后,平台很快就会把你扔进一个和你实力相当的匹配池。然后你又会卡住。而小号往往很难超过大号。 这说明什么?爆发式增长是有时机的。 我做过800万播放的视频,涨粉5000。也做过600万播放的视频,涨粉15万。这两个数据一对比你就知道,粉丝量这个东西真的不可控,时运也不可测。 所以每天思考这些问题给我最大的体会就是粉丝量不重要。 那什么重要? 就是不断完善自己的各方面能力,从而持续提供价值给粉丝和平台。 但这件事非常难,99%的人是熬不住的。 那问题来了,为什么有些人能熬住? 我告诉你,不是因为他们能"坚持"。所有真的能坚持下来的事情,背后一定有一个收益在驱动。这个收益不一定是钱,而是一种即使没有钱,你都能很享受去做的驱动力。 就像我免费看号这件事。别人问我你怎么能坚持一年?说实话我没有在坚持。同样一件事,一个人是带着痛苦在做,一个人是像玩游戏一样在做,那在情绪和能量上完全不同。 而我不是做了这件事之后才有这种感觉,是我先找到一件让我有这种感觉的事,然后去做了。 所以不存在"坚持"这两个字。 如果你在做的事情让你觉得很痛苦,你不是"做不了",而是你还没找到那个让你享受的点。这就是为什么它是修行,你需要去找到自己真正的驱动力在哪。 当每个人都找到这样的一件事,至少在这件事上,你已经没有对手了。因为别人都在"坚持",而你在享受。随着时间的堆叠,这就会变成你的护城河。 那一件非常难、别人又熬不住的事情,恰恰是一件非常值得去做的事情。 所以别焦虑粉丝涨不动,别焦虑数据不好看。问自己一个问题就够了:你在享受这件事吗? 如果答案是"是",那就别停。时间会给你答案。 如果答案是"不是",那别硬撑。去找到那个让你有驱动力的事,或者找到那个必须得做的理由,找到了再回来,你会发现一切都不一样了。
显示更多
在构建企业 AI Agent 的时候,工作上下文(Context)是不可或缺的元素,那什么是好的 Context,又如何构建好的 Context? 好的 Context,是一套能让 AI 理解“此刻该如何行动”的组织记忆系统,它至少包含四层: 1)情境记忆。也就是发生过什么、谁说过什么、在哪个时间点做过什么决定。这对应 Endel Tulving 在 1972 年提出的 episodic memory,对具体事件和经历的记忆。对企业来说,聊天、会议、文档、项目流、审批、工单,都是情境记忆。它的价值在于保留现场,让 AI 在面对结论时,同时能够理解当时的路径和判断过程。 2)语义记忆。也就是从大量情境中抽象出来的稳定知识,例如规则、术语、流程、产品定义、组织共识、经验方法。Tulving 把 semantic memory 作为一种不依赖具体经历的知识系统。知识库真正产生价值的地方,在于把零散材料逐渐沉淀成可以反复使用的结构。 3)程序化记忆。也就是“遇到某类问题应该怎么做”。后续的记忆研究中,procedural memory 常被单独拿出来看。映射到 AI 系统里,就是 SOP、模板、工作流、工具调用策略、Agent Skill。它会直接影响系统停留在建议层,还是能够进一步进入执行层。 4)工作记忆。也就是当前任务窗口里,AI 临时需要的那一小块高相关信息。像 MemGPT 这样的工作,会把 LLM 的上下文窗口当成一种稀缺资源,通过分层管理来调用更大的长期记忆。这个视角很关键,Context 的核心在匹配程度,是否刚好支撑当前任务。 那 Context 如何被有效地组织起来,让它变成真正有价值的 Agent 语料呢?不同的场景,需要不同的处理策略。 例如在复杂项目推进、多人协作决策、跨周期目标管理中,对上下文的处理,适用于递归式记忆蒸馏与回注机制(Recursive Distillation & Grounding)。在认知科学里,它更像是从情境记忆不断压缩到语义记忆,再反向投射回情境的一种循环。 它有两个同时发生的动作:1)一条是向上抽象,日报 → 周报 → 月报,本质是在做信息压缩,把大量具体事件提炼成模式、趋势和判断;2)另一条是向下穿透,周报和月报反过来影响日报,让后续记录逐渐带上结构和重点,减少无序堆积。 这两条链路形成一个闭环:经历不会直接沉没,而是不断被压缩、再利用、再强化。这和 Endel Tulving 提出的记忆转化过程是高度一致的:经历会逐渐抽象为知识,知识也会进一步参与后续行为的生成。 类似的探索,在工作场景中,还有一些常见的组织模式: 1)情境重构机制(Context Reframing),适用于问题推进卡住、讨论反复震荡的阶段。很多时候限制来自问题所处的框架本身。通过调整问题的边界、目标或观察视角,再把已有记录重新放进去看,会发现原本难以推进的讨论开始出现新的路径。同一批信息,在不同结构下会导向完全不同的判断,这种能力更像是在主动切换解空间。 2)记忆遗忘与权重衰减机制(Forgetting & Decay),适用于信息持续累积、系统开始变慢或噪声变多的阶段。信息如果被一视同仁地保留,会逐渐拖慢判断节奏。更有效的方式,是让信息在使用中自然分层,低频、过期、无效的内容逐渐退出核心上下文,高频被引用、对关键决策有贡献的内容则持续被强化。时间拉长之后,系统会变得更轻,也更准。 3)任务驱动的 Context 编排机制(Context Assembly),适用于多任务并行或 AI 执行复杂流程的场景。上下文围绕当前目标展开,挑选出最相关的一小部分信息,并按照任务需要组织起来。不同任务对应不同的上下文切片,这种按需组装的方式,可以在有限空间内保持信息的高相关性,让执行过程更稳定,也更可控。 Context 是生长出来的,需要逐步清洗、过滤和沉淀,形成对个体和团队分别有效的上下文。 从当下开始,去构建自己工作/生活/学习的上下文,逐步让 AI 进来参与决策,AI 会帮助我们慢慢沉淀出一套稳定的认知结构,直接影响判断的质量与方向。 或许,这也是让自己从繁琐的事务中解脱出来的必要路径。😄
显示更多
0
17
539
95
转发到社区
如何找到一个好的研究方向,这对于研究生和博士生来说,是一件极其重要的事情,当然也包含在工业界从事学术和技术研究的人。它直接影响了研究产物的交付品质。 那什么样的研究才算“有价值”?又该如何让它的价值足够大?可以从三个角度来看。 1)创新性,说的直白一点,就是开脑洞。ResNet 开了一个“残差连接”的脑洞,Transformer 开了一个“注意力即一切”的脑洞,ViT 开了一个“把视觉当成语言建模”的脑洞。开脑洞也叫“挖坑”,只要坑挖得够大,填坑的事情完全可以交给别人。Transformer 论文的引用量达到十万之巨,可以想象有多少人进来“填坑”。 2)有效性,即学术或工业价值。好的研究必须能“跑得通”,不仅概念上新颖,还要在实验中奏效、在工程上落地。很多论文提出漂亮的理论,但没有可复现的结果,也没有能被行业采纳的路径,这样的创新是空中楼阁。 3)问题规模,它决定了研究的“杠杆”。如果问题只是微调参数、改良细节,那么影响力往往局限在局部最优;而当研究直击底层约束、改变范式,它的能量就能跨越领域。 好的研究方向,是在世界的噪音中找到一个“尚未被解答的确定性”,并用一套可验证的逻辑,让它从思想变成现实。
显示更多
0
2
80
15
转发到社区
自慰的时候总会有那什么一瞬间大腿紧绷 #mcbxshi_cos# #米醋必修四#
0
29
1.5K
47
转发到社区