搜索 flash模型相关的推文与用户

11hours ago

给大家带来 Flash 系列模型横评! 各个厂商除了旗舰级别模型, 也都有Flash级别的模型, 而这些模型的定位主要都是多智能体系统的驱动模型和RAG系统的驱动模型. 那么现有这些Flash模型应该怎么选? 给大家带来本篇评测! 本次主要从 Agent Loop 迭代能力, Agent 能力, 前端, 后端, 空间理解, 美学, 性价比等多个角度评测了 Gemini-3.5-Flash, Step-3.7-Flash, DeepSeek-V4-Flash 这三个模型. 从测试来看, Gemini-3.5-Flash 更适合干"漂亮活", 比如前端页面, 建模等. 而 Step-3.7-Flash 则极具性价比, 在Agent测试中取得了比旗舰模型还要高的Token效率(用最少的token干最多的事情). 所以特别适合用在Agent框架中(比如OpenClaw或者Hermes), 或者复杂的Agent系统中用来做驱动模型. DeepSeek-V4-Flash 则后端能力很不错, 很适合用来写脚本, 甚至给服务器安装一个 DeepSeek-V4-Flash 驱动的 ClaudeCode, 用来 AI-Ops. #flash模型# #step37flash# #deepseekv4flash# #gemini35flash# #AgentLoop#

显示更多

0

10

0

转发到社区

B.AI@BAI_AGI

2026.05.23 13:28

📢 DeepSeek-V4-Pro, DeepSeek-V4-Flash & Gemini 3 Flash Service Upgrade & Maintenance Notice To ensure greater stability for model services, we are currently performing upgrade and maintenance work on the service infrastructure of DeepSeek-V4-Pro, DeepSeek-V4-Flash, and Gemini 3 Flash. During this period, DeepSeek-V4-Pro, DeepSeek-V4-Flash, and Gemini 3 Flash may be temporarily unavailable or experience occasional request failures. Relevant maintenance notices will be displayed on the model pages, and you may continue switching to and using other available models without interruption. Once the upgrade is completed, related services will be restored ASAP. Thank you for your understanding and continued support! 📢 DeepSeek-V4-Pro、DeepSeek-V4-Flash 和 Gemini 3 Flash 模型服务升级维护通知为保障模型调用稳定性，平台正对 DeepSeek-V4-Pro、DeepSeek-V4-Flash 和 Gemini 3 Flash 模型服务链路进行升级维护。在此期间，DeepSeek-V4-Pro、DeepSeek-V4-Flash 和 Gemini 3 Flash 可能会暂时不可用，或出现调用失败等情况。页面对于正在维护的模型有相关提示，您可正常切换使用其他可用模型。升级完成后，我们将第一时间恢复相关服务。感谢大家的理解与支持！

显示更多

0

6

14

3

转发到社区

余温@gkxspace

2026.05.20 13:04

我每月 AI 订阅两三千，其中有些是TTS、ASR之类的，主流的几家都挺贵，API协议也都不一样我一直在想有没有可以一个套餐做到：语音复刻、会议转写、AI 播客生成、实时语音问答、语音输入、写代码可算找到了一个活菩萨，阶跃星辰的 Step Plan，一个月6.99美金，根本用不完，就这样，我把其他的陆续停了。一个订阅里有各类模型，还都是 TOP级： 1、LLM：Step 3.5 Flash，模型延迟低到离谱，也可以接入Claude / Cursor / Cline 2、TTS：stepaudio-2.5-tts(查了一下，排名比 ElevenLabs 高) 3、ASR：实时语音对话,支持音色复刻 4、生图：文生图 + 图像编辑，0.7 秒出图全部 OpenAI SDK 直连，换一行 base_url。下面给大家一些案例吧（详情放评论区）： 1、英文录音 → 54 秒出中文笔记 2、英文长文 → 双人对谈 mp3 通勤听 3、同一段话 → TTS 演 7 种情绪 4、鲁迅《孔乙己》→ 自动拆角色的有声书 5、英文播客 → 端到端中文重制版 @StepFun_ai

显示更多

0

11

29

6

转发到社区

爆幣貓BaoBiCat🌊RIVER🐬TermMax@Wayne_1175

2026.05.20 07:41

昨天 Gemini 更新了！新增了 Gemini 3.5 Flash 模型，我還沒用多久感受不到差異，只希望降智的問題可以少點。之前的簡直快變人工智障，給個任務就跑出個： "我只是個語言模型，無法做到這件事"這是搞笑嗎😐？而且Gem 有時候也不依照指示運作，整個氣死人比較有亮點的是本次 Gemini Spark 。據說是 google 版本的龍蝦，24 小時不間斷的個人助理。顯然 agent 浪潮也才剛開始，是兵家必爭的版圖。目前還沒上線到時再看看吧。然後是用量限制，過去系統只計算你發送了幾次訊息，現在系統改為即時計算該次對話扣除算力％，評估維度包含： 1⃣prompt複雜度：大量code、長文本，消耗算力較高 2⃣上下文長度：累積的對話越來越長，每次互動需要重新讀取的 Token 越多，算力消耗就越快。 3⃣進階功能：用 Deep Research、Pro 模型，或是生成高畫質圖像時，算力會被加速扣除。採用5 小時滾動重設 + 每周上限。簡單來說就是採用 claude 那套，繼 github copilot 後又一個抄作業的其實吧我個人最滿意的是這次的 ui 更新。手機版和電腦版的都挺舒服的🥰 雖然 gemini 最近一直被噴降智，但奈何人家有強大的生態護城河啊。這可是從網路時代一路打下來的龐大江山，背後有礦就是任性 #ai# #gemini#

显示更多

0

13

12

0

转发到社区

Gorden Sun@Gorden_Sun

2026.05.20 07:36

简评Google I/O 2026 Gemini Omni：容易被低估的模型。如果你只看现在已发布的Gemini Omni Flash模型，会觉得这个视频模型很垃圾，完全比不上Seedance 2.0，我一开始也是这么觉得的。实际这个模型就不是视频模型，而是any2any的世界模型。 Gemini Omni未来的形态是：支持文本、图片、视频、语音输入，支持输出文本、图片、视频、语音。只是目前发布的版本是输出视频。你可能会说豆包现在不就支持吗？豆包是有个Agent来调用不同的LLM模型、语音模型、图片模型、视频模型来分别生成对应形式的回复，各个模型是割裂的。世界模型能同时理解和输出所有形态的内容，实现难度要大的多的多。 Gemini 3.5 Flash：Gemini 3.1 Pro的能力，超快的生成速度，比GPT 5.5快4倍。但总体我觉得不行，快不是快，好才是快。Gemini 3.5 Flash就是傻快傻快的。 Antigravity 2.0：跟Codex一模一样了，里面的Gemini 3.5 Flash还要更快，比GPT 5.5快12倍。不过无所谓了，我用Antigravity也只是为了用里面的Opus。 Gemini Spark：实时在线的云端Agent。谷歌给你启用一台云端虚拟机，有Harness环境，在云上可以全天执行任务。你可以认为是给了你一个云端运行的龙虾。 Search in the agentic era：AI时代的搜索，由Gemini 3.5 Flash驱动，支持多模态信息输入来搜索，支持Agent持续监控要搜索的信息，支持生成交互式UI和信息图。人工手动搜索可以变成AI持续监控并推送新消息给你，这个比较有用。交互式UI和信息图如果能做成Claude里的水平，也会改变搜索模式，会影响后面展示的网页的点击人数。 Ask YouTube：搜索YouTube视频，并且能根据你的问题直接跳到视频中相关的时刻，省去了手动拖进度条。有用，自家产品集成AI，其他AI做不到。 Voice-powered Docs Live：语音编辑文档。鸡肋，跟我语音输入法让AI写文档差别不大。第8代TPU：针对训练和推理场景，分别设计了架构，训练芯片叫TPU 8t，推理芯片叫TPU 8i。顶流芯片，英伟达真正的竞品。 SynthID：AI生成内容的隐水印。AI生成的图片和视频越来越难分别出来，有这个隐水印，把视频和图片发给AI，AI就能告诉这个图片是不是AI生成的。亟需推广，目前OpenAI、Kakao 和 Eleven Labs也开始采用谷歌的SynthID。

显示更多

0

4

2

0

转发到社区

Gorden Sun@Gorden_Sun

2026.05.20 06:42

错怪Gemini Omni了如果你只看现在已发布的Gemini Omni Flash模型，会觉得这个视频模型很垃圾，完全比不上Seedance 2.0，我一开始也是这么觉得的。实际这个模型就不是视频模型，而是any2any的世界模型。 Gemini Omni未来的形态是：支持文本、图片、视频、语音输入，支持输出文本、图片、视频、语音。只是目前发布的版本是输出视频。你可能会说豆包现在不就支持吗？豆包是有个Agent来调用不同的LLM模型、语音模型、图片模型、视频模型来分别生成对应形式的回复，各个模型是割裂的。世界模型能同时理解和输出所有形态的内容，实现难度要大的多的多。

显示更多

0

17

57

0

转发到社区

ahhhhfs@abskoop

2026.06.16 11:46

每次查 DeepSeek 消耗都要去网页端翻账本太麻烦？🥲 试试这款开源的 Windows 桌面小工具：DeepSeekMonitorWindows 能帮你直接在系统托盘可查看 DeepSeek API 余额、当月消费、Token 用量和 7 天趋势，支持官方余额接口 + 网页 Token 同步（V4 Flash/Pro 模型细分 + 缓存命中率）适合经常跑脚本、接自动化流程、需要关注调用成本的开发者

显示更多

0

5

6

3

转发到社区

穆尼@MooenyChu

2025.03.14 06:11

玩了下Gemini 2.0 Flash Experimental模型直达地址：出来的图片不是很满意，又用平替软件image-fx重新做图，两者结合能出来一致性的故事内容，如果需要变成视频，用即梦里面的图片生成视频+分镜描述就可以。重点是都免费，可以无限制生成，做做还蛮费时间的

显示更多

0

12

49

9

转发到社区

sukie@sukie234

2026.06.20 07:52

你买的 GLM-5.2,可能根本不是 GLM-5.2 最近我们把市面上多家中转站正在卖的 "GLM-5.2” 测了一遍。结果大部分都不是GLM -5.2。我们见到的几种常见掺假手法: 1. 换皮是最常见的。就是把一个更便宜的大模型,贴上 "GLM-5.2 / glm-5-2" 的标在卖，因为目前GLM - 5.2 货源很紧张，所以价格非常低的，这个测出来大部分就是dsv4flash。 2. 虚标上下文。 GLM-5.2 官方标的是 100 万(1M)token 上下文。但很多渠道,你真往里塞 25 万、30 万 token,要么直接超时报错,要么前后文明显遗忘、截断。 3. 缩水 / 量化。这种就是中转站给你压缩了，测试的时候跑分很好看，但是真上长程任务、多文件重构就露原形。 4. 只展示 min 价 + 动态路由。价格页挂一个漂亮的最低价,实际请求被悄悄路由到更差、更便宜的后端。你看到的价,和你拿到的模型,是两回事。二、实测全过程，方便大家去检测：我们拿到一个号称 "GLM-5.2"、价格低到离谱(约官方价 1/20)的渠道，这个渠道低到连电费都赚不回来，所以我就觉得很蹊跷，一步步扒: 首先看价格,起疑。它标价约 $0.07 / 百万输入、$0.22 / 百万输出。这个价,连官方 GLM-5.2 的零头都不到。一个按官方原价拿货的授权 reseller,根本做不出这个价。价格反常,是第一个危险信号。第 1 步:列模型、起一个最简单的调用。接口能通,返回里 model 字段确实写着 "glm-5.2"。但"返回里写 glm"只能说明它给你贴了这个标,说明不了它到底是什么，有可能是glm上一代模型，甚至拿dsv4flash给你凑数。第 2 步:身份探测。我们用不同问法,连问它五遍"你是什么模型、哪家公司训练的"。结果五次里有四次,它自报是 DeepSeek 系模型(DeepSeek-V3 / R1),其中一次还明确说"我不是 GLM、不是智谱"。名字能改,身份认知改不掉。第一个实锤:它根本不是 GLM。第 3 步:上下文硬测。我们做了两层测试。先在一篇约 25 万 token 的长文里埋一串随机暗号,结尾再问它,它准确召回。但是在长文里埋五条互相依赖的事实(A 等于 7,B 等于 A 的三倍,C 等于 B 加 8,以此类推),要它跨段把最终值算出来,它给出了完全正确的链式结果。这一步很关键，单点召回也许能靠"检索作弊"蒙混,但跨段整合做不了假,说明它是真把 25 万 token 吃进去在做推理。结论:它不是小模型，而且上下文比 GLM-5.1 的 20 万还大，结果是deepseek系。第 4步:终极对照实验(决定性)。我们直接拿官方 DeepSeek 的 API(里面正好有 deepseek-v4-flash 这个正版模型),和这个 "glm-5-2" 做指纹比对:用同一批 temperature=0 的确定性提示词,两边同时打,逐条比对输出。结果: • 同一道"讲个程序员笑话",两边逐字一模一样; • 同一道"你是 V3 还是 V4",两边都答 "unsure"; • 连"认不出自己、自报成旧版 DeepSeek-V3"这个毛病,官方 v4-flash 和这个 "glm-5-2" 都一样犯。也就是说:官方正版 DeepSeek-V4-Flash 的种种指纹,这个 "GLM-5.2" 全对得上。实锤收工:这个所谓的 "GLM-5.2",就是 DeepSeek-V4-Flash 贴了智谱的标在卖。它不是缩水的 GLM,它压根不是 GLM。总结：身份探测: 同一问题问三到五遍,看它回答是否稳定、是否对得上官方规格,有没有自报成别家模型。上下文硬测: 埋暗号,再埋几条互相依赖的事实,顶到 25 万 token 以上,看它吃不吃得下、能不能跨段算对。吃不下或答错,就不是满血。指纹比对: 同一个 temperature=0 提示词,把"待测渠道"和"官方原厂"的输出摆一起比。高度一致就是同一个模型,对不上就是两个东西。经济常识: 官方满血卖到官方价 1/20,经济上根本不成立。价格低到离谱的"满血",基本可以直接判死。

显示更多

0

27

30

2

转发到社区

少个分号@shaogefenhao

2026.06.17 14:54

最近把 E2E 搭建好，AI 会自动创建 E2E 测试用例然后完成开发和调试，一次性通过验收。昨天团队上做了一个需求，AI 端到端完成了，一次通过验收，都被震撼了。还只是用的 DeepSeek V4 Flash 这种便宜模型。

显示更多

0

3

40

3

转发到社区

与「flash模型」相关的搜索结果