注册并分享邀请链接,可获得视频播放与邀请奖励。

sukie 的个人资料封面
sukie 的头像

sukie (@sukie234)

@sukie234
AI交流群:
7.2K 正在关注    36.6K 粉丝
本人不想再听到任何关于 美光、半导体、大语言模型、LLM、三星、海力士、ChatGPT、编程、Agent、Codex、Claude Code、CUDA、GPU、H100、B200、台积电、ASML、NVIDIA、黄仁勋、OpenAI、Anthropic、Gemini、Grok、DeepSeek、Qwen、、Transformer、Prompt、Token、Inference、API、Copilot、Cursor、Docker、Kubernetes、Linux、云计算、算力、A100、服务器、机房、晶圆、EUV、HBM、DDR5、量化、蒸馏、多模态、Scaling Law、AI融资、Benchmark、Stable Diffusion、Midjourney、AI视频生成、自动驾驶、机器人、SpaceX、硅谷、科技股、纳斯达克、英伟达市值、马斯克的相关内容了。
显示更多
0
34
88
6
转发到社区
你买的 GLM-5.2,可能根本不是 GLM-5.2 最近我们把市面上多家中转站正在卖的 "GLM-5.2” 测了一遍。结果大部分都不是GLM -5.2。 我们见到的几种常见掺假手法: 1. 换皮是最常见的。 就是把一个更便宜的大模型,贴上 "GLM-5.2 / glm-5-2" 的标在卖,因为目前GLM - 5.2 货源很紧张,所以价格非常低的,这个测出来大部分就是dsv4flash。 2. 虚标上下文。 GLM-5.2 官方标的是 100 万(1M)token 上下文。但很多渠道,你真往里塞 25 万、30 万 token,要么直接超时报错,要么前后文明显遗忘、截断。 3. 缩水 / 量化。 这种就是中转站给你压缩了,测试的时候跑分很好看,但是真上长程任务、多文件重构就露原形。 4. 只展示 min 价 + 动态路由。 价格页挂一个漂亮的最低价,实际请求被悄悄路由到更差、更便宜的后端。你看到的价,和你拿到的模型,是两回事。 二、实测全过程,方便大家去检测: 我们拿到一个号称 "GLM-5.2"、价格低到离谱(约官方价 1/20)的渠道,这个渠道低到连电费都赚不回来,所以我就觉得很蹊跷,一步步扒: 首先看价格,起疑。 它标价约 $0.07 / 百万输入、$0.22 / 百万输出。这个价,连官方 GLM-5.2 的零头都不到。 一个按官方原价拿货的授权 reseller,根本做不出这个价。价格反常,是第一个危险信号。 第 1 步:列模型、起一个最简单的调用。 接口能通,返回里 model 字段确实写着 "glm-5.2"。但"返回里写 glm"只能说明它给你贴了这个标,说明不了它到底是什么,有可能是glm上一代模型,甚至拿dsv4flash给你凑数。 第 2 步:身份探测。 我们用不同问法,连问它五遍"你是什么模型、哪家公司训练的"。 结果五次里有四次,它自报是 DeepSeek 系模型(DeepSeek-V3 / R1),其中一次还明确说"我不是 GLM、不是智谱"。名字能改,身份认知改不掉。第一个实锤:它根本不是 GLM。 第 3 步:上下文硬测。 我们做了两层测试。先在一篇约 25 万 token 的长文里埋一串随机暗号,结尾再问它,它准确召回。 但是在长文里埋五条互相依赖的事实(A 等于 7,B 等于 A 的三倍,C 等于 B 加 8,以此类推),要它跨段把最终值算出来,它给出了完全正确的链式结果。 这一步很关键,单点召回也许能靠"检索作弊"蒙混,但跨段整合做不了假,说明它是真把 25 万 token 吃进去在做推理。 结论:它不是小模型,而且上下文比 GLM-5.1 的 20 万还大,结果是deepseek系。 第 4步:终极对照实验(决定性)。 我们直接拿官方 DeepSeek 的 API(里面正好有 deepseek-v4-flash 这个正版模型),和这个 "glm-5-2" 做指纹比对:用同一批 temperature=0 的确定性提示词,两边同时打,逐条比对输出。结果: • 同一道"讲个程序员笑话",两边逐字一模一样; • 同一道"你是 V3 还是 V4",两边都答 "unsure"; • 连"认不出自己、自报成旧版 DeepSeek-V3"这个毛病,官方 v4-flash 和这个 "glm-5-2" 都一样犯。 也就是说:官方正版 DeepSeek-V4-Flash 的种种指纹,这个 "GLM-5.2" 全对得上。实锤收工:这个所谓的 "GLM-5.2",就是 DeepSeek-V4-Flash 贴了智谱的标在卖。它不是缩水的 GLM,它压根不是 GLM。 总结: 身份探测: 同一问题问三到五遍,看它回答是否稳定、是否对得上官方规格,有没有自报成别家模型。 上下文硬测: 埋暗号,再埋几条互相依赖的事实,顶到 25 万 token 以上,看它吃不吃得下、能不能跨段算对。吃不下或答错,就不是满血。 指纹比对: 同一个 temperature=0 提示词,把"待测渠道"和"官方原厂"的输出摆一起比。高度一致就是同一个模型,对不上就是两个东西。 经济常识: 官方满血卖到官方价 1/20,经济上根本不成立。价格低到离谱的"满血",基本可以直接判死。
显示更多
0
27
30
2
转发到社区
湾区娇妻这个群体接触过之后的感觉就是非常可悲,非常活在梦里的一个群体。 误以为老公的光环就是自己的光环,既脱不下长衫丢不掉体面,又非常缺失自我价值的锚点,但又不肯真的脚踏实地努力,所以往往非常缺情绪价值,自我内耗严重,然后产生一些离谱的情绪勒索行为,不管是发小红书求夸夸,还是抱团取暖,折磨身边人。 我回想起多年前在一门叫做女性学的课程上老师说的话,这个社会所有对女性的优待,都是裹着天鹅绒布的铁拳。 简单通过婚姻就能共享了另一半通过家庭托举+极致聪明+内卷获得的成就吗? 女性的价值感应该建立在配偶的职业收入学历背景工作光环吗? 如果一个女性从小被鼓励把婚姻作为主要的人生路径,那么她获得了一些短期收益经济保障、社会认可、生活便利) ,但同时也承担了更大的风险: 议价能力依赖伴侣 身份认同依赖另一半的给予 缺乏独立的价值来源 这种交换未必是每个人都会后悔的,但确实存在结构性风险。 一个人嫁给顶尖工程师,不会因此自动拥有顶尖工程师的技术能力;嫁给成功创业者,也不会自动拥有创业能力。嫁给任何人都不会共享他的成长经历和内在价值感,只会共享不属于自己等级的焦虑和压力。
显示更多
0
105
373
24
转发到社区
运营中转站这段时间是真没赚到钱,只能说勉强cover了我自己用ai的消费。 所以目前打算把开中转站的一切全部开源,包含如何建站+营销,门槛最低,让这个行业更卷一点。 首先整个系统由3个部分组成: • 第CN2 回国专线服务器:放在海外但回国速度极快的 VPS,作为运行核心。 • sub2api:核心程序,负责把网页账号转成 API 接口。 • Cloudflare:把流量再绕一道,提升国内访问速度,同时隐藏真实服务器 IP。 你需要准备: • 一台 CN2 GIA 或 CN2 GT 线路的海外 VPS(推荐配置:2 核 CPU、2GB 内存、20GB 硬盘以上)。 普通海外 VPS 在国内晚高峰几乎不可用,而 CN2 GIA 通过专线绕开了拥堵的公网节点,国内访问延迟一般在 150ms 以内。如果你买了不是 CN2 的服务器,国内用户体验会非常糟糕。 • 一个域名(建议在 Cloudflare 或 Namecheap 上购买,便宜的 .top 或 .xyz 也行,几块钱一年)。 • 一个 Cloudflare 账号(免费)。 • 号池:初期可以用 claude code pro 账户+ 注册大量gpt账户,货比三家去找到别的号商卡商,等后期你就可以搞claude code max kiro 反代 aws bedrock(去跟sales聊,基本能搞到7.2折),但是初期只需要保障claude code pro账号稳定即可,因为你需要养号,后期转max。 完整请求路径如下: 国内用户的客户端 → 解析到 Cloudflare 的 IP → Cloudflare 边缘节点 → CN2 专线回源到你的服务器 → 宝塔面板的 Nginx 反向代理 → sub2api 程序 → 你的号池 → ChatGPT 或 Claude 网页 → 数据原路返回。 购买并初始化CN2服务商 CN2 GIA 线路的常见服务商有 BandwagonHost(搬瓦工)、RackNerd、CloudCone、Lisahost。新手推荐搬瓦工的 CN2 GIA-E 套餐,稳定但价格略贵。预算紧的可以看 Lisahost 的香港 CN2 套餐。 如果你懂命令行搭建Nginx,手动部署SSL证书,那你就自己搞,如果你不懂可以使用中国程序员流行的宝塔面板,一键搭建Nginx、一键部署SSL证书、可视化配置反向代理,全程鼠标点击操作,新手也能轻松上手。 安装完Linux + Nginx + MySQL + PHP,就可以开始设置防火墙,够买域名,添加DNS解析。 最后去命令行输入ping.api.你购买的域名,返回服务器ip就行了。 搭建sub2api: sub2api 是一个开源项目,可以把 ChatGPT 网页版、Claude 网页版的 cookie 或者 session 转换成 OpenAI 兼容的 API 接口。 打开sub2api的官方教程,安装流程安装docker,拉取并启动sub2api的容器。 你需要把号池数据放到 /www/sub2api/data 目录下,sub2api 容器会读取这个目录。具体格式参考 sub2api 项目文档。 设置Nginx反向代理 添加完之后目标url是127.0.0.1:8080因为 sub2api 容器监听的就是这个地址。Nginx 收到外部请求后,转给本机的 8080 端口,sub2api 处理完返回给 Nginx,Nginx 再发回给用户。 后面你去问claude code 如何优化Nginx的配置,AI API 调用是流式响应(SSE),需要长连接 + 不缓存才能正常工作。默认 Nginx 配置在这种场景下会出问题,按照claude的提示优化,proxy_buffering 必须关闭,如果不关闭这个,AI 的回答会"卡一阵 → 一次性吐出",而不是逐字流式输出。客户端会感觉非常慢甚至超时。 申请HTTPS证书: OpenAI 兼容客户端基本只信任 HTTPS。HTTP 明文会暴露 API Key 给中间网络。 申请好Let's Encrypt证书之后,回到 SSL 主界面,把"强制 HTTPS"开关打开。 优化Cloudflare配置 测试HTTPS-开启cloudflare代理-Cloudflare SSL 模式必须设为 Full (strict) AI API 是动态接口,Cloudflare 的某些"优化"会破坏流式响应。 Cloudflare → 你的域名 → 速度 → 优化。 全部关掉以下选项: • Auto Minify(自动压缩 HTML/CSS/JS):关闭。 • Rocket Loader:关闭。 • Mirage:关闭。 • Polish:关闭。 设置缓存规则: Cloudflare → 缓存 → 配置。 Caching Level 选 Bypass,或者保持 Standard 但是后面用页面规则覆盖。 更彻底的做法:Cloudflare → 规则 → 页面规则 → 创建页面规则。 URL 模式: 设置:Cache Level = Bypass 设置防火墙规 Cloudflare → 安全性 → WAF → 自定义规则 → 创建规则。 规则一:限制单个 IP 频率 字段:IP source address,操作:Rate limiting,每 10 秒最多 30 次请求,超出后挑战或屏蔽 1 小时。 规则二:屏蔽明显恶意爬虫 字段:User Agent,运算符:包含,值:python-requests 启用 Cloudflare Argo Smart Routing,每月 5 美元,能在 Cloudflare 内部用最优路径路由你的流量。对国内用户访问海外服务器有 30% 到 50% 的速度提升。预算够推荐开。 测试上线 用 curl 测试 API,或者打开 CherryStudio 或 ChatBox,填写你的api地址和key做测试 使用Prometheus/Grafana,或者直接用宝塔面板做监控,可以看到 CPU、内存、流量实时数据。如果 sub2api 容器经常吃满 CPU,考虑升级服务器配置。
显示更多
0
194
1.2K
194
转发到社区
丝芭的老板王子杰去世了 感觉猝死和心理问题去世越来越年轻化,人生只有一件事最重要,那就是保持身体健康。 没有什么值得牺牲身体
显示更多
0
10
23
0
转发到社区