注册并分享邀请链接,可获得视频播放与邀请奖励。

与「开源大模型」相关的搜索结果

开源大模型 贴吧
一个关键词就是一个贴吧,路径全站唯一。
创建贴吧
用户
未找到
包含 开源大模型 的内容
兄弟们,卧槽!!! 我直接原地傻了…… 居然有人搞出来一款能直接看懂K线交易的AI,实测胜率高达93%! 它叫 Kronos,清华团队干的,靠45家交易所120亿条真实数据从零训练,是全球首个专为金融市场生而为K线的基础大模型,不是拿通用AI瞎改的! 它能干的事太离谱了: 价格预测 波动率预判 全资产零样本直接用(币安、纽交所、纳斯达克全覆盖) 400万到49.9亿参数共4个版本,笔记本就能跑! 实测数据炸裂: 比主流时序模型准93%,比顶尖非预训练模型高87%,不用微调,拿来就用! 现在BTC实时走势演示免费开放,每小时更新! 对冲基金定制模型动辄几百万美金,彭博终端一年2.4万刀…… 而Kronos完全免费,几行Python直接调用! 白嫖党福音来了!!! 目前已在Hugging Face上架,GitHub 1.16万星标 + 2400复刻,MIT协议100%开源,还入选2026 AAAI顶会。 别手动看K线了兄弟们! 这玩意儿真的要改变交易规则了…… 快冲! GitHub搜 Kronos + Hugging Face搜 Kronos 就能白嫖! (我已经冲了,你们呢?) #Kronos# #AI交易# #开源大模型# #比特币#
显示更多
0
119
549
133
转发到社区
彻底癫了 又是行情疯癫的一天。 今天a股成交额3.6万亿,刷新了历史纪录。很多人在讨论巨额成交量意味着什么,我打个比喻,成交额差不多相当于是股市的心跳,心跳太低说明a股在睡觉或者缺乏运动,一旦a股情绪激动或者剧烈运动,心跳就会攀升,但心跳太快对身体是一种负担,像今天3.6万亿的成交额大概相当于每分钟200下的心跳,已经是超频运转,这个状态不可能一直持续的,否则会出事的。 今天市场的中位数+1.2%,其实涨的不算很多,但局部板块被资金疯狂推高,形成了高烈度的积聚效应。商业航天继续暴涨6.4%,脑机上涨5.1%,除了这两个当红炸子鸡外,还新出了一个GEO概念(生成式引擎优化)。 要解释GEO,先解释一下SEO。 我早年刚创业的时候做过互联网网站,当时为了获得免费流量,会进行专门针对搜索殷勤的优化。具体操作是给网站加一些伪原创文章,用几个账号来回对话假装讨论很热烈,另外还会找其他网站交换友情链接,目的是让搜索引擎觉得我的网站很繁荣,很有料,很体面,增加在搜索结果里的推荐权重。 这种就是SEO优化,有专门的公司做这类业务,我当初刚创业,为了省钱就自己做,效果当然不好,就是瞎搞。 知道了SEO后就知道GEO是什么了,SEO是针对搜索引擎(主要是百度)的优化,GEO就是针对AI引擎(豆包、元宝等大模型)的优化。给品牌批量写一些宣传内容,投喂到ai日常搜索的语料库里,这样ai在回答用户的提问时就会主动替品牌说好话或者进行推荐。 为什么GEO概念今天突然爆发了呢?其实还是和马斯克有关,因为他说要在7天内公布X平台(就是以前的推特)的内容推荐算法,并且以后每4个星期更新一次。 马斯克这么做是为了化解欧盟等多国监管压力,回应算法偏见、影子禁言等质疑以重建用户信任,是经营层面的选择。但传到a股这边就被解读成算法公开后,会刺激针对算法的GEO发展,至于谁来做GEO生意,暂定a股的传媒板块。 于是今天传媒+8%,顺带把影视+6.5%和游戏+6%也带飞了,因为这三个板块的个股是大量重叠的。 其实我觉得这个概念炒作是不靠谱的,首先目前只有X愿意开源,其它大模型并没有跟进,其次x在墙外,国内ip无法访问,业务关系不大。当然最重要的是就算后面有GEO产业,我也不相信a股哪些传统传媒公司能做好,没这个基因。 只是这次概念发明的太快,等不及了,直接找个以前的老登板块,戴个头套就先上去表演了。牛市的时间窗宝贵,一天都不能浪费。 我昨晚给你们说过牛市的本质,就是情绪饱满,流动性溢出,这个时候大部分的股民都处于fomo的状态,着急寻找共识板块,挣大钱,挣快钱。现在一天涨2-3%都很难满足散户的胃口了。 这种时候最容易凝聚共识的就是超级机构或者超级大v,马斯克正好就承接了这个角色,他说的话会被放大,然后映射到a股,热钱积极炒作投机。你问那些追涨停的游资大户有几个真的相信商业航天、脑机、GEO,他们根本不在乎,只要在退潮之前卖掉股票,后面就算天塌下来也无所谓了。 …… 今天有6个板块是绿的,保险、油气开采、农化制品、房地产、石油加工、煤炭开采,在这种群魔乱舞的交易日里亏钱也是够糟心的。另外像汽车、制药、银行、高速公路、养殖这些传统行业今天也涨的很少很少,这些都是本轮行情的失意者。 很多人在股吧和社区论坛上咒骂,诅咒科技板块的泡沫风险,痛骂市场不理性,其实就是没给自己的持仓抬轿。 我前面也说了,牛市时间窗宝贵,资金都在追随最强共识。这些滞涨的传统行业缺的就是共识,没业绩,没故事,没流量,你在牛市里买这些股票,亏钱风险小,但是浪费了机会成本。 除非出现超级事实,或者超级机构、超级大v来创造共识,不然都扳不过来,只能等那些热门概念玩透了,玩崩了,资金逃出来的时候看看能不能高低切反弹一下。 …… 1、黄金和白银又涨起来了,黄金已经到4600了,白银今天最高也超过85了,前几天挖的坑都填回来了。4500以上的黄金我停止定投了,虽然还是没有买到我满意的仓位,但过去半年好差还是加了一些,就先这样了,黄金后面没有大调我暂时不买了。 对了,前几天说的那个白银lof,其实一直有溢价,一直是可以滚动套利的,就是限购金额有点少,在这个牛市的大环境下,一天十来块钱都不好意思提了。 2、伊朗外长称政府已经和抗议者展开对话,局势得到控制。但就我看到的信息而言,局势先不说恶化,反正是没有好转。我教大家看一个信号,什么时候在国内官媒上看到关于伊朗的大面积报道了,说明那边确实不闹了。 大致就这些吧,今天很多股民在讨论目前的行情合不合理,那肯定是不合理的,涨幅能算出来的那是熊市,牛市的行情一定是突破技术指标,突破估值模型的,因为牛市完全由流动性和情绪驱动的。这个时候看财务的书,看技术的书,还不如看点行为心理学的书更实用。 记住你现在已经不是在投资,接下来的时间就是标准的博弈投机。 发射~
显示更多
刚买了一点 $FLOCK ,存那里,#山寨季# 💎看了下基本面很不错:@flock_io 1. 被 base 官方定位为首个 AI 基建项目,已经入驻 Base 官方的 Builder Service Hub,再加上FLock与阿里云旗下开源大语言模型系列 alibaba Qwen 达成战略合作,FLock 是阿里巴巴 Qwen 的 Web3 官方入口! 2.CoinbaseVentures 多次与团队接洽,或为潜在战略投资(已获 OKX、DCG、GSR 等投资),有强烈上CB的预期! 3.已经在 Upbit、Bybit 和 Bithumb 上市,对于价值约 2000 万 MC 的项目来说极为罕见! 4.筹码健康:25% 长期锁仓,超过 25% 代币被锁仓,平均锁定时长为 265天。Staking(质押)参与率从 Q1 初的 1.3% 飙升至 41.1%,反映社区深度参与和长期看好。 绝对被严重低估的 AI x web3 项目,AI依旧是本轮最热门叙事。🔥 #Flock#
显示更多
0
25
32
2
转发到社区
懒猫微服和传统NAS的区别: 懒猫微服 = 传统NAS + Cloudflare + Tailscale + VPN虚拟专网 + LightOS + Authy + Nginx + AI大模型 + 微信小程序 + AppStore + 远程微信 + KVM/Docker + 苹果全备份 + 一体化云灾备 + Chrome电视 + 精品官方应用 人话省流版: 1. 内网穿透:速度快,不受运营商干扰,比CloudFlare和Tailscale快很多, TCP、UDP、WebSocket混合打洞,从根本上解决运营商限速的问题 2. 虚拟组网:所有设备安装客户端,异地访问,应用场景,异地多人打局域网游戏;家中5090的算力手机访问;远程桌面访问,不需要买额外的远控软件 3. LightOS:LightOS相当于一台自由的VPS,在家插上鼠标键盘显示器可以当作Linux桌面开发机用,在外可以用手机直接操控Claude Code和Codex,手机移动AI编程才是真正的YYDS 4. Authy: 自带硬件零信任机制,客户端不打开,域名不解析,杜绝黑客工具。自带硬件级MFA认证,所有终端设备都有非对称密钥验证,黑客知道用户名密码无法登录,必须有管理员的一次性验证码,60秒内失效,验证码是微服去中心化生成的,绝对安全 5. Nginx: 内置局域网端口转发工具,客户端因权限安装不方便的地方,可以通过端口转发工具和ClaudeFlare配合,实现外网浏览器访问,不需要安装客户端 6. AI大模型: 相册搜索效果全世界第一,比iCloud和Goolge Photos效果好很多,长句搜索效果速度比开源软件都要快很多。微服可以跑7B大模型,懒猫AI算力舱单台可以跑70B大模型,13台组网可以跑671B大模型,天生支持 CUDA 生态,AI大模型能下载就能直接跑,相比mac来说,体现一个不折腾 7. 微信小程序:自研小程序跨端框架,原生壳 + JS运行时,一次部署云端应用,自动支持 Windows, macOS, Linux, Android, iOS, 鸿蒙、Server, 车机(BYD和华为),VR眼镜 9 端运行。App在所有终端都原生运行,爽不爽? 8. AppStore: 最大私有云App商店,支持3000+ self-host 应用,支持50+ 3A游戏私服,还在以每天10款的软件在快速增长,您的时间最宝贵,节省您时间,更多时间陪家人 9. 远程微信:利用独特的远程虚拟访问技术,微信运行在微服,窗口运行在你的各种电脑设备上,不同的设备共享一份数据,真的是营销售后利器。这不仅仅是简简单单的VNC,更支持本地输入法融合、文件系统互通(可自由选择文件存储在微服还是本地),包括托盘消息、音视频通话、剪切板都通通打通,牛逼的不像云端技术。最关键的是,合法技术,永不封号,放心用! 10. KVM/Docker:支持所有虚拟机,Windows, Linux, macOS, Android。 Intel芯片硬件虚拟化,虚拟机速度杠杠的,替代公有云服务器。专业给封闭生态(比如VR)带软件,利用远程桌面,可以让 Windows, macOS, Linux, Android 软件相互在多个设备上投射 11. 苹果全备份: 不管是 iCloud, 还是 macOS 的 TimeMachine, 甚至是iPhone手机,通通支持一键备份,一旦备份完,家中所有Android设备可以访问 iCloud 照片,每个月节省大量iCloud云服务费。还支持Live图片,苹果办公软件预览,AppleTV,单反照片预览等。对苹果生态支持最好的私有云 12. 一体化云灾备:我们支持RAID备份、外接USB备份、局域网台式机备份,甚至我们还支持iSCSI远端异地快照增量备份,备份到你另外一台微服或者云端VPS,都不在话下,因为我们知道比私有云更贵的是你的数据,当你买新机器的时候,还原只需要一步,一键还原。云灾备操作从来没有这么傻瓜 13. Chrome电视: 开源Chrome + HDMI + 大屏电视,手机操作Chrome大电视,想看什么电影看什么电影,还支持安装Chrome插件,所有电影全免费,黑客电视最佳形态 14. 精品官方应用:最好的云端相册、协议支持最全的云端网盘(支持公有云网盘一键同步)、比微信读书还强大的懒猫读书,还有懒猫清单、懒猫音乐、懒猫听书、懒猫旅游地图、懒猫电视、懒猫AirDrop...官方亲自下场造精品应用,每一个像素和每一个按钮都为你倾心打造,关键我们还是整个互联网最听劝的厂商,你哪里不爽我们专改哪里,服务态度堪比海底捞
显示更多
0
39
176
14
转发到社区
晚点 LatePost 发了一篇 DeepSeek 深度报道《V4 发布前的 DeepSeek:特质、组织和梁文锋的独特目标》 时间点卡在 V4 发布前夕。信息密度很高,摘几个最值得关注的点。 【1】核心成员离职,但没有成组流失 四位已确认离开的成员里,分量最重的是 DeepSeek-R1 核心作者郭达雅,近期正式离职,可能入职某大厂。另外还有去年底被腾讯姚顺雨挖走的王炳宣(第一代 LLM 核心作者),以及 OCR 系列核心作者魏浩然、多模态方向的阮翀。 猎头给 DeepSeek 成员开出的条件是“翻 2 到 3 倍”,有公司直接给 8 位数总包。加上智谱、MiniMax 上市股价高涨,阶跃和 Kimi 的 IPO 也提上日程,DeepSeek 那份没有明确标价的期权让一些成员产生了疑问。 梁文锋正在想办法给公司估值,给团队更多确定性。 【2】V4 可能 4 月发布,大概率开源最强但不会碾压 1 月左右,V4 的小参数版本已经给到一些开源框架社区做适配。原本乐观预期是春节前后发大参数版,现在推迟到 4 月。 晚点的判断是:V4 大概率仍是开源最强模型,但很难是碾压级的强。原因是进入 Agent 时代后,“强”的标准越来越多元,不同场景、不同用户的体感差异很大。 【3】DeepSeek 的“反主流”路线 梁文锋有两个不太主流的优先级:一是基于国产芯片生态做大模型,DeepSeek 已经在做国产 GPU 适配,把底层算子库从 CUDA/Triton 换成了北大开源的 TileLang;二是做“原创式创新”,包括统一多模态的 Janus 系列、形式化证明的 Prover 系列、用图片方式理解文字的 OCR 方案,甚至招了神经科学和脑科学顾问来探索仿生学习机制。 代价是,DeepSeek 在 Agent 和编程这条当前最热的赛道上投入相对少。R1 之后,智谱更新了 5 版模型,MiniMax 4 版,Kimi 3 版,都在针对 Agent 和 coding 强化。OpenRouter 过去 30 天的 token 消耗排名里,DeepSeek-V3.2 排第 12,前 10 中有 6 个来自中国公司。 【4】不过,变化已经开始 DeepSeek 最近首次在招聘启事中提到了具体产品名,要招 Agent 方向的“模型策略产品经理”,岗位要求里写着“熟悉并深度使用过 Claude Code、OpenClaw、Manus 等知名 Agent”。 梁文锋从去年秋天起开始更多提产品化和商业化。DeepSeek 已有小几十人的产品团队,但目前 C 端仍然只有一个标准 Chatbot。 【5】不卷文化依然在 DeepSeek 可能是全球唯一一个“不卷”的核心 AI Lab。多数员工下午 6 到 7 点走人,早上不打卡,没有明确的绩效考核和截止时间。梁文锋的逻辑是:一个人每天能高质量输出的时间很难超过 6 到 8 小时,加班疲劳下的昏庸判断反而浪费算力。 研究团队约 100 多人,只有梁文锋和研究员两个层级。梁文锋本人参与最多的是基模架构团队,会出席每个团队的会议,是串起不同模块的“粘合剂”。研究员可以自由组队,“有时开始一个新方向,就是因为三五个人都觉得一个 idea 不错,然后就一起做了。” 接近 DeepSeek 的人说:“留下的人多少还是有些理想的。” 在当前这个所有 AI 公司都在拼命卷 Agent 和编程的窗口期,DeepSeek 选择花精力做国产芯片适配和仿生学习,这到底是远见还是错过了最佳出手时机? 完整内容:
显示更多
0
39
372
49
转发到社区
前几天在新浪的「赛博对话」录了一期视频播客,话题是大模型厂商怎么就从烧钱走到了赚钱的转折点,主持人是高飞 ,嘉宾是庄明浩和我。 其实最开始是想聊豆包收费这件事情,我和庄明浩还在私下嘀咕,豆包传出付费方案的消息是在月初,早就不是热点了,实在是过了蹭的时机,但如果放大到AI这门生意终于迈过了亏本赚吆喝的那条线,就没问题了,这是一个相当长效的题材。 省流版总结如下: - 根据黄仁勋提出的五层蛋糕理论,应用层虽然是直接和终端用户打交道的,但它也是整个产业结构里盈利压力最大的那个,毕竟上面四层都是供给逻辑,有货就不愁卖,唯有应用层是需要竞争流量的,在这个前提下,收费堪比拔鹅毛但又不让鹅叫唤的艺术; - 豆包当初传出收费消息被猛带了一波节奏,很多人以为从此就没法免费使用豆包了,无论是从中国互联网的历史来看,还是ChatGPT作为先例的样板,收费模式必然是增值服务,大家现在怎么用豆包的还是怎么用,然后一些旗舰级的能力就只会放在会员方案里予取予求; - 再就是国内用户对于为产品功能买单这件事情极其抵触的特有生态,之前北京车展,The Information的记者过来跑了一圈新势力,发现它们的出海计划里都会把车机功能当作付费点,但在中国市场完全没有这个想法,负责人的解释也是很直白无奈,「中国人不会为软件付钱」; - 庄明浩和我都觉得豆包在绝对领先的地位上开启收费尝试是很有意义的,这点钱对于字节的CapEx来说无异于杯水车薪,但整个消费观念的转变很重要,甚至我相信千问元宝都会感谢豆包,否则都被卡死在给全国人民做公益这个沼泽里,「你不收,我怎么收?我不收,耿专员怎么收?大伙怎么进步啊?」 - 再就是豆包的定价梯度可能比较意外,或者说整个AI应用的订阅门槛都是偏高的,长视频平台还在10块钱、20块钱一个月的留人时,豆包的最低档会员就是68块钱一个月了,像是Kimi也是49块钱一个月的起价,越过了30块钱一个月这个标准; - 30块钱一个月就是手游里的月卡,再往上才是大月卡,即通行证/战令,这一档的定价通常从68块钱到98块钱一个月不等,至于豆包计划里最贵的500块钱一个月套餐,相当于一单648的8折价,是不是也很容易理解了; - 马化腾在财报会议上也专门讲了中国用户在2C市场的付费转化率不太高这个点,要知道腾讯已经是最能从用户口袋里掏钱的互联网公司了,它都这么为难,叠加年年喊崛起年年也没能支棱起来的SaaS,模型下游的商业循环在国内实在需要一点乐观趋势,要知道智谱、MiniMax、月之暗面本质上是出海赚美金的公司; - 对于收入能够保持同步增长的公司而言,CapEx其实不是问题,从谷歌Q1财报来看,营收1000亿美金出头,利润差不多600亿,毛利率比纯卖广告的Meta还高,所以烧钱有什么问题呢,烧不出回报才是问题,马化腾说以为上船了但发现船是漏的,就是这个意思; - 中国互联网除游戏外的订阅制付费上限,单产品差不多在1.3亿的水平线,爱优腾和QQ音乐在巅峰期都没能超过这个阈值,我个人不太相信AI应用可以创造例外论,但是抛开订阅不谈,被越炒越火的各种Token套餐如果真的普遍化了,搞不好还真能带来变数; - 其实模型厂商也倾向于按量计费的买卖,订阅制的商业模式就像健身房,赚的是那些开了卡但不经常来的客人的钱,如果大家都用满,在这么一个不太存在规模效应——用户越多,越容易摊薄成本——的行业,AI应用很容易成为一个失血点而非造血器,所以庄明浩看到了一个怀旧服的可能性出现; - 也就是各大运营商开始力推的Token包,这跟当年的流量包不能说是一模一样,只能说是完全一样,所以如果运营商能够成为一个分销Token的角色,像大王卡那样,用Token包去覆盖一些模型的用量,再去后端完成分账,这个故事是完全说得通的; - 不过,无论是订阅制还是卖Token,模型能力都是撬动市场的第一要素,就像GPT-Image-2出来之后所有代开会员的第三方价格全数涨价,以及「六小虎」里把编程套餐卖断货的行情,都说明生产力需求是可以无视价格敏感的; - 但我总觉得豆包的收费不会走生产力路线,豆包大模型可以有生产力市场的目标,比如配合Trae去打,豆包App却未必要这么把路走窄,它的人格化和陪伴性其实是可以在情绪价值市场做出更多可能性的,就像我看有数据显示开源模型超过半数以上的Token消耗用在了角色扮演上,这里的经济价值是被低估了的; - 高飞和庄明浩认为模型厂商还有一个创收机会,就是转移支付,借着全民AI这个热潮,去让市政单位、高校学府来买单,比如某个市的行政区,去给市民提供常态化的Token额度,或者大学对标自己和知网签年框的方式,让师生享有最基础的Token套餐,用财政预算去替大家消费AI; - 总的来看,头部的模型厂商基本不再担心会倒闭了,包括已经上市的财务数据都摊开了,一个基本事实是,如果不算预训练,毛利率都能是打正的,同时预训练的成本增加是一个线性的,而收入的增加是指数级的,所以Anthropic、OpenAI这种烧钱大户都预计能在2030年甚至2028年就实现正现金流,这个速度比亚马逊当年都要快得多; - 庄明浩说做上游投资的现在是在焦虑物理极限,什么意思呢,就是会不会说,地球上的铜不够用了⋯⋯包括要去太空建数据中心,也是因为缺算力缺成了连力大砖飞都搞不定的事情,光有钱没用啊,你得有地方花出去,全世界的工业品暴涨,核心原因就是产能跟不上,需求侧在竞价锁单; - 中美大模型的发展差异在于,美国是在追求速胜,一波钱砸下去,掉队的、认输的马上就出来了,集中度很高,「御三家」就是这么高速洗牌洗出来的,中国因为相对慢一些,同时大家对成本更谨慎,所以能有更多的玩家不下牌桌,赚钱的难度也会高一些,这是充分竞争的经济学理论; - 庄明浩举了Seedance 2.0的例子,按理来说这场仗就应该打完了,你不可能怀疑字节在视频模型身上的决心和疯狂,但实际上呢,快手的可灵、阿里的Wan和Happy Horse、MiniMax的海螺都是该怎么继续还是怎么继续,后面还跟着HiDream、Vidu、Pixverse、SkyReels一长串名字,它们甚至都能拿到融资; - 中国互联网的缠斗传统,加上大盘上涨的规律,意味着你可以不是吃到肉的那个人,跟着喝汤一样能够保存希望,而且AI行业的标的天然优于非AI行业,这种「种族优势」,决定了「投AI总比投别的强」的底层逻辑,于是纷纷续命,等对手犯错,等轮到自己,等一切可能性; - 还是用那五层蛋糕的比方来说,美国是标准的纺锤结构,稀缺性最高的英伟达在中间赚得盆满钵满,中国则更偏向于柱状结构,在产业指导的作用下,不会有哪一层特别明显的去吸整条上下游的血,所以这个蛋糕必然不会跟太平洋对面一样甜,一个人走得快,一群人走得远嘛; - 最后还有一个变数是硬件,庄明浩说,美国做硬件的Startup,拿到钱后的第一件事就是飞深圳,跟逛迪士尼乐园似的,什么梦想都能找到供应商,为什么一级市场那么喜欢投大疆、追觅、影石出来的人,就是因为他们有从0到1的经验,可以复用到AI这一波,难道文曲星和背背佳就不算应用了么,对吧; - 高飞说得很有意思,AI用的东西,都在涨价和赚钱,比如能源、光纤、芯片这些,只有人用的东西,是在通缩和亏损,那么AI应用赚钱很难就说得通了,因为这是给人用的,人类不争气啊,碳基世界完蛋了,哈哈哈哈; - 所以,虽然这话可能有政治不正确的嫌疑,但判断AI是否真正产生了价值的标准,就是企业有没有在大规模裁员......是的,AI替代人类很残酷,但这起码说明AI可以产生真实的经济效益,反倒是喊着AI改变一切,却凡事仍要人类亲力亲为,才是真的有问题。
显示更多
0
27
84
13
转发到社区
做外语视频字幕,最麻烦的往往不是转录,而是流程太碎🤡 MioSub :一款开源 AI 字幕工具,自动完成视频转录、翻译与压制 它把本地视频 / YouTube / Bilibili 导入、Whisper 转录、大模型翻译、术语提取、时间轴对齐、SRT/ASS 导出和字幕压制串成一个桌面端工作流 适合长视频、播客、课程和多语言内容处理 支持 Win / macOS / Linux
显示更多
0
8
44
10
转发到社区
所有大模型终于的能住进同一个私密酒店了! 以前用多个 LLM 有多痛苦? OpenAI 贵,Claude 限流、DeepSeek 偶尔抽风、Ollama 本地又不稳定…… 你得在代码里狂写一堆 if-else 分流、自己搞重试、自己管 key、自己防泄露,还得担心哪家把你的 prompt 偷偷存了日志。 现在好了,hugalafutro 直接开源了 Model Hotel ;一款自托管的多供应商 AI Gateway
显示更多
0
43
40
5
转发到社区
@Bitcoin188 这问题就挺搞笑的,美国和中国的大模型老外也能用,他们抛弃中国开源模型了吗?反倒是很喜欢吧?
AI Agent 做长任务时,最大的问题往往不是变笨,而是聊久了就忘规矩。 于是@happynewjoe 小姜(他这个号找不回密码了)最近几个月高强度 vibe coding,做了一个开源工具: pinrule 。 做的事其实很简单:把你反复强调的底线,变成每轮都会提醒、撞线就会拦的规则。 举个例子,比如没读文件就改、没跑测试就说完成、长任务前台 sleep 干等这类“降智状态”,它都可以直接拦下来。 而且,它不靠联网,也不靠运行大模型,就是一层轻量 hook。 简单说:Agent 埋头写代码,而 pinrule 负责让它别忘了你的规矩。 已经上线 github,本人及本人的 Agent 亦做出小小贡献, 欢迎感兴趣的朋友们多多提建议,有问题也随时问我哈!
显示更多