注册并分享邀请链接,可获得视频播放与邀请奖励。

Max For AI (@MaxForAI) “刚才吃了个瓜,关于百度刚开源的Unlimited-OCR模型🤣 昨天看到他们发了这个模型,然后” — TopicDigg

Max For AI 的个人资料封面
Max For AI 的头像
Max For AI
@MaxForAI
本科辍学创业,没啥好看的,也就发点AI相关的内容🫡 Head of growth @lobehub(79K🌟) Prev @listenhub @Sapient_Int 同名小红书4万粉丝,公众号01Founder(长文首发) 观点仅代表个人 更多请访问网站⬇️(欢迎DM
加入 September 2023
2.2K 正在关注    16K 粉丝
刚才吃了个瓜,关于百度刚开源的Unlimited-OCR模型🤣 昨天看到他们发了这个模型,然后技术群里说跑分很强!? 于是我去看了一下技术报告,不对吧哥们?? 这端到端解析的技术路线看着也太眼熟了吧,怎么跟之前DeepSeek-OCR一脉相承🤔 在OmniDocBench v1.6榜单上,它的综合得分达到了93.92%。 直接反超了之前DeepSeek-OCR的87%。 更核心的优势在长文本的生成速度上,以前的模型生成越长速度越慢,但它到了6000 token的时候。速度比DeepSeek快了整整35%😧 而且还能保持7800+的TPS不掉速。 看到这些,再看看这个端到端解析的技术路线,很难不让人联想到今年春节前后的一波人才流动啊..... 当时曾在某家大厂里主导了GOT-OCR2.0和后续在DeepSeek负责DS-OCR系列的核心大牛离职。 各家一时间都在抢人🤣 而现在百度交出了Unlimited-OCR这份答卷,而且技术路线一脉相承,懂的都懂🫡 只能说这波真的挖对了,目前百度还是OCR最严厉的父亲😂 目前这个模型的代码和权重都已经用MIT协议开源了,感兴趣的家人们可以去跑一下试试。
显示更多
Unlimited-OCR 🔥New OCR from @PaddlePaddle It can parse hundreds of pages in a single pass while maintaining stable speed. The key idea is R-SWA (Reference Sliding Window Attention), which keeps KV cache constant during decoding. 🏆 93% on OmniDocBench 📈 +6% over DeepSeek-OCR
显示更多
0
18
50
1
转发到社区