Max For AI (@MaxForAI) “刚才吃了个瓜，关于百度刚开源的Unlimited-OCR模型🤣 昨天看到他们发了这个模型，然后”

2026.06.23 14:35

刚才吃了个瓜，关于百度刚开源的Unlimited-OCR模型🤣 昨天看到他们发了这个模型，然后技术群里说跑分很强！？于是我去看了一下技术报告，不对吧哥们？？这端到端解析的技术路线看着也太眼熟了吧，怎么跟之前DeepSeek-OCR一脉相承🤔 在OmniDocBench v1.6榜单上，它的综合得分达到了93.92%。直接反超了之前DeepSeek-OCR的87%。更核心的优势在长文本的生成速度上，以前的模型生成越长速度越慢，但它到了6000 token的时候。速度比DeepSeek快了整整35%😧 而且还能保持7800+的TPS不掉速。看到这些，再看看这个端到端解析的技术路线，很难不让人联想到今年春节前后的一波人才流动啊..... 当时曾在某家大厂里主导了GOT-OCR2.0和后续在DeepSeek负责DS-OCR系列的核心大牛离职。各家一时间都在抢人🤣 而现在百度交出了Unlimited-OCR这份答卷，而且技术路线一脉相承，懂的都懂🫡 只能说这波真的挖对了，目前百度还是OCR最严厉的父亲😂 目前这个模型的代码和权重都已经用MIT协议开源了，感兴趣的家人们可以去跑一下试试。

显示更多

Adina Yakup@AdinaYakup

2026.06.22 15:35

Unlimited-OCR 🔥New OCR from @PaddlePaddle It can parse hundreds of pages in a single pass while maintaining stable speed. The key idea is R-SWA (Reference Sliding Window Attention), which keeps KV cache constant during decoding. 🏆 93% on OmniDocBench 📈 +6% over DeepSeek-OCR

显示更多