OCR共1篇
重磅!DeepSeek再开源:视觉即压缩,100个token干翻7000个-AI Spot

重磅!DeepSeek再开源:视觉即压缩,100个token干翻7000个

一图胜千言!DeepSeek-OCR模型大胆探索视觉-文本压缩边界。通过少量视觉token解码出10倍以上的文本信息,这款端到端VLM架构不仅在OmniDocBench基准上碾压GOT-OCR2.0,还为LLM的长上下文问题提供...
新智元的头像-AI Spot新智元8小时前
0549