반응형

OCR 3

DeepSeekMath-V2와 DeepSeek-OCR 3B: 오픈소스 AI의 수학적 추론 혁명

TL;DRDeepSeek AI가 2025년 11월 발표한 DeepSeekMath-V2는 오픈웨이트 수학 모델로서 IMO 2025와 CMO 2024에서 금메달 수준의 성능을 기록했으며, Putnam 2024에서 118/120점을 달성했습니다. 자기 검증 가능한 수학적 추론 능력을 갖춘 이 모델은 기존 폐쇄형 모델들을 능가합니다. 동시에 10월 공개된 DeepSeek-OCR 3B MoE는 비전-언어 모델로서 토큰을 10배 줄이면서도 97% 정확도를 유지하여 문서 AI의 패러다임을 변화시켰습니다. 두 모델 모두 MIT 라이선스 하에 완전 오픈소스로 공개되어 글로벌 AI 커뮤니티에 큰 영향을 미칠 전망입니다.1. DeepSeekMath-V2: 올림피아드 수준의 수학적 추론1-1. 자기 검증 가능한 수학 AI의 ..

AI/Trend 2025.12.02

NVIDIA 새로운 RAG(검색 증강 생성) 제품군 출시 - Nemotron RAG

TL;DRNVIDIA Nemotron RAG 제품군은 상업적으로 허용되는 오픈 라이선스와 투명한 데이터·모델을 기반으로, 최신텍스트/멀티모달 리트리버, 레이아웃 감지, 고속 생성·검색 기능을 제공합니다.Nano 2 VL은 vLLM 기반 실시간 inference와 높은 비전-언어 정확도를 달성하며, 문서 및 영상 분석, OCR, 차트 분석 등 다양한 기업형 RAG 워크플로우에 최적화되어 있습니다.모델·데이터·레시피가 모두 공개된 상태로, 엔터프라이즈 데이터 프라이버시·배포 옵션(온프레미스/VPC), 오픈 프레임워크(vLLM 등), 안전 기능까지 지원됩니다.2025년 11월 3일 기준, ViDoRe·MTEB 등 주요 국제 벤치마크에서 선도적 성능을 기록하고 있습니다.Nemotron RAG 제품군 개요NVID..

AI 2025.11.03

DeepSeek-OCR: 중국발 AI OCR 혁신 - 텍스트를 이미지로 10배 압축한 문맥 엔진

TL;DRDeepSeek AI가 2025년 10월 공개한 DeepSeek-OCR은 기존 OCR을 넘어 텍스트-이미지 변환 기반 압축 알고리즘으로 주목받고 있다.이 모델은 텍스트를 시각화하여 최대 10배(최대 20배) 압축 효율을 달성하며, A100 GPU 한 개만으로 하루 200,000페이지 이상을 처리한다.정확도는 97%, 오픈소스로 공개되어 HuggingFace와 GitHub에서 즉시 활용 가능하다.이 기술은 LLM의 컨텍스트 윈도 확장과 메모리 효율 최적화 측면에서 획기적인 변화를 제공한다.본문DeepSeek-OCR의 기술 개요DeepSeek-OCR은 중국 항저우 기반 스타트업 DeepSeek AI가 개발한 오픈소스 OCR 모델로, “Contexts Optical Compression”이라는 개념을..

AI 2025.10.22
반응형