반응형

deepseek 4

DeepSeekMath-V2와 DeepSeek-OCR 3B: 오픈소스 AI의 수학적 추론 혁명

TL;DRDeepSeek AI가 2025년 11월 발표한 DeepSeekMath-V2는 오픈웨이트 수학 모델로서 IMO 2025와 CMO 2024에서 금메달 수준의 성능을 기록했으며, Putnam 2024에서 118/120점을 달성했습니다. 자기 검증 가능한 수학적 추론 능력을 갖춘 이 모델은 기존 폐쇄형 모델들을 능가합니다. 동시에 10월 공개된 DeepSeek-OCR 3B MoE는 비전-언어 모델로서 토큰을 10배 줄이면서도 97% 정확도를 유지하여 문서 AI의 패러다임을 변화시켰습니다. 두 모델 모두 MIT 라이선스 하에 완전 오픈소스로 공개되어 글로벌 AI 커뮤니티에 큰 영향을 미칠 전망입니다.1. DeepSeekMath-V2: 올림피아드 수준의 수학적 추론1-1. 자기 검증 가능한 수학 AI의 ..

AI/Trend 2025.12.02

DeepSeek Math-V2: 중국 AI의 수학 분야 돌파, 오픈소스로 IMO 금메달 달성

TL;DR중국의 AI 기업 DeepSeek이 2024년 11월 27일 685억 파라미터 규모의 오픈소스 수학 전문 모델 DeepSeek-Math-V2를 공개했다. 이 모델은 생성-검증 폐쇄 루프 메커니즘을 통해 최종 답만이 아닌 수학적 추론의 엄밀성을 검증하며, IMO 2025에서 금메달 수준(83.3% 정확도), CMO 2024에서 금메달, Putnam 2024에서 118/120 점수를 기록했다. Apache 2.0 라이선스로 완전 공개된 이 모델은 OpenAI의 o1, Google DeepMind의 AlphaProof 등 폐쇄형 시스템과의 격차를 좁히며 중국 AI의 글로벌 경쟁력을 새로이 입증한다.1. DeepSeek-Math-V2의 혁신적 아키텍처DeepSeek-Math-V2는 기존의 대규모 언어 ..

AI/Trend 2025.12.01

중국 오픈소스 AI 모델 모멘텀: 아시아가 선택한 ‘가성비·통제 가능한’ 대안

TL;DR중국계 오픈소스 LLM(Qwen, DeepSeek, GLM 등)은 “충분히 좋은 성능 + 낮은 비용 + 소스 공개”를 무기로 전 세계 다운로드와 파생 모델 수에서 빠르게 성장하고 있다.동남아·중동·라틴아메리카 기업은 최고 성능보다는 “데이터와 비용을 스스로 통제할 수 있느냐”를 더 중시하면서, 구글 Gemini 3 같은 최상위 폐쇄형 모델 대신 중국 오픈소스를 고르는 사례가 늘고 있다.말레이시아·인도네시아 등은 데이터센터·전력 인프라를 확충하며, 이런 오픈소스 모델을 기반으로 자국 AI 서비스를 구축해 미·중 어느 쪽에도 종속되지 않으려는 “브리지 파워” 전략을 모색 중이다.미국은 OpenAI·Anthropic·Google Gemini 3 등 폐쇄형 모델 경쟁에는 앞서지만, Meta를 제외하면 ..

AI/Trend 2025.11.27

DeepSeek-OCR: 중국발 AI OCR 혁신 - 텍스트를 이미지로 10배 압축한 문맥 엔진

TL;DRDeepSeek AI가 2025년 10월 공개한 DeepSeek-OCR은 기존 OCR을 넘어 텍스트-이미지 변환 기반 압축 알고리즘으로 주목받고 있다.이 모델은 텍스트를 시각화하여 최대 10배(최대 20배) 압축 효율을 달성하며, A100 GPU 한 개만으로 하루 200,000페이지 이상을 처리한다.정확도는 97%, 오픈소스로 공개되어 HuggingFace와 GitHub에서 즉시 활용 가능하다.이 기술은 LLM의 컨텍스트 윈도 확장과 메모리 효율 최적화 측면에서 획기적인 변화를 제공한다.본문DeepSeek-OCR의 기술 개요DeepSeek-OCR은 중국 항저우 기반 스타트업 DeepSeek AI가 개발한 오픈소스 OCR 모델로, “Contexts Optical Compression”이라는 개념을..

AI 2025.10.22
반응형