반응형

opensource 5

NVIDIA Nemotron 3: 오픈소스 에이전틱 AI 시대를 열다

TL;DR3가지 규모의 모델 출시: Nemotron 3 Nano(30억 활성 파라미터, 즉시 사용 가능), Super(100억), Ultra(500억, 2026년 상반기)4배 높은 처리량: Nemotron 2 Nano 대비 처리량 4배 증가, 단일 H200 GPU에서 추론 토큰 60% 감소혁신적 하이브리드 MoE 아키텍처: Mamba-2와 Transformer를 결합한 경량 전문가 혼합 방식으로 효율성과 정확도 동시 달성3조 토큰 규모의 공개 데이터: 사전훈련, 사후훈련, 강화학습 데이터셋 및 오픈소스 도구 제공오픈 라이선스: 가중치, 훈련 데이터, 훈련 방법 모두 github, Hugging Face에서 자유롭게 접근 가능본문1. 에이전틱 AI의 시대: 다중 에이전트 협업이 필요한 이유조직들이 단일 모..

AI/Trend 2025.12.18

리눅스 재단, 에이전틱 AI 재단(AAIF) 출범 — 개방형 AI 에이전트 생태계의 새로운 발판

TL;DR리눅스 재단이 2025년 12월 에이전틱 AI 재단(AAIF)을 공식 출범했다.이 재단은 AI 에이전트 기술의 표준화, 상호운용성, 커뮤니티 주도 개발을 목표로 하며, 오픈AI·안트로픽·구글 클라우드·IBM·마이크로소프트 등의 프로젝트가 초기 기여자로 참여했다.오픈소스 모델을 기반으로 에이전트 오케스트레이션, API 상호운용, 거버넌스 구조를 공개해 투명한 AI 에이전트 생태계의 기반을 구축한다.AAIF는 기존의 LF AI & Data 프로젝트 그룹과도 긴밀히 연계될 예정이다. 본문리눅스 재단과 에이전틱 AI 재단의 출범 배경리눅스 재단(The Linux Foundation)은 2025년 12월 9일, Agentic AI Foundation(AAIF) 설립을 발표했다 (Linux Foundat..

AI/Trend 2025.12.10

Alibaba Tongyi DeepResearch: 30B 파라미터 오픈소스 에이전트 모델 집중 분석

TL;DR알리바바 Tongyi DeepResearch는 30.5B 파라미터(Large Language Model, LLM)이지만, 매 토큰당 실제 활성 파라미터는 3.3B 수준입니다.합성 데이터 기반 훈련과 MoE(Mixture-of-Experts) 구조 덕분에 2개의 H100 GPU, 500달러 미만으로 훈련이 가능하며, GPT-4o·DeepSeek-V3보다 깊은 연구·추론 성능을 실현합니다.오픈소스(모델, 학습, 추론 코드 제공)로 누구나 활용 가능하며, 벤치마크(32.9%~75%)에서도 SOTA(State-of-the-Art) 성능을 기록했습니다.Tongyi DeepResearch란 무엇인가?Tongyi DeepResearch는 알리바바 Tongyi Lab에서 2025년 9월 17일 공개한 LLM ..

AI 2025.11.03

Anything LLM: 로컬 중심 올인원 AI 애플리케이션

TL;DRMintplex Labs가 개발한 Anything LLM은 오픈소스이자 온디바이스 친화형 AI 애플리케이션으로, 문서 대화(RAG), AI 에이전트, 다중 모델을 단일 클라이언트에서 운용할 수 있는 점이 특징이다.맥·윈도우·리눅스용 네이티브 앱과 도커 배포를 동시에 제공하며, 기본 내장 LLM과 임베딩(DB·벡터DB)을 모두 로컬 환경에서 실행할 수 있다.v1.9.0(2025-10-09)에서는 실시간 스트리밍 에이전트, 웹에서 직접 파일 다운로드·처리 기능 등이 새롭게 추가되었다. Anything LLM 개요제품 정의Anything LLM은 “AI 활용의 모든 것을 하나의 애플리케이션에 담는 것”을 목표로 하는 Mintplex Labs의 대표 제품이다.데스크탑 클라이언트, 셀프호스트 서버, 클..

AI 2025.10.24

Krea Realtime 14B 공개: 실시간 Text-to-video의 도약

TL;DRKrea Realtime 14B는 140억 파라미터를 가진 오픈소스 실시간 text-to-video 모델이다.단일 B200 GPU로 초당 11fps의 장편 비디오 생성이 가능하다.Self-Forcing 기법을 이용해 Wan 2.1 14B로부터 증류(distillation)되었다.기존 오픈소스 모델보다 10배 이상 크며, 실시간 편집·프롬프트 변경이 지원된다.Apache 2.0 라이선스로 HuggingFace에서 제공된다.Krea Realtime 14B란 무엇인가Krea AI는 2025년 10월 14일, Krea Realtime 14B를 공식 공개했다. 이 모델은 140억 파라미터 규모의 자동회귀(Auto-regressive) Text-to-video 생성기이며, Self-Forcing이라는 변환..

AI 2025.10.23
반응형