반응형

전체 글 597

NVIDIA Isaac GR00T: 휴머노이드 로봇을 위한 범용 파운데이션 모델과 생태계 혁신

TL;DRNVIDIA는 2024년 GTC에서 Project GR00T(Generalist Robot 00 Technology)를 발표하고, 휴머노이드 로봇을 위한 범용 파운데이션 모델인 Isaac GR00T를 공개했습니다. 이 모델은 로봇이 언어, 비디오, 시연 등 멀티모달 지시를 이해하고 복잡한 작업을 수행하도록 돕는 데 초점을 맞춥니다. GR00T는 로봇 학습을 위한 시뮬레이션 환경인 Isaac Sim의 Isaac Lab과 합성 데이터 생성 블루프린트인 GR00T-Dreams 등의 엔비디아 아이작(Isaac) 플랫폼 전체와 결합하여 작동합니다. 특히, 로봇 내에서 GR00T를 구동하도록 설계된 엣지 AI 컴퓨팅 플랫폼인 Jetson Thor가 함께 공개되어, AI 모델부터 하드웨어까지의 엔드투엔드 솔..

개발 창고/AI 2025.10.18

Few-Shot Learning이란? 적은 데이터로 AI 모델을 훈련하는 원리와 활용법

TL;DRFew-Shot Learning (FSL)은 머신러닝 모델이 대규모 데이터 없이도 새로운 개념을 빠르게 학습하도록 설계된 방법입니다. 핵심은 '학습하는 방법'을 학습하는 메타 학습(Meta-Learning) 기법을 활용하는 것이며, 이를 통해 모델은 제한적인 서포트 셋(Support Set)의 예시만으로도 새로운 쿼리 셋(Query Set)에 대한 정확한 예측이 가능해집니다. FSL은 특히 의료 영상, 로보틱스 등 라벨링 데이터 확보가 어렵거나 비용이 높은 분야에서 효율적이며, 대규모 언어 모델(LLM)의 퓨샷 프롬프팅 기술의 기반 개념이기도 합니다.1. 퓨샷 학습(Few-Shot Learning, FSL)의 개념 정의퓨샷 학습(Few-Shot Learning)은 머신러닝, 특히 딥러닝 모델이 ..

개발 창고/AI 2025.10.16

딥러닝의 핵심 메커니즘, Attention의 원리와 Transformer 아키텍처 이해

TL;DRAttention Mechanism은 모델이 입력 시퀀스의 모든 부분을 동일하게 처리하는 대신, 현재 작업에 가장 관련성 높은 부분에 가중치를 부여하여 집중하게 하는 딥러닝 기법입니다. 이는 인간의 선택적 집중 능력을 모방한 것으로, 2014년 Bahdanau 등이 기계 번역 모델의 고정 크기 인코딩 벡터 문제(병목 현상)를 해결하기 위해 처음 도입했습니다. 이후 2017년 논문 "Attention Is All You Need"에서 Transformer 아키텍처가 소개되며 RNN/CNN 같은 순환/합성곱 구조 없이 오직 Self-Attention만으로 구성되어 NLP 분야의 패러다임을 전환했습니다. Attention은 Query(Q), Key(K), Value(V) 세 벡터의 상호작용을 통해 가..

개발 창고/AI 2025.10.15

희소성(Sparsity) 기반의 혁신: MoE(Mixture of Experts) 아키텍처의 원리와 대규모 LLM에서의 역할

TL;DRMixture of Experts (MoE)는 딥러닝 모델의 연산 효율성을 높이기 위해 개발된 아키텍처 패턴입니다. 이는 단일 모델이 아닌 여러 개의 '전문가(Expert)' 서브 네트워크를 구성하고, '게이팅 네트워크(Gating Network)' 또는 '라우터(Router)'를 이용해 입력 토큰별로 가장 적합한 소수(Top-K)의 전문가만 활성화하는 희소성(Sparsity) 기반 조건부 연산을 특징으로 합니다. 이 방식을 통해 전체 파라미터 수는 대규모로 확장하면서도, 실제로 추론 및 학습 시 활성화되는 파라미터는 적어 계산 비용(FLOPs)을 절감하고 속도를 향상시킵니다. 최근 Mistral의 Mixtral 8x7B 같은 대규모 언어 모델(LLM)에 성공적으로 적용되어 효율적인 모델 확장의..

카테고리 없음 2025.10.12

알리바바의 Qwen3-VL-30B-A3B: 효율성과 성능을 모두 갖춘 오픈소스 멀티모달 AI 혁신 분석

TL;DR알리바바 클라우드(Alibaba Cloud)는 최신 Qwen3-VL 모델 시리즈의 일환으로 Qwen3-VL-30B-A3B를 오픈소스로 공개했습니다. 이 모델은 약 305억 개의 총 파라미터 중 추론 시 약 33억 개만 활성화하는 MoE(Mixture-of-Experts) 구조를 채택하여, 고성능을 유지하면서도 비용 효율적인 추론이 가능합니다. Qwen3-VL은 텍스트, 이미지, 비디오를 모두 이해하는 멀티모달 기능을 제공하며, 특히 STEM(과학, 기술, 공학, 수학) 추론, 시각적 에이전트 기능, 장기 비디오 분석에서 뛰어난 경쟁력을 보입니다. 개발자들은 Apache 2.0 라이선스를 통해 이 모델을 상업적으로 자유롭게 활용할 수 있습니다.Qwen3-VL-30B-A3B의 등장과 핵심 아키텍처알..

개발 창고/AI 2025.10.11

파이썬과 Prophet으로 삼성전자 주가 예측: 시계열 분석 입문

Prophet은 다음을 고려하지 못합니다:기업 실적 발표경제 지표 변화국제 정세시장 심리산업 트렌드따라서 주식 예측에는 한계가 있으며, 교육/학습 목적으로만 사용해야 합니다. TL;DR: 본 문서는 Python을 이용해 삼성전자 주가 데이터를 수집하고, Prophet 라이브러리로 시계열 예측 모델을 만드는 방법을 다룹니다. yfinance 라이브러리로 삼성전자(티커: 005930.KS)의 과거 주가 데이터를 다운로드합니다. 이후 Prophet 모델이 요구하는 형식(ds, y 컬럼)에 맞게 데이터를 전처리합니다. 모델을 학습시킨 후, 미래 기간에 대한 주가를 예측하고 matplotlib을 통해 결과를 시각화하여 추세와 계절성을 확인하는 과정을 포함합니다. 이 가이드는 금융 데이터 분석 및 시계열 예측의 기..

개발 창고/AI 2025.10.10

ML 성능과 효율을 동시에, LoRA(Low-Rank Adaptation) 완벽 분석

TL;DR LoRA(Low-Rank Adaptation)는 사전 훈련된 대규모 머신러닝 모델의 모든 가중치를 재훈련하는 대신, 일부 가중치 행렬에 작은 규모의 '어댑터' 행렬을 추가하여 학습시키는 파라미터 효율적 파인튜닝(PEFT) 기법입니다. 이 방식은 기존 모델의 가중치는 동결(freeze)시킨 채, 주입된 저차원(low-rank) 행렬만을 학습 대상으로 삼습니다. 결과적으로, 훈련에 필요한 파라미터 수를 획기적으로 줄여 GPU 메모리 사용량을 최소화하고, 훈련 시간을 단축하며, 파인튜닝된 모델의 저장 공간을 크게 절약할 수 있습니다.LoRA란 무엇인가: 거대 모델을 효율적으로 길들이는 법대규모 언어 모델(LLM)이나 이미지 생성 모델은 수십억 개에서 수천억 개의 파라미터를 가집니다. 특정 도메인이나..

개발 창고/AI 2025.10.07

에이전틱 AI(Agentic AI)란? 스스로 생각하고 행동하는 AI 에이전트 개념, 사례 총정리

TL;DR: 에이전틱 AI는 단순히 명령에 응답하는 것을 넘어, 스스로 목표를 세우고, 계획을 짜고, 자율적으로 행동하는 AI 시스템입니다. LLM을 '두뇌'로 사용해 추론하고, 외부 도구를 활용하며, 과거의 경험을 '기억'하여 복잡한 다단계 작업을 사람의 개입 없이 수행할 수 있습니다. 이는 단순한 챗봇을 넘어, 특정 작업을 자율적으로 완수하는 'AI 직원'에 가까운 개념이며, AI 기술의 중요한 진화 방향으로 평가받고 있습니다.에이전틱 AI(Agentic AI)란 무엇인가?에이전틱 AI(Agentic AI)는 '에이전트(Agent)'라는 단어에서 알 수 있듯, 주체성(Agency)을 가지고 자율적으로 행동하는 인공지능을 의미합니다. 기존의 AI가 주로 사용자의 질문에 답변하거나 주어진 명령을 수동적으..

개발 창고/AI 2025.10.06

텐센트 Hunyuan-DiT: Sora와 동일 아키텍처의 이미지 생성 AI

TL;DR: 텐센트가 공개한 텍스트-이미지 생성 모델 Hunyuan-DiT는 OpenAI의 비디오 생성 모델 Sora와 동일한 핵심 아키텍처인 DiT(Diffusion Transformer)를 채택했습니다. 이 아키텍처 덕분에 뛰어난 확장성과 성능을 보여주며, 복잡한 문장을 정확하게 이미지로 구현하는 '구성 능력(Compositionality)'이 강점입니다. 특히, 중국어와 영어를 동시에 깊이 이해하는 이중 언어 인코더를 탑재하여, 문화적 맥락까지 섬세하게 표현하는 고품질 이미지 생성 능력을 갖추고 있습니다.Sora와 같은 심장을 가진 이미지 생성 AI, Hunyuan-DiTAI 이미지 생성 분야의 경쟁이 심화되는 가운데, 중국의 기술 대기업 텐센트(Tencent)가 주목할 만한 모델인 Hunyuan-..

개발 창고/AI 2025.10.04

OpenAI Sora 2 출시: 향상된 물리엔진과 오디오 동기화 심층 분석

TL;DR: 2025년 9월 30일, OpenAI가 차세대 비디오 생성 모델 Sora 2와 iOS 소셜 앱 'Sora'를 공식 발표했습니다. Sora 2는 기존 모델 대비 물리적 현실성을 대폭 강화하여, 객체가 상호작용하고 실패하는 과정까지 현실적으로 시뮬레이션합니다. 가장 큰 혁신은 영상과 완벽하게 동기화된 음향(오디오)을 동시에 생성하는 기능입니다. 함께 출시된 소셜 앱을 통해 사용자는 AI 생성 장면에 자신을 '카메오'로 삽입하고 다른 창작물의 리믹스가 가능해져, AI 영상 제작의 새로운 패러다임을 예고하고 있습니다.Sora 2, 현실을 모방하는 AI의 새로운 도약2025년 9월 30일(현지시간), OpenAI는 라이브스트림 이벤트를 통해 많은 기대를 모았던 차세대 텍스트-비디오(Text-to-Vi..

개발 창고/AI 2025.10.04
반응형