반응형

2025/10/04 2

텐센트 Hunyuan-DiT: Sora와 동일 아키텍처의 이미지 생성 AI

TL;DR: 텐센트가 공개한 텍스트-이미지 생성 모델 Hunyuan-DiT는 OpenAI의 비디오 생성 모델 Sora와 동일한 핵심 아키텍처인 DiT(Diffusion Transformer)를 채택했습니다. 이 아키텍처 덕분에 뛰어난 확장성과 성능을 보여주며, 복잡한 문장을 정확하게 이미지로 구현하는 '구성 능력(Compositionality)'이 강점입니다. 특히, 중국어와 영어를 동시에 깊이 이해하는 이중 언어 인코더를 탑재하여, 문화적 맥락까지 섬세하게 표현하는 고품질 이미지 생성 능력을 갖추고 있습니다.Sora와 같은 심장을 가진 이미지 생성 AI, Hunyuan-DiTAI 이미지 생성 분야의 경쟁이 심화되는 가운데, 중국의 기술 대기업 텐센트(Tencent)가 주목할 만한 모델인 Hunyuan-..

개발 창고/AI 2025.10.04

OpenAI Sora 2 출시: 향상된 물리엔진과 오디오 동기화 심층 분석

TL;DR: 2025년 9월 30일, OpenAI가 차세대 비디오 생성 모델 Sora 2와 iOS 소셜 앱 'Sora'를 공식 발표했습니다. Sora 2는 기존 모델 대비 물리적 현실성을 대폭 강화하여, 객체가 상호작용하고 실패하는 과정까지 현실적으로 시뮬레이션합니다. 가장 큰 혁신은 영상과 완벽하게 동기화된 음향(오디오)을 동시에 생성하는 기능입니다. 함께 출시된 소셜 앱을 통해 사용자는 AI 생성 장면에 자신을 '카메오'로 삽입하고 다른 창작물의 리믹스가 가능해져, AI 영상 제작의 새로운 패러다임을 예고하고 있습니다.Sora 2, 현실을 모방하는 AI의 새로운 도약2025년 9월 30일(현지시간), OpenAI는 라이브스트림 이벤트를 통해 많은 기대를 모았던 차세대 텍스트-비디오(Text-to-Vi..

개발 창고/AI 2025.10.04
반응형