반응형

Nvidia 22

NVIDIA 그래픽 카드 모델(대표)별 Ollama 추천 모델 표

아래 표는 초보자 기준으로 "무난하게 시작"하는 추천입니다. (같은 VRAM이라도 GPU 세대/드라이버/설정에 따라 체감 성능은 달라질 수 있습니다)NVIDIA GPU (대표 모델)VRAM(공식 스펙)초보자 추천 Ollama 모델 예시(실제 모델명)이 조합이 잘 맞는 용도RTX 306012GB(또는 8GB 변형)llama3.1:8b, qwen2.5:7b, gemma2:9b문서 요약/번역/일상 Q&A "로컬 LLM 입문"RTX 3060 Ti8GBllama3.2:3b, phi3:mini, qwen2.5:3b가볍게 빠른 응답(짧은 문서/챗봇)RTX 40608GBllama3.2:3b, phi3:mini, mistral:7b"빠른 3B~7B" 중심(속도 우선)RTX 4060 Ti16GB 또는 8GB(16GB면) ..

AI/Technical 2026.01.09

xAI Series E 200억달러 조달: Grok·데이터센터 확장

TL;DRxAI는 2026-01-06 "upsized Series E"로 200억 달러를 조달했다고 공식 발표했다.이번 라운드는 당초 목표(150억 달러)를 상회했으며, NVIDIA·Cisco Investments가 전략적 투자자로 포함됐다.자금은 컴퓨트/데이터센터(Colossus I·II) 확장, Grok 제품·모델 개발 및 배포 가속, 연구 투자에 쓰인다고 밝혔다.일부 매체는 밸류에이션(약 2,300억달러 수준)을 언급하지만, 회사 공지에는 밸류에이션이 명시되지 않았다는 점을 함께 봐야 한다.본문1) 이번 뉴스의 “팩트(공식 확인)”만 먼저 정리xAI는 2026-01-06 자사 뉴스룸을 통해 Series E에서 200억 달러를 조달했고, 라운드가 원래 목표였던 150억 달러를 상회(upsized)했다..

AI/Trend 2026.01.08

NVIDIA H200 중국 재진입: 2026 AI 칩 시장과 수출통제

TL;DR미국은 NVIDIA의 H200을 "승인된 중국 고객"에 한해 수출 허용하면서, 판매에 25% 수수료(세금 형태)와 미국 내 보안 심사 절차를 붙였다. (Reuters)로이터는 중국 고객들이 2026년 인도분으로 H200을 200만 개 이상 주문했고, NVIDIA는 재고(약 70만 개)를 보유한 것으로 전했다. (Reuters)NVIDIA는 중국 정부 승인 여부에 따라 H200을 2026-02 중순부터 출하하는 방안을 추진 중인 것으로 보도됐다. (Reuters)이 이슈는 "기술(칩 성능)"보다 "정책(수출통제)·공급망(생산/검수/경로)"이 AI 인프라를 좌우하는 전형 사례다. (Reuters)본문1) 이번 뉴스의 핵심: ‘투자 발표’라기보다 ‘정책+공급망 재설계’사용자 요약에서 "대규모 투자"로..

AI/Trend 2026.01.05

2026년 첫 거래일 AI 주식 급등: 반도체 랠리와 AI 빌드아웃

TL;DR2026-01-02(미국 시장 기준, 2026년 첫 거래일)에는 지수는 혼조였지만, 반도체(SOX)가 +4.01%로 강하게 튀면서 'AI 인프라 테마'가 다시 전면에 섰습니다.인텔(+6.7%), 엔비디아(+1.3%), 마이크론(+10%) 같은 칩/메모리 축이 움직였고, 반대로 일부 대형 기술주는 하락하며 "AI만의 단방향 랠리"라기보다 섹터 재배치가 섞인 장으로 읽히는 날이었습니다.시장은 CES(대형 IT 이벤트) 기대, 관세 정책 완화 신호, 고평가 부담 속에서도 '칩이 받치는 AI 빌드아웃' 내러티브를 재확인했습니다.이 글은 “왜 하필 반도체가 리드했는가”를 기술 공급망(칩·메모리·스토리지·네트워크·전력) 관점으로 정리하고, 엔지니어가 참고할 모니터링 체크리스트와 간단한 코드까지 제공합니다...

AI/Trend 2026.01.03

Nvidia–Groq 비독점 라이선스·인재 영입, 추론 전쟁의 신호탄

TL;DR2025-12-24, Groq는 Nvidia와 비독점(non-exclusive) 추론(inference) 기술 라이선스 계약을 체결했다고 발표했다.계약과 함께 Groq 창업자 Jonathan Ross, 사장 Sunny Madra 등 핵심 인력이 Nvidia로 합류한다.Groq는 독립 운영을 유지하며, GroqCloud도 중단 없이 운영된다고 밝혔다.금액은 공개되지 않았고, 일부 보도에서 '인수/자산 매입'처럼 표현된 부분은 공식 발표(비독점 라이선스·독립 운영)와 구분해 해석해야 한다.본문1) 사건 정리: “인수”가 아니라, 비독점 라이선스 + 핵심 인재 영입이번 이슈의 핵심은 한 문장으로 정리됩니다.Nvidia는 Groq를 인수했다고 발표한 것이 아니라, Groq의 추론 기술을 비독점으로 라이..

AI/Trend 2025.12.26

Nvidia H200 중국 출하(2026-02)와 미국 수출 규제 변화 정리

TL;DR로이터(2025-12-22) 보도에 따르면, Nvidia는 중국 고객에게 H200을 2026년 2월 중순(춘절 전)부터 출하하겠다는 계획을 공유했다.초기 물량은 재고 기반 5,00010,000 모듈(칩 4만8만 개 규모)로 언급됐고, 중국 당국의 승인이 전제 조건으로 제시됐다.이 움직임은 미국의 대중(對中) 첨단 컴퓨팅 수출 통제(2022-10, 2023-10 개정) 흐름 속에서, 정책 조건이 바뀌고 있음을 시사한다.특히 2025-12-08(로이터) 보도처럼, H200의 중국 수출을 조건부로 허용하고 25% '정부 수수료/부과금'을 붙이는 방식이 공개되며 "공급 재개"의 제도적 문이 열린 것으로 해석된다.본문1) 사건 요약: "2026년 2월 중순까지 H200 출하"의 구체 내용로이터(2025-..

AI/Trend 2025.12.25

엔비디아(Nvidia) AI 칩 중국 수출 허용 검토: 트럼프 행정부의 새로운 딜레마 (Nvidia AI Chip China Export Review)

TL;DR사건: 미 상무부를 포함한 범정부 기관이 엔비디아의 주력 AI 칩(H200 등)에 대한 중국 수출 라이선스 검토를 공식 시작함.배경: 트럼프 행정부는 안보 위험을 이유로 한 전면 차단보다는, 수출 허용 대가로 판매 수익의 일부(약 15~25%)를 징수하거나 안보 조건을 부과하는 실리적 접근을 모색 중.전망: 국방부(Pentagon)와 국무부의 반대가 예상되는 가운데, 이번 검토 결과는 향후 30일 내 윤곽이 드러날 것이며 글로벌 AI 인프라 공급망에 결정적 영향을 미칠 것임.1. 사건의 전말: 닫혔던 문이 다시 열리나?2025년 12월 18일(현지시간), 로이터 통신과 인베스팅닷컴 등 주요 외신은 미국 트럼프 행정부가 엔비디아의 고성능 AI 가속기를 중국에 판매할 수 있도록 허용하는 방안을 검토..

AI/Trend 2025.12.22

NVIDIA Nemotron 3: 오픈소스 에이전틱 AI 시대를 열다

TL;DR3가지 규모의 모델 출시: Nemotron 3 Nano(30억 활성 파라미터, 즉시 사용 가능), Super(100억), Ultra(500억, 2026년 상반기)4배 높은 처리량: Nemotron 2 Nano 대비 처리량 4배 증가, 단일 H200 GPU에서 추론 토큰 60% 감소혁신적 하이브리드 MoE 아키텍처: Mamba-2와 Transformer를 결합한 경량 전문가 혼합 방식으로 효율성과 정확도 동시 달성3조 토큰 규모의 공개 데이터: 사전훈련, 사후훈련, 강화학습 데이터셋 및 오픈소스 도구 제공오픈 라이선스: 가중치, 훈련 데이터, 훈련 방법 모두 github, Hugging Face에서 자유롭게 접근 가능본문1. 에이전틱 AI의 시대: 다중 에이전트 협업이 필요한 이유조직들이 단일 모..

AI/Trend 2025.12.18

White House Genesis Mission: AI를 통한 과학 혁신의 새로운 장(章)

2025년 11월 24일, 트럼프 대통령은 Genesis Mission을 출범시키는 행정명령에 서명했다. 이는 연방 과학 데이터셋과 국가연구소(National Laboratories) 슈퍼컴퓨터를 AI로 통합하여 향후 10년 내 미국 과학 생산성을 2배로 높이겠다는 목표를 설정한 것이다. DOE 주도로 17개 국가연구소의 40,000여 명 과학자와 민간 기술 기업을 협력시키며, 270일 집행 일정 내에 "American Science and Security Platform(ASSP)"을 구축할 계획이다.본문Genesis Mission이란 무엇인가Genesis Mission은 인공지능을 통해 과학적 발견을 가속화하고 미국의 기술 주도권을 강화하기 위한 연방 차원의 조율된 국가 사업이다. 트럼프 행정부는 이..

AI/Trend 2025.12.12

엔비디아, 시놉시스에 20억 달러 투자: AI 칩 설계의 '초격차' 가속화

TL;DR초대형 투자: 엔비디아가 칩 설계 소프트웨어(EDA) 1위 기업 시놉시스에 20억 달러(약 2.8조 원)를 지분 투자하며 '혈맹'을 맺었습니다.기술 결합: 시놉시스의 'AgentEngineer' 기술과 엔비디아의 'Blackwell' 가속 컴퓨팅을 결합, 칩 설계 및 검증 과정을 획기적으로 단축합니다.성능 혁신: 회로 시뮬레이션 속도 30배, 리소그래피(노광) 공정 시뮬레이션 20배 향상을 목표로 합니다.1. 20억 달러 투자의 의미와 배경2025년 12월 1일, 엔비디아는 시놉시스 주식을 주당 $414.79에 매입하는 방식으로 총 20억 달러를 투자한다고 발표했습니다. 단순한 자금 투자가 아닌, 차세대 AI 칩 개발의 병목 현상을 해소하기 위한 전략적 포석입니다. AI 모델의 파라미터가 수조 ..

AI/Trend 2025.12.02
반응형