반응형

분류 전체보기 766

Microsoft AI 데이터센터 확장, 전기요금 인상 없음 5대 약속 정리

TL;DRMicrosoft는 2026-01-13 미국에서 Community-First AI Infrastructure를 발표하며, AI 데이터센터 확장에 따른 전기요금·물 사용·세금·일자리·교육 논란을 정면 대응했다.핵심은 "데이터센터 비용이 주민 전기요금으로 전가되지 않게 하겠다"는 약속이며, 이를 위해 규제기관/유틸리티와 요금 구조를 조정하고 그리드(송전·변전) 증설 비용까지 포함해 '자기 비용'으로 부담하겠다고 밝혔다.물 사용은 2030년까지 물 사용 강도 40% 개선, 지역별 물 사용 데이터 공개, 물/하수 인프라를 전액 부담하는 방식까지 포함한다.데이터센터 반대 여론이 커진 상황에서(미국 여러 주에서 반대 그룹 확산), 지역 갈등을 줄이려는 '조건부 확장 모델'로 읽힌다.본문1) 왜 지금 이런 ..

AI/Trend 2026.01.14

Google UCP 논란: AI 쇼핑 에이전트 표준과 가격 인상 우려

TL;DRGoogle은 2026-01-11(현지 발표 기준) AI 쇼핑 에이전트가 상거래를 "표준 방식"으로 수행하도록 돕는 Universal Commerce Protocol(UCP)을 공개했다.2026-01-13 소비자 감시 단체 성격의 기관( Groundwork Collaborative )이 "오용·소비자 가격 상승" 가능성을 경고했고, Google은 이를 반박하며 가드레일을 강조했다.UCP는 /.well-known/ucp에서 프로필을 발견하고, REST/MCP/A2A 등 다양한 바인딩으로 체크아웃을 호출하도록 설계됐다.논쟁의 핵심은 "에이전트가 구매를 대행하는 표준"이 편의성과 상호운용성을 주는 동시에, 개인화 가격·다크패턴·책임소재 문제를 더 크게 만들 수 있느냐는 지점이다.본문1) 무슨 일이 있..

AI/Trend 2026.01.14

애플·구글 Gemini로 Siri 업그레이드: 발표문 기준 팩트 정리

TL;DR애플과 구글은 다년(multi-year) 협업을 발표했고, 차세대 Apple Foundation Models가 구글 Gemini 모델 및 클라우드 기술을 기반으로 한다고 밝혔다.이 모델들은 향후 Apple Intelligence 기능(그중 더 개인화된 Siri)을 구동하며, 발표문에는 "올해(2026년) 중 출시"라고만 명시돼 있다.동시에 애플은 Apple Intelligence가 기기(on-device)와 Private Cloud Compute(PCC)에서 계속 동작하며, 개인정보 보호 원칙을 유지한다고 강조했다.이번 발표는 AI 경쟁 구도에 직접적인 신호를 줬고, 관련 보도에서는 발표 당일 알파벳 시가총액이 4조 달러를 상회했다는 점도 함께 부각됐다.본문1) 이번 발표에서 "확인된 사실"만 ..

AI/Trend 2026.01.13

OpenAI for Healthcare, Gmail AI Inbox, DrugCLIP, 2026-01 핵심 정리

TL;DROpenAI는 의료기관용 'OpenAI for Healthcare'(ChatGPT for Healthcare + 의료용 API)를 2026-01-08에 공개했고, HIPAA 준수 지원(BAA, 감사로그, 키 관리 등)을 전면에 내세웠습니다.OpenAI는 개인용으로 ChatGPT Health도 2026-01-07에 공개해 의무기록/웰니스 앱 연결과 건강 전용 공간(학습 미사용)을 강조했습니다.Google은 2026-01-08에 Gmail의 AI Inbox(해야 할 일, 주제 브리핑)를 발표했고, 현재는 Trusted Testers 중심으로 먼저 제공합니다.중국 연구진(칭화대, 베이징대)은 DrugCLIP로 "백만 배" 수준의 가상 스크리닝 가속을 주장했고, 1만 단백질, 5억 화합물 스캔을 "하루..

AI/Trend 2026.01.13

CES 2026 AMD Ryzen AI 400/PRO 400, 최대 60 NPU TOPS

TL;DRAMD가 CES 2026에서 Ryzen AI 400 및 Ryzen AI PRO 400 시리즈를 공개했고, 최대 60 NPU TOPS를 강조했습니다.Microsoft가 정의한 Copilot+ PC의 핵심 하드웨어 조건은 40+ TOPS NPU이며, AMD는 이번 라인업이 이 기준을 상회한다고 밝혔습니다.개발 측면에서는 Ryzen AI Software(ONNX Runtime + Vitis AI EP)와, AMD가 언급한 ROCm 7.2(Windows/Linux) 방향성, 그리고 ComfyUI의 Windows ROCm 공식 지원 흐름이 같이 움직이고 있습니다.데이터센터 쪽에서는 AMD가 EPYC 9005(구 코드명 "Turin")을 "AI/클라우드" 타깃으로 이미 출시한 바 있어, 클라이언트와 서버 ..

AI/Trend 2026.01.12

DeepSeek V4 코딩 모델: 출시 보도·효율성 논문·중국 AI IPO

TL;DR2026-01-11 기준, DeepSeek V4는 "출시 완료"가 아니라 "2월 중순 공개 예정"으로 보도됐다. "Claude/GPT보다 코딩이 낫다"는 표현도 공개 벤치마크가 아니라 내부 테스트/보도에 가깝다.DeepSeek는 별개 축으로 학습/인프라 효율성(연산·에너지 절감)을 강조하는 기술 문서(mHC)를 공개했고, 이는 GPU 접근 제약과 맞물려 주목받고 있다."중국 AI 주식이 데뷔와 동시에 두 배"는 DeepSeek가 아니라, 홍콩 IPO에서 MiniMax 주가가 공모가 대비 +109%로 마감한 사례 등 중국 AI 상장 러시 흐름으로 확인된다.실무 관점에서는 "코딩 성능"을 주장할 때 SWE-bench·HumanEval 등 평가 셋/재현 가능성을 확인하고, "초장문 프롬프트"가 실제로..

AI/Trend 2026.01.11

NVIDIA 그래픽 카드 모델(대표)별 Ollama 추천 모델 표

아래 표는 초보자 기준으로 "무난하게 시작"하는 추천입니다. (같은 VRAM이라도 GPU 세대/드라이버/설정에 따라 체감 성능은 달라질 수 있습니다)NVIDIA GPU (대표 모델)VRAM(공식 스펙)초보자 추천 Ollama 모델 예시(실제 모델명)이 조합이 잘 맞는 용도RTX 306012GB(또는 8GB 변형)llama3.1:8b, qwen2.5:7b, gemma2:9b문서 요약/번역/일상 Q&A "로컬 LLM 입문"RTX 3060 Ti8GBllama3.2:3b, phi3:mini, qwen2.5:3b가볍게 빠른 응답(짧은 문서/챗봇)RTX 40608GBllama3.2:3b, phi3:mini, mistral:7b"빠른 3B~7B" 중심(속도 우선)RTX 4060 Ti16GB 또는 8GB(16GB면) ..

AI/Technical 2026.01.09

DeepCogito(Cogito v2) 오픈 웨이트 하이브리드 추론 모델: IDA로 “직관”을 학습하는 이유

TL;DRDeepCogito의 Cogito v2(프리뷰)는 70B/109B(MoE)/405B/671B(MoE) 4개 하이브리드 추론 모델을 공개했고, 표준 응답 모드와 "생각(extended thinking)" 모드를 함께 제공합니다.핵심 메시지는 "추론 토큰(검색)을 길게 쓰는 대신, 추론 과정을 모델 파라미터로 증류해 '직관'을 강화한다"는 접근입니다(IDA/iterative policy improvement).공식 자료는 671B MoE가 DeepSeek R1 계열 대비 더 짧은(약 60% shorter) 추론 체인을 사용하면서 경쟁 성능을 보였다고 주장합니다.2025-11경 공개된 Cogito v2.1(671B MoE)는 128k 컨텍스트, 툴콜 지원, 상용 이용 가능한 "오픈 라이선스"로 배포되..

AI/Trend 2026.01.09

AI 해고 공포는 과장인가: 데이터로 본 고용·생산성 현실

TL;DROxford Economics 분석을 인용한 보도는 "AI가 지금 당장 대규모 실업을 만들고 있다"는 서사가 데이터로는 충분히 뒷받침되지 않는다고 본다.2025년(1–11월) 미국 '계획된(job cuts announced)' 감원 중 AI를 이유로 든 규모는 54,694명으로, 같은 기간 전체 117.1만 명 대비 약 4.7%다(단, '발표' 기준).생산성은 분기 단위로 출렁이며(예: 2025년 2분기 비농업 부문 생산성 +3.3% 연율), "AI가 이미 노동을 대체 중이라면 생산성이 구조적으로 가속해야 한다"는 주장과 달리 지속적 가속 신호가 아직 뚜렷하지 않다는 문제의식이 나온다.그럼에도 투자자(특히 AI 종목/ETF 보유자) 다수는 장기 수익에 낙관적(설문에서 93%)이다.결론: “AI ..

AI/Trend 2026.01.08

Kubeflow 사용법: 설치부터 Pipelines·Trainer·KServe까지

TL;DRKubeflow는 Kubernetes 위에서 Notebook - 파이프라인 자동화 - 분산 학습 - 튜닝 - 모델 서빙을 한 플랫폼에서 연결하는 오픈소스 생태계다.2025-12-15에 Kubeflow 1.11이 릴리스되었고, 설치는 주로 kubeflow/manifests의 Kustomize 기반 매니페스트로 진행한다.빠르게 시작하려면 Kind 기반 단일 커맨드 설치 후, istio-ingressgateway를 포트포워딩해 대시보드에 접속한다.Pipelines는 SDK로 파이썬 DSL을 IR YAML(파이프라인 스펙)로 컴파일해 업로드/실행한다.멀티유저 격리는 Profile/Namespace로 구현되며, KFP의 멀티유저 격리는 Kubeflow Platform 배포에서 지원된다.본문1) Kubef..

AI/Technical 2026.01.08
반응형