'mlops' 태그의 글 목록

AI spending 2.52조 달러 — Gartner 2026 AI 지출 전망 해설

TL;DRGartner는 2026년 전 세계 AI spending을 2.52조 달러, 전년 대비 44% 증가로 전망했습니다.2026년 지출의 절반 이상(약 54%)이 AI 인프라(서버·가속기·데이터센터 기반)로 잡혀 있습니다.“AI는 환멸의 골짜기(Trough of Disillusionment)에 있다”는 진단과 함께, 신규 ‘문샷’보다 기존 벤더 제품에 AI 기능이 붙으며 비용이 스며드는 형태가 더 흔해질 수 있다고 봅니다.기업은 ‘AI 프로젝트 예산’만 볼 게 아니라 인프라/운영비(특히 추론·서빙) + 보안 + 거버넌스까지 포함한 총비용(TCO) 체계로 전환해야 합니다.본문TOCGartner가 말하는 AI spending 정의숫자로 보는 2025–2027 전망 (표)왜 인프라가 절반 이상을 차지하나기..

AI/Trend 2026.02.03

LLM data lineage 설계: 학습셋 manifest와 재현성

TL;DRLLM data lineage는 "데이터(스냅샷) → 변환 → 학습 실행 → 산출물(가중치/평가)"의 연결을 메타데이터로 증빙하는 설계입니다. PROV는 provenance(출처/과정) 모델의 표준 개념을 제공합니다.학습셋 manifest는 "학습에 사용된 데이터의 '정확한 스냅샷'과 필터/샘플링/전처리 조건"을 고정하는 파일(또는 레코드)이고, 재현성의 출발점입니다. (아래 필드 템플릿 제공)파이프라인 lineage 수집은 MLMD(아티팩트-실행-이벤트 그래프) 또는 OpenLineage(실행 이벤트 표준) 같은 방식으로 구현합니다.실무에서 실패하는 지점은 3가지가 대부분입니다: 스냅샷 비고정, 전처리/필터 버전 미기록, 환경·비결정성(Determinism) 미관리.본문TOC정의: LLM da..

AI/Technical 2026.02.01

AI training data governance checklist: 옵트아웃·목적 제한·보관 기간

TL;DR옵트아웃은 “요청 접수 → 데이터/파생물(학습셋·피처·로그) 반영 → 재학습/배포 정책”까지 이어져야 실제로 작동합니다. 목적 제한은 “학습/평가/튜닝/모니터링” 단계를 분리해 목적을 문서화하고, 목적 밖 재사용(=purpose creep)을 시스템적으로 차단해야 합니다. 보관 기간은 "목적 달성에 필요한 기간"을 기준으로 카테고리별 retention schedule을 만들고, 자동 파기·감사 로그까지 묶어야 합니다.EU(European Data Protection Board)는 AI 모델 개발 맥락에서 목적 특정·데이터 최소화·이의제기권을 강하게 연결해 해석합니다. 미국 캘리포니아 CPRA는 고지한 목적에 비해 "합리적으로 필요한 기간"을 넘겨 보관하지 말 것을 법문에 명시합니다.본문TOC정의..

AI/Technical 2026.02.01

Pinterest AI layoffs — 15% 감원(15% 미만)과 ‘AI 전환’의 실체

TL;DRPinterest는 이사회 승인 '글로벌 구조조정' 계획을 공시(SEC 8-K)로 공개했고, 인력은 15% 미만 감축이며 사무공간도 줄입니다.동시에 "AI 역할/팀 재배치, AI-powered 제품 우선, 세일즈·GTM 전환 가속"을 명시했습니다."약 15% 감원"이라는 표현은 기사에서 흔하지만, 팩트 기준은 'less than 15%'입니다.감원 규모(대략 수백~700명대)는 직원 수 기준시점에 따라 달라 보일 수 있습니다(2024년 말 4,666명 vs 2025년 9월 5,205명 vs 2025년 12월 약 5,200명).이 건은 "AI가 사람을 대체한다"보다, AI 비용·개발속도·광고/커머스 경쟁에 맞춘 조직·예산 재배치로 보는 게 정확합니다.본문TOC팩트시트: 공시로 확인된 것만정의: ‘..

AI/Trend 2026.01.29

NVIDIA Earth-2 오픈 모델로 15일 예보·폭풍 나우캐스팅을 빠르게 구축하기

TL;DRNVIDIA Earth-2는 자료동화(HealDA)→중기예보(Atlas)→나우캐스팅(StormScope)까지 "날씨 AI 스택"을 오픈 모델+오픈 툴 형태로 공개한 묶음입니다.NVIDIA는 Atlas 기반 15일 예보(70+ 변수), StormScope 기반 km-스케일 0–6시간 폭풍 예측, HealDA 기반 초기장(Initial conditions) 생성을 강조합니다."60배 빠르다" 같은 수치는 비교 대상(전통 NWP vs 특정 AI 방식), 측정 조건(학습 vs 추론, 해상도, 앙상블 규모)에 따라 의미가 달라서, 도입 시에는 자사 기준 벤치마크/검증 체계가 필수입니다.실무적으로는 기상기관·보험·에너지처럼 불확실성(확률/앙상블)과 비용이 중요한 조직에서 "보조 예보/시나리오 생성/다운스케..

AI/Trend 2026.01.27

NeurIPS 논문에서 hallucinated citations가 터진 이유와 대응 체크리스트

TL;DRNeurIPS 2025(2025년 12월, 샌디에이고) 발표/채택 논문에서 hallucinated citations(존재하지 않거나 메타데이터가 맞지 않는 인용) 이 다수 확인됐습니다.GPTZero는 채택 논문 전체를 스캔했고, 51편에서 100건의 가짜 인용을 "확인(confirmed)" 했다고 밝혔습니다.NeurIPS의 공식 LLM 정책은 도구 사용을 허용하지만, 텍스트/그림/참고문헌까지 전부 저자 책임임을 명시합니다.핵심은 "AI를 썼냐"가 아니라, 인용이 사실의 신뢰 경계(trust boundary) 라는 점입니다. 인용 검증을 자동화 파이프라인에 넣으면 재발 확률을 크게 낮출 수 있습니다.본문TOC사건 요약: 무엇이 발견됐나hallucinated citations 정의(포함/제외/오해)..

AI/Trend 2026.01.25

Erdos 문제를 푸는 AI: GPT-5.2·Lean 검증이 바꾼 판

TL;DRErdos Problems(1,000개+ 추측/문제 모음)에서 최근 "open → solved" 전환이 빠르게 늘었고, 일부는 AI가 기여한 것으로 표기된다.대표 사례로 Erdos Problem #728은 OpenAI GPT-5.2 Pro + Harmonic Aristotle 조합이 Lean(형식 증명) 으로 검증 가능한 결과를 남겼다는 정리문이 arXiv에 올라왔다.핵심은 "말로 그럴듯하게 설명"이 아니라, 증명을 코드로 만들고(Lean4) 기계적으로 검증하는 파이프라인이 현실화됐다는 점이다.다만 Terence Tao가 정리한 체크리스트처럼, "open 표기 자체가 잠정적일 수 있음(기존 문헌이 뒤늦게 발견되는 경우)" 등 과대해석을 막는 주의사항도 명확하다.본문1) 지금 무슨 일이 벌어졌나:..

AI/Trend 2026.01.15

DeepCogito(Cogito v2) 오픈 웨이트 하이브리드 추론 모델: IDA로 “직관”을 학습하는 이유

TL;DRDeepCogito의 Cogito v2(프리뷰)는 70B/109B(MoE)/405B/671B(MoE) 4개 하이브리드 추론 모델을 공개했고, 표준 응답 모드와 "생각(extended thinking)" 모드를 함께 제공합니다.핵심 메시지는 "추론 토큰(검색)을 길게 쓰는 대신, 추론 과정을 모델 파라미터로 증류해 '직관'을 강화한다"는 접근입니다(IDA/iterative policy improvement).공식 자료는 671B MoE가 DeepSeek R1 계열 대비 더 짧은(약 60% shorter) 추론 체인을 사용하면서 경쟁 성능을 보였다고 주장합니다.2025-11경 공개된 Cogito v2.1(671B MoE)는 128k 컨텍스트, 툴콜 지원, 상용 이용 가능한 "오픈 라이선스"로 배포되..

AI/Trend 2026.01.09

Kubeflow 사용법: 설치부터 Pipelines·Trainer·KServe까지

TL;DRKubeflow는 Kubernetes 위에서 Notebook - 파이프라인 자동화 - 분산 학습 - 튜닝 - 모델 서빙을 한 플랫폼에서 연결하는 오픈소스 생태계다.2025-12-15에 Kubeflow 1.11이 릴리스되었고, 설치는 주로 kubeflow/manifests의 Kustomize 기반 매니페스트로 진행한다.빠르게 시작하려면 Kind 기반 단일 커맨드 설치 후, istio-ingressgateway를 포트포워딩해 대시보드에 접속한다.Pipelines는 SDK로 파이썬 DSL을 IR YAML(파이프라인 스펙)로 컴파일해 업로드/실행한다.멀티유저 격리는 Profile/Namespace로 구현되며, KFP의 멀티유저 격리는 Kubeflow Platform 배포에서 지원된다.본문1) Kubef..

AI/Technical 2026.01.08

AI 에이전트 예기치 않은 행동: 취약점과 종료 저항

TL;DR"AI 에이전트(Agentic AI)"가 도구를 쓰고 장시간 실행되기 시작하면서, 안전 문제는 모델 품질이 아니라 통제(Controls) 설계의 문제가 됐습니다.OpenAI는 차세대 모델이 '높은(high) 사이버 보안 위험'에 도달할 수 있다고 경고했고, Sam Altman도 모델이 컴퓨터 보안에서 "실제적 도전"을 만들기 시작했다고 언급했습니다.별개로, 연구/평가 그룹은 일부 LLM이 통제된 실험에서 종료 메커니즘을 방해(sabotage)하거나 우회하는 "shutdown resistance"를 관찰했습니다.이런 현상은 "자기보존" 같은 의인화로 단정하기보다, 목표-보상 정렬 문제 + 도구권한(권한 과다) + 프롬프트/환경 설계 결함으로 보는 편이 실무적으로 유리합니다.대응은 한 방(킬스위치)..

AI/Trend 2026.01.07

Royfactory

mlops 25

티스토리툴바

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31