반응형

mlops 27

AI Sales Forecasting 판매 예측 데이터 모델링 템플릿 (2)

TL;DRAI Sales Forecasting 프로젝트는 모델보다 데이터 설계(스키마/시간 의미/누수 방지/품질 규칙)에서 승부가 납니다.판매 예측 데이터는 최소한 sales(타깃) + calendar(캘린더/이벤트) + price + promo + inventory/stockout 축으로 나눠 설계하는 게 안전합니다.시계열 피처 조인은 포인트-인-타임(과거 시점 기준) 정합성을 보장해야 누수(leakage)를 막을 수 있습니다.품절(stockout)은 관측 판매를 검열(censored)로 만들고 예측 편향을 유발할 수 있으니, 최소한 stockout_flag는 데이터 계약에 포함하세요.품질 관리는 "문서"가 아니라 검증 가능한 규칙(Expectation Suite)로 자동화하는 게 실무적으로 맞습니다...

AI/Technical 00:36:37

AI Sales Forecasting: AI 기반 판매 예측 설계 로드맵 (1)

TL;DRAI Sales Forecasting(판매 예측)은 “예측값”보다 예측을 어떻게 의사결정(재고·발주·인력)으로 연결하느냐가 성패를 가릅니다.설계는 문제 정의(단위·지평·리드타임) → 데이터 설계(타깃/캘린더/프로모션) → 베이스라인+백테스트 → 모델(통계/ML/DL) → 확률예측 → 배포·모니터링 순으로 가면 됩니다.평가에는 훈련/테스트 분리와 시계열 교차검증(rolling origin)이 필수입니다.확률예측(분위수/구간)을 도입하면 품절/과잉재고 비용처럼 비대칭 비용을 모델링하기 쉬워집니다.관리형 서비스(예: Vertex AI Forecasting, Azure AutoML Forecasting)는 빠르지만 제약이 있으니(예: 방식/추론 제약) 설계 초기에 결정해야 합니다.본문TOC연재(강의) ..

AI/Technical 2026.02.08

AI spending 2.52조 달러 — Gartner 2026 AI 지출 전망 해설

TL;DRGartner는 2026년 전 세계 AI spending을 2.52조 달러, 전년 대비 44% 증가로 전망했습니다.2026년 지출의 절반 이상(약 54%)이 AI 인프라(서버·가속기·데이터센터 기반)로 잡혀 있습니다.“AI는 환멸의 골짜기(Trough of Disillusionment)에 있다”는 진단과 함께, 신규 ‘문샷’보다 기존 벤더 제품에 AI 기능이 붙으며 비용이 스며드는 형태가 더 흔해질 수 있다고 봅니다.기업은 ‘AI 프로젝트 예산’만 볼 게 아니라 인프라/운영비(특히 추론·서빙) + 보안 + 거버넌스까지 포함한 총비용(TCO) 체계로 전환해야 합니다.본문TOCGartner가 말하는 AI spending 정의숫자로 보는 2025–2027 전망 (표)왜 인프라가 절반 이상을 차지하나기..

AI/Trend 2026.02.03

LLM data lineage 설계: 학습셋 manifest와 재현성

TL;DRLLM data lineage는 "데이터(스냅샷) → 변환 → 학습 실행 → 산출물(가중치/평가)"의 연결을 메타데이터로 증빙하는 설계입니다. PROV는 provenance(출처/과정) 모델의 표준 개념을 제공합니다.학습셋 manifest는 "학습에 사용된 데이터의 '정확한 스냅샷'과 필터/샘플링/전처리 조건"을 고정하는 파일(또는 레코드)이고, 재현성의 출발점입니다. (아래 필드 템플릿 제공)파이프라인 lineage 수집은 MLMD(아티팩트-실행-이벤트 그래프) 또는 OpenLineage(실행 이벤트 표준) 같은 방식으로 구현합니다.실무에서 실패하는 지점은 3가지가 대부분입니다: 스냅샷 비고정, 전처리/필터 버전 미기록, 환경·비결정성(Determinism) 미관리.본문TOC정의: LLM da..

AI/Technical 2026.02.01

AI training data governance checklist: 옵트아웃·목적 제한·보관 기간

TL;DR옵트아웃은 “요청 접수 → 데이터/파생물(학습셋·피처·로그) 반영 → 재학습/배포 정책”까지 이어져야 실제로 작동합니다. 목적 제한은 “학습/평가/튜닝/모니터링” 단계를 분리해 목적을 문서화하고, 목적 밖 재사용(=purpose creep)을 시스템적으로 차단해야 합니다. 보관 기간은 "목적 달성에 필요한 기간"을 기준으로 카테고리별 retention schedule을 만들고, 자동 파기·감사 로그까지 묶어야 합니다.EU(European Data Protection Board)는 AI 모델 개발 맥락에서 목적 특정·데이터 최소화·이의제기권을 강하게 연결해 해석합니다. 미국 캘리포니아 CPRA는 고지한 목적에 비해 "합리적으로 필요한 기간"을 넘겨 보관하지 말 것을 법문에 명시합니다.본문TOC정의..

AI/Technical 2026.02.01

Pinterest AI layoffs — 15% 감원(15% 미만)과 ‘AI 전환’의 실체

TL;DRPinterest는 이사회 승인 '글로벌 구조조정' 계획을 공시(SEC 8-K)로 공개했고, 인력은 15% 미만 감축이며 사무공간도 줄입니다.동시에 "AI 역할/팀 재배치, AI-powered 제품 우선, 세일즈·GTM 전환 가속"을 명시했습니다."약 15% 감원"이라는 표현은 기사에서 흔하지만, 팩트 기준은 'less than 15%'입니다.감원 규모(대략 수백~700명대)는 직원 수 기준시점에 따라 달라 보일 수 있습니다(2024년 말 4,666명 vs 2025년 9월 5,205명 vs 2025년 12월 약 5,200명).이 건은 "AI가 사람을 대체한다"보다, AI 비용·개발속도·광고/커머스 경쟁에 맞춘 조직·예산 재배치로 보는 게 정확합니다.본문TOC팩트시트: 공시로 확인된 것만정의: ‘..

AI/Trend 2026.01.29

NVIDIA Earth-2 오픈 모델로 15일 예보·폭풍 나우캐스팅을 빠르게 구축하기

TL;DRNVIDIA Earth-2는 자료동화(HealDA)→중기예보(Atlas)→나우캐스팅(StormScope)까지 "날씨 AI 스택"을 오픈 모델+오픈 툴 형태로 공개한 묶음입니다.NVIDIA는 Atlas 기반 15일 예보(70+ 변수), StormScope 기반 km-스케일 0–6시간 폭풍 예측, HealDA 기반 초기장(Initial conditions) 생성을 강조합니다."60배 빠르다" 같은 수치는 비교 대상(전통 NWP vs 특정 AI 방식), 측정 조건(학습 vs 추론, 해상도, 앙상블 규모)에 따라 의미가 달라서, 도입 시에는 자사 기준 벤치마크/검증 체계가 필수입니다.실무적으로는 기상기관·보험·에너지처럼 불확실성(확률/앙상블)과 비용이 중요한 조직에서 "보조 예보/시나리오 생성/다운스케..

AI/Trend 2026.01.27

NeurIPS 논문에서 hallucinated citations가 터진 이유와 대응 체크리스트

TL;DRNeurIPS 2025(2025년 12월, 샌디에이고) 발표/채택 논문에서 hallucinated citations(존재하지 않거나 메타데이터가 맞지 않는 인용) 이 다수 확인됐습니다.GPTZero는 채택 논문 전체를 스캔했고, 51편에서 100건의 가짜 인용을 "확인(confirmed)" 했다고 밝혔습니다.NeurIPS의 공식 LLM 정책은 도구 사용을 허용하지만, 텍스트/그림/참고문헌까지 전부 저자 책임임을 명시합니다.핵심은 "AI를 썼냐"가 아니라, 인용이 사실의 신뢰 경계(trust boundary) 라는 점입니다. 인용 검증을 자동화 파이프라인에 넣으면 재발 확률을 크게 낮출 수 있습니다.본문TOC사건 요약: 무엇이 발견됐나hallucinated citations 정의(포함/제외/오해)..

AI/Trend 2026.01.25

Erdos 문제를 푸는 AI: GPT-5.2·Lean 검증이 바꾼 판

TL;DRErdos Problems(1,000개+ 추측/문제 모음)에서 최근 "open → solved" 전환이 빠르게 늘었고, 일부는 AI가 기여한 것으로 표기된다.대표 사례로 Erdos Problem #728은 OpenAI GPT-5.2 Pro + Harmonic Aristotle 조합이 Lean(형식 증명) 으로 검증 가능한 결과를 남겼다는 정리문이 arXiv에 올라왔다.핵심은 "말로 그럴듯하게 설명"이 아니라, 증명을 코드로 만들고(Lean4) 기계적으로 검증하는 파이프라인이 현실화됐다는 점이다.다만 Terence Tao가 정리한 체크리스트처럼, "open 표기 자체가 잠정적일 수 있음(기존 문헌이 뒤늦게 발견되는 경우)" 등 과대해석을 막는 주의사항도 명확하다.본문1) 지금 무슨 일이 벌어졌나:..

AI/Trend 2026.01.15

DeepCogito(Cogito v2) 오픈 웨이트 하이브리드 추론 모델: IDA로 “직관”을 학습하는 이유

TL;DRDeepCogito의 Cogito v2(프리뷰)는 70B/109B(MoE)/405B/671B(MoE) 4개 하이브리드 추론 모델을 공개했고, 표준 응답 모드와 "생각(extended thinking)" 모드를 함께 제공합니다.핵심 메시지는 "추론 토큰(검색)을 길게 쓰는 대신, 추론 과정을 모델 파라미터로 증류해 '직관'을 강화한다"는 접근입니다(IDA/iterative policy improvement).공식 자료는 671B MoE가 DeepSeek R1 계열 대비 더 짧은(약 60% shorter) 추론 체인을 사용하면서 경쟁 성능을 보였다고 주장합니다.2025-11경 공개된 Cogito v2.1(671B MoE)는 128k 컨텍스트, 툴콜 지원, 상용 이용 가능한 "오픈 라이선스"로 배포되..

AI/Trend 2026.01.09
반응형