반응형

2026/02 23

AI Sales Forecasting 9: 간헐수요 예측: 제로(0) 많은 SKU를 AI Sales Forecasting에 붙이는 법

TL;DR간헐수요 예측은 "0이 많은 판매 시계열"을 다루는 별도 트랙이며, 일반 MAPE 싸움으로는 답이 안 나옵니다. Croston 계열(Croston/SBA/TSB)을 최소 베이스라인으로 고정하세요.Croston은 수요 크기와 도착 간격을 분리해 평활하는 고전 접근이지만 편향 이슈가 알려져 있고, SBA는 이를 완화하는 변형으로 널리 인용됩니다."0이 많은 이유"가 진짜 무수요인지 품절/노출 부족으로 검열된 판매인지부터 분리해야 모델이 망가지지 않습니다(데이터 계약/게이트가 먼저).더 강한 확률 모델이 필요하면 제로-인플레이션 카운트 시계열(예: ZIP 기반 상태공간) 같은 접근이 연구·실무에서 쓰입니다.본문TOC주제 정규화사전 요구사항: “0의 의미”를 데이터로 고정설계 절차: 간헐 SKU 분류 ..

AI/Technical 13:29:22

AI Sales Forecasting 8: 계층 예측·콜드스타트·프로모션 Uplift 설계

TL;DRAI Sales Forecasting에서 "SKU 합 = 카테고리 합 = 전체 합"이 깨지면 계획/발주가 바로 꼬인다. 해결책은 Forecast Reconciliation(조정)이다.계층 예측은 보통 (1) 모든 레벨에 대해 base forecast 생성 → (2) MinT 같은 방법으로 coherent(합 일치)하게 조정이 표준이다.신제품(콜드스타트)은 "예측 모델을 바꾸는 문제"라기보다 정보를 어디서 빌려오느냐(유사 상품/계층/콘텐츠 특징/가격대) 설계가 핵심이다.프로모션은 평균 수요를 흔드는 이벤트라서, (a) 예측 피처로 넣는 방식과 (b) uplift를 따로 추정(인과/반사실)하는 방식을 분리해 설계해야 한다.본문0) 주제 정규화1문장 정의: 계층 예측·콜드스타트·프로모션 Uplift ..

AI/Technical 01:15:17

AI Sales Forecasting 7: 운영(MLOps) 설계—모니터링·드리프트·재학습·릴리즈

TL;DRAI Sales Forecasting는 "모델 학습"이 끝이 아니라 운영 루프(모니터링→원인분석→재학습/롤백)가 설계의 80%입니다.운영에서 반드시 나눠 모니터링해야 할 것은 3개: 데이터 품질(입력), 드리프트(분포), 성능(라벨 도착 후).배포는 "한 번에 교체"가 아니라 모델 레지스트리 기반 버저닝 + 챔피언/챌린저 + 카나리가 기본입니다.본문TOC사전 요구사항(로그·스키마·지연 라벨)운영 아키텍처: 배치 예측 파이프라인의 표준 형태단계별 절차: “모니터링 3종”을 먼저 만든다검증 방법: 어디를 보면 고장인지 바로 알 수 있나릴리즈 전략: 레지스트리·카나리·롤백트러블슈팅 3종(가장 흔한 사고)실무 체크리스트(배포 전 / 운영 중)FAQ(6개)1) 사전 요구사항(로그·스키마·지연 라벨)AI ..

AI/Technical 2026.02.10

AI Sales Forecasting 6: 서비스레벨·안전재고·ROP 설계

TL;DRAI Sales Forecasting의 “정답”은 MAPE가 아니라, 목표 서비스레벨/비용을 만족하는 발주 의사결정이다.발주점(ROP)·안전재고는 “리드타임 동안의 수요 분포”를 만들고, 원하는 서비스레벨에 해당하는 분위수(quantile)를 쓰면 된다.단, 일자별 P95를 더해서 리드타임 P95를 만들면 안 된다(분위수는 합산 불가). 샘플 경로(시뮬레이션)로 합산해 분포를 만든다.단발성(프로모션/시즌) 발주는 Newsvendor(크리티컬 프랙타일)로 “부족비용 vs 과잉비용”을 분위수로 바꿀 수 있다.예측 구간(PI)이 과신되면 서비스레벨이 무너진다. 컨포멀(conformal)로 구간 커버리지를 보정하는 게 안전하다.본문TOC이번 차시 목표와 사전 준비서비스레벨: CSL vs Fill Rat..

카테고리 없음 2026.02.10

AI Sales Forecasting 5: 딥러닝·파운데이션 모델로 판매 예측 설계

TL;DRAI Sales Forecasting에서 딥러닝은 "피처 기반 ML(GBDT)"로 한계가 보일 때, 멀티호라이즌·복잡한 공변량·불확실성(분포 예측)을 더 일관되게 처리하려고 쓰는 카드입니다.최근엔 TimesFM·Chronos·TimeGPT처럼 사전학습(Pretrained) 기반 파운데이션 모델이 등장해, 데이터가 부족한 도메인에서도 제로샷/소량 적응을 시도할 수 있습니다.실무 설계의 핵심은 "모델 고르기"가 아니라 (1) 공변량을 예측 시점에 공급 가능한지, (2) 롤링 오리진 백테스트, (3) 예측구간 불확실성(PI/Quantile) 캘리브레이션, (4) 비용·지연·서빙 형태를 같이 묶는 것입니다.팩트시트 (초안 전 필수)핵심 정의(1문장): 딥러닝 판매 예측은 다수 시계열을 "글로벌 모델"로..

AI/Technical 2026.02.10

AI Sales Forecasting 4: 피처 기반 ML로 판매 예측 설계

TL;DRAI Sales Forecasting에서 피처 기반 머신러닝(GBDT)은 “시계열을 회귀 문제로 변환”해 대량 SKU/매장 예측을 안정적으로 확장합니다.핵심은 (1) 라그/롤링/캘린더/외생변수 설계, (2) 누수 방지(point-in-time), (3) 롤링 오리진 백테스트, (4) WAPE 중심 평가, (5) 분위수(quantile)로 불확실성까지 한 번에 엮는 것입니다.이번 편에서는 “실무 파이프라인”을 그대로 따라 만들 수 있게 데이터 스키마, 피처 분류, 학습/검증, 운영 체크리스트를 제공합니다.본문TOC피처 기반 ML 판매 예측의 정의와 범위데이터 스키마: (store, item) 패널을 “롱 포맷”으로 고정피처 설계: 라그/롤링/캘린더/외생변수(Static/Dynamic/Calenda..

AI/Technical 2026.02.09

AI Sales Forecasting 백테스트 설계: Rolling CV·베이스라인·리포트 (3)

TL;DRAI Sales Forecasting에서 백테스트는 "점수 뽑기"가 아니라 운영과 같은 조건으로 성능을 검증하는 절차입니다. FPP3는 진짜 예측 오차는 학습 잔차가 아니라 새 데이터에서의 genuine forecasts로 봐야 한다고 정리합니다.기본은 rolling forecasting origin(rolling-origin) + expanding/rolling window + 재학습(refit) 여부 명시입니다.리테일/판매 예측에서는 MAPE만 고집하지 말고 WAPE(볼륨 가중), MASE(스케일드) 같은 지표를 함께 써야 합니다.베이스라인은 최소 Seasonal Naive + ETS(지수평활 계열) 2개를 두고, 모든 모델은 여기에 "상대 개선"으로 보고하세요.분위수(확률) 예측을 한다면 ..

AI/Technical 2026.02.09

AI Sales Forecasting 판매 예측 데이터 모델링 템플릿 (2)

TL;DRAI Sales Forecasting 프로젝트는 모델보다 데이터 설계(스키마/시간 의미/누수 방지/품질 규칙)에서 승부가 납니다.판매 예측 데이터는 최소한 sales(타깃) + calendar(캘린더/이벤트) + price + promo + inventory/stockout 축으로 나눠 설계하는 게 안전합니다.시계열 피처 조인은 포인트-인-타임(과거 시점 기준) 정합성을 보장해야 누수(leakage)를 막을 수 있습니다.품절(stockout)은 관측 판매를 검열(censored)로 만들고 예측 편향을 유발할 수 있으니, 최소한 stockout_flag는 데이터 계약에 포함하세요.품질 관리는 "문서"가 아니라 검증 가능한 규칙(Expectation Suite)로 자동화하는 게 실무적으로 맞습니다...

AI/Technical 2026.02.09

AI Sales Forecasting: AI 기반 판매 예측 설계 로드맵 (1)

TL;DRAI Sales Forecasting(판매 예측)은 “예측값”보다 예측을 어떻게 의사결정(재고·발주·인력)으로 연결하느냐가 성패를 가릅니다.설계는 문제 정의(단위·지평·리드타임) → 데이터 설계(타깃/캘린더/프로모션) → 베이스라인+백테스트 → 모델(통계/ML/DL) → 확률예측 → 배포·모니터링 순으로 가면 됩니다.평가에는 훈련/테스트 분리와 시계열 교차검증(rolling origin)이 필수입니다.확률예측(분위수/구간)을 도입하면 품절/과잉재고 비용처럼 비대칭 비용을 모델링하기 쉬워집니다.관리형 서비스(예: Vertex AI Forecasting, Azure AutoML Forecasting)는 빠르지만 제약이 있으니(예: 방식/추론 제약) 설계 초기에 결정해야 합니다.본문TOC연재(강의) ..

AI/Technical 2026.02.08

Open LLM Leaderboard로 보는 허깅페이스 LLM 경쟁 추세

TL;DROpen LLM Leaderboard v2는 "지식 퀴즈"보다 추론·형식 준수·장문 컨텍스트·어려운 QA 쪽으로 평가축이 이동했습니다.v2 "contents" 데이터셋 기준, Average 최고치는 약 52.1이고, 특히 GPQA / MuSR 구간이 전체 평균을 끌어내리는 병목으로 보입니다(최고점 자체가 낮음).상위권에는 머지(merged)·커뮤니티 튜닝 모델이 많이 보이며, "공식 배포 모델"과 "커뮤니티/머지 모델"을 구분해서 봐야 합니다.리더보드는 "대충 좋은 모델"을 고르는 데는 강하지만, 프로덕션(비용/지연/안전/도메인 적합성) 결론을 대신해주지 않습니다.본문TOCOpen LLM Leaderboard 정의: 포함/제외/오해v2가 실제로 보는 벤치마크(6종)와 채점 축데이터로 본 추세(점..

AI/Trend 2026.02.08
반응형