반응형

MachineLearning 11

NBA 경기 예측 ML 모델 구축 전략: Elo·피처 50개·캘리브레이션·인게임 확장 파이프라인

TL;DRNBA 경기 예측은 "승패를 맞히는 분류"보다 확률 품질(LogLoss/Brier)과 캘리브레이션이 제품 관점에서 더 중요합니다.구축 순서는 Elo 베이스라인(빠른 검증) → 피처 확장 + GBDT/ML → 캘리브레이션 → 운영 모니터링이 가장 안전합니다.NBA는 일정/휴식 영향이 큽니다. 백투백·휴식일·이동이 승률/퍼포먼스에 영향을 준다는 연구 결과가 있습니다.Elo는 "업데이트 규칙"과 "시즌 평균회귀(리셋)"를 명시해야 재현 가능한 파이프라인이 됩니다(538은 시즌 시작 시 평균으로 1/4 회귀 예시를 공개).인게임 확장은 PBP(Play-by-Play) 이벤트 스트림 → 상태 피처 → 온라인 추론 구조로 별도 파이프라인을 두는 게 일반적이며, 관련 베이지안 접근 연구도 있습니다.본문1) ..

AI/Trend 2025.12.28

PyTorch를 활용한 딥러닝 모델 개발: 핵심 특징과 실무 적용

PyTorch는 Meta(구 Facebook) 가 개발한 딥러닝 프레임워크로, Define-by-Run(동적 계산 그래프) 방식을 채택하여 모델을 직관적으로 개발하고 디버깅하기 쉽습니다. 핵심은 Tensor 객체를 중심으로 한 GPU 가속 지원과 Autograd를 통한 자동 미분 기능입니다. 2025년 10월 현재 최신 안정 버전은 PyTorch 2.9.0이며, 지속적인 성능 최적화와 TorchScript, ONNX 등 프로덕션 환경을 위한 배포 도구를 제공하여 연구부터 실무 배포까지 전 과정을 지원하는 Python 중심의 강력한 생태계를 구축하고 있습니다.PyTorch의 핵심 아키텍처 및 특징PyTorch는 유연성과 속도를 위해 설계된 오픈소스 머신러닝 라이브러리입니다. 특히 연구 커뮤니티에서 가장 선..

AI 2025.10.31

비지도학습 실습: 군집과 차원 축소

1. 비지도학습(Unsupervised Learning)이란?비지도학습은 정답(Label)이 없는 데이터에서 패턴, 구조, 관계를 찾아내는 학습 방식입니다.지도학습처럼 ‘정답지’가 없기 때문에, 모델은 스스로 데이터의 숨은 규칙을 발견합니다.1.1 주요 활용 사례고객 세분화: 구매 이력 기반 고객 그룹 나누기이상치 탐지: 금융 사기, 시스템 장애 조기 감지데이터 시각화: 고차원 데이터를 2D/3D로 축소해 이해도 향상2. 군집(Clustering)군집은 유사한 데이터끼리 묶는 작업입니다.대표적인 알고리즘은 다음과 같습니다.알고리즘특징K-Means간단하고 빠르지만, 군집 개수를 사전에 지정해야 함계층적 군집(Hierarchical)데이터 계층 구조를 시각화 가능DBSCAN군집 개수를 지정하지 않아도 되며 ..

AI 2025.08.16

지도학습 실습: 분류(Classification)와 회귀(Regression)

1. 지도학습이란?지도학습(Supervised Learning)은 입력 데이터(Input) 와 정답(Label) 이 함께 주어져,모델이 이를 학습한 뒤 새로운 입력에 대한 정답을 예측하는 학습 방식입니다.1.1 분류 vs 회귀구분 설명 출력값 예시 활용 사례분류데이터가 속할 범주(Category)를 예측스팸/정상, 품종명, 등급스팸메일 탐지, 질병 진단회귀연속적인 숫자 값을 예측가격, 온도, 확률주가 예측, 판매량 예측2. 분류(Classification)2.1 개념데이터를 여러 범주(Class) 중 하나로 분류예: ‘이 메일은 스팸인가, 아닌가?’2.2 주요 알고리즘로지스틱 회귀(Logistic Regression)의사결정나무(Decision Tree)서포트 벡터 머신(SVM)랜덤 포레스트(Random..

AI 2025.08.16

딥러닝(Deep Learning) 기본 개념: CNN과 RNN 이해하기

1. 딥러닝이란 무엇인가?딥러닝(Deep Learning)은 다층 인공신경망(Artificial Neural Network) 을 기반으로 한 머신러닝 기법입니다.머신러닝의 한 분야이지만, 복잡한 데이터(이미지·음성·텍스트 등) 를 처리하는 데 특히 강력합니다.1.1 인공신경망의 기본 구조인공신경망은 사람의 뇌 구조에서 영감을 받아 뉴런(Neuron) 과 층(Layer) 으로 구성됩니다.입력층(Input Layer): 데이터가 들어오는 부분은닉층(Hidden Layer): 뉴런들이 데이터를 가공·변환출력층(Output Layer): 최종 예측값 산출예시: 사진(입력) → 여러 층을 거쳐 특징 추출 → ‘고양이’ 예측(출력)2. 딥러닝과 머신러닝의 차이구분머신러닝딥러닝특징 추출사람이 직접 정의모델이 자동으로..

AI 2025.08.12

머신러닝 기본 개념: 지도·비지도·강화학습 쉽게 이해하기

1. 머신러닝(Machine Learning)이란?머신러닝은 컴퓨터가 데이터를 학습하여 스스로 규칙을 찾아내고 예측을 수행하는 기술입니다.즉, 사람이 ‘규칙’을 직접 알려주는 대신, 컴퓨터가 ‘예시 데이터’를 보고 규칙을 스스로 찾아냅니다.1.1 일상 속의 머신러닝 예시스팸 메일 필터: 스팸과 정상 메일의 패턴을 학습하여 자동 분류음성 인식: 수많은 음성 데이터로 발음을 학습추천 시스템: 시청·구매 이력 기반 상품 추천자율주행 자동차: 도로 영상·센서 데이터로 주행 패턴 학습2. 머신러닝의 세 가지 학습 방식머신러닝은 크게 지도학습, 비지도학습, 강화학습으로 나눕니다.2.1 지도학습 (Supervised Learning)**정답(Label)**이 있는 데이터로 학습입력(X) → 모델 → 출력(y) 예측예..

AI/Infrastructure 2025.08.11

AI 입문 가이드: 개념부터 이미지 분류 실습까지

1. 인공지능(AI)이란 무엇인가?인공지능(Artificial Intelligence, AI)은 사람의 지능적 활동을 컴퓨터가 흉내 내도록 만드는 기술입니다.쉽게 말해, “사람처럼 생각하고, 배우고, 판단할 수 있는 컴퓨터”를 만드는 것이 목표입니다.일상적인 예시네이버·구글에서 검색어를 입력했을 때 자동으로 추천 키워드가 나오는 기능카메라가 자동으로 사람 얼굴을 인식하고 초점을 맞추는 기능스마트 스피커(예: Google Home, 네이버 Clova)가 음성 명령을 이해하고 대답하는 기능AI를 이해할 때는 약인공지능(Narrow AI) 과 강인공지능(AGI) 의 차이를 먼저 알아두면 좋습니다.구분특징예시약인공지능특정 분야에만 특화된 AI번역기, 추천 시스템, 얼굴 인식강인공지능인간 수준의 모든 지적 활동 ..

AI 2025.08.10

중국, 휴머노이드 로봇 축구 리그 개막! 어린이 수준 AI의 실제 경기 도전기

중국에서 시작된 휴머노이드 로봇 축구 리그최근 중국이 첫 번째 휴머노이드 로봇 축구 리그를 시작했습니다. 단순한 쇼가 아니라, 인공지능(AI)과 로보틱스 기술의 현실 적용을 실험하는 장이기도 합니다.이 리그는 Booster Robotics라는 회사에서 개발한 AI 제어 로봇들이 선수로 참여합니다. 이 로봇들의 기술 수준은 대략 5~6세 어린이와 비슷합니다.경기 수준은? 실제로 넘어지고, 부상도 있어요실제 경기에서는 예상치 못한 장면들도 많습니다.로봇이 걷다가 넘어진 뒤 들것에 실려나가는 장면도 연출되었습니다.예시: 마치 유치원 운동회에서 아이들이 넘어지고 일어나는 것처럼, 로봇들도 균형을 잡지 못하고 넘어지며 부딪히는 일이 다반사입니다.왜 하필 축구일까?Booster Robotics의 창립자는 이렇게 말..

AI 2025.07.07

파이썬으로 머신러닝 시작하기: Scikit-Learn 핵심 정리

Scikit-Learn이란? (sklearn 완전 정복)Scikit-learn(일반적으로 sklearn으로 불림)은 파이썬에서 가장 널리 사용되는 머신러닝 라이브러리 중 하나입니다. 회귀, 분류, 군집화, 전처리, 모델 선택까지 머신러닝의 거의 모든 과정을 빠르고 쉽게 구현할 수 있도록 도와줍니다.초보자에게는 쉬운 입문 도구로, 실무자에게는 강력한 실험 프레임워크로 활용됩니다.Scikit-Learn의 주요 특징다양한 알고리즘 제공선형 회귀, 로지스틱 회귀, 결정 트리, 랜덤 포레스트, SVM, KNN 등.강력한 전처리 기능정규화, 스케일링, 인코딩, 결측치 처리 등.모델 선택 도구교차검증(Cross Validation), GridSearchCV, RandomizedSearchCV 등.Pipeline 지원..

AI 2025.06.27

복잡한 모델을 간단하게: Lasso Regression의 모든 것

Lasso Regression이란?Lasso Regression은 과적합(overfitting)을 방지하고 모델을 단순화하기 위해 고안된 선형 회귀의 확장 기법입니다. 특히 변수가 많은 경우, 불필요한 변수를 자동으로 제거해주기 때문에 해석 가능하고 일반화 성능이 높은 모델을 만들 수 있습니다.Lasso Regression의 개념Lasso는 Least Absolute Shrinkage and Selection Operator의 줄임말로, L1 정규화 항을 포함한 회귀 모델입니다.일반 선형 회귀 식:y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ + εLasso 회귀의 손실 함수:Loss = RSS + λ \* Σ|βᵢ|RSS: 잔차 제곱합 (Residual Sum of Squares)λ: 규..

AI 2025.06.26
반응형