반응형

MachineLearning 12

복잡한 모델을 간단하게: Lasso Regression의 모든 것

Lasso Regression이란?Lasso Regression은 과적합(overfitting)을 방지하고 모델을 단순화하기 위해 고안된 선형 회귀의 확장 기법입니다. 특히 변수가 많은 경우, 불필요한 변수를 자동으로 제거해주기 때문에 해석 가능하고 일반화 성능이 높은 모델을 만들 수 있습니다.Lasso Regression의 개념Lasso는 Least Absolute Shrinkage and Selection Operator의 줄임말로, L1 정규화 항을 포함한 회귀 모델입니다.일반 선형 회귀 식:y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ + εLasso 회귀의 손실 함수:Loss = RSS + λ \* Σ|βᵢ|RSS: 잔차 제곱합 (Residual Sum of Squares)λ: 규..

AI 2025.06.26

AI 모델 성능을 좌우하는 데이터 전처리, 어떻게 해야 할까?

데이터 전처리란?AI나 머신러닝 모델을 만들 때 가장 먼저 해야 할 일은 데이터를 준비하는 것입니다.하지만 현실의 데이터는 깨끗하지 않고, 불완전한 경우가 대부분입니다.예를 들어:누락된 값(Missing Values): 키나 나이 정보가 비어 있을 수 있음이상한 값(Outliers): 나이가 150살로 되어 있는 경우형식이 제각각인 데이터: 어떤 날짜는 2025-06-01, 어떤 날짜는 06/01/25처럼 되어 있음이런 데이터를 정리하고 표준화하는 작업을 **데이터 전처리(Data Preprocessing)**라고 합니다.왜 데이터 전처리가 중요할까?AI 모델은 주어진 데이터를 그대로 믿고 학습합니다.즉, 좋지 않은 데이터를 넣으면 모델 성능도 나빠집니다.이것을 흔히 GIGO(Garbage In, Gar..

AI 2025.06.17
반응형