반응형

RNN 5

LSTM(Long Short-Term Memory) 네트워크 기초

1. 들어가며앞선 강의에서 순환 신경망(RNN)의 개념을 배웠습니다. 하지만 RNN에는 장기 의존성 문제(long-term dependency) 라는 한계가 있습니다.즉, 문장이 길어지거나 시퀀스 데이터가 길어질수록 앞쪽 정보를 뒤쪽에서 잘 기억하지 못한다는 것이죠.이를 해결하기 위해 고안된 것이 바로 LSTM(Long Short-Term Memory) 네트워크입니다. LSTM은 정보를 오랫동안 기억할 수 있도록 특별한 구조를 가지고 있어, 텍스트, 음성, 시계열 데이터 분석 등에서 널리 활용됩니다.2. LSTM의 핵심 아이디어LSTM은 RNN 구조에 **게이트(gate)**라는 장치를 추가한 모델입니다.게이트는 마치 “필터”처럼 어떤 정보를 기억할지, 잊을지를 결정합니다.Forget Gate (망각 게..

AI 2025.08.21

순환 신경망(RNN, Recurrent Neural Network) 기초

1) RNN이란 무엇인가?기존의 **Feedforward Neural Network(순전파 신경망)**는 입력을 독립적으로 처리합니다. 하지만 언어, 시계열 데이터처럼 **순서(순차성)**가 중요한 데이터는 이런 구조로 충분히 학습할 수 없습니다.RNN은 과거의 출력을 현재 입력과 함께 고려하여 **“기억”**을 반영할 수 있습니다.즉, **이전 단계(hidden state)**를 다음 단계로 전달하는 구조로, 순차적인 맥락을 이해하는 데 강점을 가집니다.2) RNN의 핵심 구조RNN의 기본 수식은 다음과 같습니다.Hidden state 갱신h_t = tanh(W_hh * h_(t-1) + W_xh * x_t + b_h)출력 계산y_t = W_hy * h_t + b_y여기서x_t: 시점 t의 입력h_t:..

AI 2025.08.20

딥러닝(Deep Learning) 기본 개념: CNN과 RNN 이해하기

1. 딥러닝이란 무엇인가?딥러닝(Deep Learning)은 다층 인공신경망(Artificial Neural Network) 을 기반으로 한 머신러닝 기법입니다.머신러닝의 한 분야이지만, 복잡한 데이터(이미지·음성·텍스트 등) 를 처리하는 데 특히 강력합니다.1.1 인공신경망의 기본 구조인공신경망은 사람의 뇌 구조에서 영감을 받아 뉴런(Neuron) 과 층(Layer) 으로 구성됩니다.입력층(Input Layer): 데이터가 들어오는 부분은닉층(Hidden Layer): 뉴런들이 데이터를 가공·변환출력층(Output Layer): 최종 예측값 산출예시: 사진(입력) → 여러 층을 거쳐 특징 추출 → ‘고양이’ 예측(출력)2. 딥러닝과 머신러닝의 차이구분머신러닝딥러닝특징 추출사람이 직접 정의모델이 자동으로..

AI 2025.08.12

RNN이란? – 순서를 기억하는 인공지능 모델

RNN이란? – 순서를 기억하는 인공지능 모델RNN(Recurrent Neural Network)은 시간 순서가 중요한 데이터(시퀀스 데이터)를 처리하는 데 특화된 인공지능 모델입니다.예를 들어, 문장, 음성, 주가, 센서 데이터처럼 이전 정보가 다음 결과에 영향을 주는 문제에서 사용됩니다.쉽게 말하면, 이전 입력을 기억해두고 다음 입력을 이해하는 구조를 가진 신경망입니다.왜 필요한가요?기존의 딥러닝 모델(CNN, MLP 등)은 각 입력을 독립적으로 처리합니다. 하지만 문장처럼 순서가 중요한 데이터는 앞의 정보가 뒤에 큰 영향을 줍니다.이럴 때 RNN이 필요합니다. RNN은 이전 입력을 내부 상태로 기억하면서 다음 입력을 처리합니다.예를 들어:문장의 뜻을 이해하려면 앞 단어를 기억해야 한다.음성 인식에서..

AI 2025.06.25

[AI] RNN(Recurrent Neural Network)과 MLP(Multi-Layer Perceptron)의 차이

1. 구조적 차이항목RNNMLP구조순환 구조. 이전 시점의 출력을 현재 입력과 함께 사용계층적 구조. 모든 입력은 독립적으로 처리됨파라미터 공유시간축에서 가중치 공유층 간에는 파라미터 공유 없음입력 형태시퀀스 데이터(시간 또는 순서가 있는 데이터)고정된 벡터 형태의 입력2. 데이터 처리 방식항목RNNMLP시간 의존성시간 순서를 따라 데이터를 처리하며, 이전 정보(히든 상태)를 기억모든 입력을 독립적으로 처리상태 저장내부 상태(히든 스테이트)를 유지함상태 저장 없음3. 사용되는 분야항목RNNMLP적합한 작업자연어 처리(NLP), 시계열 예측, 음성 인식 등 순차 데이터 처리이미지 분류, 구조화된 데이터 분류/회귀 등예시텍스트 생성, 기계 번역, 주가 예측 등숫자 분류, 고객 이탈 예측 등4. 계산 흐름ML..

AI 2025.05.30
반응형