TL;DR임베딩은 범주형·비정형 데이터를 연속적인 수치 벡터로 변환하는 표현 기법이다.이 벡터 표현은 데이터 간 유사도·관계·구조를 보존하며, 머신러닝 모델의 입력으로 사용된다.자연어 처리뿐 아니라 추천 시스템, 그래프 분석, 범주형 피처 처리 전반에 활용되는 ML의 기본 도구다.본문1. 임베딩이란 무엇인가임베딩(Embedding)은 문자, 단어, 카테고리, 노드와 같은 이산적(discrete) 데이터를머신러닝 모델이 다룰 수 있도록 연속적인 수치 공간의 벡터로 매핑하는 방법이다.핵심은 단순한 숫자 치환이 아니라,데이터 간 관계와 의미를 수치 공간에서 유지하는 데 있다.예:단어 → 의미가 비슷한 단어일수록 가까운 벡터상품 ID → 함께 구매되는 상품일수록 가까운 벡터노드 → 연결 구조가 유사할수록 가까운..