
"이 메일은 스팸일까?"우리가 매일 받는 이메일 중 어떤 건 쓸모 있고, 어떤 건 스팸입니다.이걸 자동으로 판단해주는 계산기가 바로 나이브 베이즈(Naive Bayes)입니다.나이브 베이즈란?한마디로 말해,확률을 이용해 어떤 대상이 어느 범주에 속하는지 판단하는 분류 모델입니다.예를 들어 메일 내용에 포함된 단어들을 보고스팸일 확률과 정상 메일일 확률을 계산한 뒤더 높은 쪽을 선택하는 방식입니다.예시로 이해해보자어떤 이메일에 이런 문구가 들어있다고 해볼게요."무료""당첨""지금 클릭"이때 나이브 베이즈는 이렇게 생각합니다.“이 단어들이 들어있는 메일이 스팸일 가능성은 얼마나 될까?”그리고 단어 하나하나가 스팸 메일에서 얼마나 자주 등장했는지를 기준으로확률을 곱해서 결과를 계산합니다.왜 '나이브(순진한)'..