Entropy

April 11, 2026

정보 엔트로피 (Information Entropy)

엔트로피(Entropy)란 어떤 확률 분포가 가지고 있는 본질적인 불확실성(Uncertainty)의 크기를 의미한다.

AI 모델 관점에서는 모델이 스스로의 예측에 대해 느끼는 헷갈림의 정도, 즉 자신감(Confidence)의 결여 수준으로 해석할 수 있다.

엔트로피는 1948년 클로드 섀넌(Claude Shannon)이 제안한 정보이론의 핵심 개념이다.

결과가 뻔할수록 엔트로피는 낮아지고, 결과가 혼란스러울수록 높아진다.

결과가 100% 확실하여 전혀 헷갈림이 없는 상태이다.

예시:

즉, 예측 난도가 거의 0이다.

모든 사건의 발생 확률이 균등할 때 엔트로피가 최대가 된다.

예시:

즉, 결과를 사전에 예측하기 가장 어렵다.

엔트로피는 각 사건의 정보량의 평균 기대값으로 정의된다.

$H(P) = - \sum_{x} P(x)\log_2 P(x)$

로그 밑이 2이므로 단위는 bit이다.

bit의 의미는 다음과 같다.

이 불확실성을 해소하기 위해 평균적으로 몇 번의 예/아니오 질문이 필요한가

예시:

엔트로피는 확률 분포의 불확실성을 수치화한 값이며,

AI에서는 모델의 확신도 평가, 이상치 탐지, 탐험 전략, 분기 기준 선정 등에 핵심적으로 활용된다.