다중 클래스(Multi-Class)
Multi-class 분류 문제는 하나의 그림에 하나의 객체만 있어야 하고, 그리고 그 객체는 2개 이상의 카테고리에 속하는 경우
활성화 함수: 다중 클래스 분류에 주로 사용되는 활성화 함수는 Softmax 함수입니다. Softmax 함수는 입력 벡터를 정규화하여 다중 클래스 간의 확률 분포를 생성합니다.
손실 함수: 다중 클래스 분류에 일반적으로 사용되는 손실 함수는 범주형 교차 엔트로피 손실 (Categorical Cross-Entropy Loss)입니다. 이 손실 함수는 실제 클래스와 예측된 클래스 간의 오차를 계산하여 모든 예제에 대한 평균 손실을 구합니다.
다중 클래스에서 Softmax가 Sigmoid보다 일반적으로 더 선호되는 이유
확률의 해석: Softmax 함수는 다중 클래스 간의 확률 분포를 생성하므로, 각 클래스에 속할 확률을 해석하기에 적합합니다. 반면, Sigmoid 함수는 독립적인 이진 확률을 생성합니다. 따라서, Softmax 함수를 사용하면 다중 클래스 분류 결과를 보다 직관적으로 해석할 수 있습니다.
출력 값의 정규화: Softmax 함수는 출력의 합이 1이 되도록 정규화되어 다중 클래스 간의 상대적인 확률을 나타낼 수 있습니다. 반면, Sigmoid 함수는 출력을 [0, 1] 범위로 압축할 뿐이지만, 출력의 합이 1이 되지는 않습니다. 다중 클래스 문제에서는 Softmax 함수를 사용하여 클래스 간의 상대적인 중요성을 모델에 반영하는 것이 일반적입니다.
다중 레이블(Multi-Label)
Multi-label 분류 문제는 하나의 그림 내에 하나의 객체가 아니라, 여러 객체가 있다
다중 레이블 분류는 입력에 대해 여러 개의 독립적인 이진 레이블을 예측하는 문제입니다. 예를 들어, 이미지 분류에서 이미지가 개, 고양이, 자동차 등 여러 개의 클래스에 동시에 속할 수 있다는 것을 분류하는 것이 여기에 해당됩니다.
활성화 함수: 다중 레이블 분류에 사용되는 활성화 함수로는 Sigmoid 함수가 일반적으로 선택됩니다. Sigmoid 함수는 입력을 [0, 1] 범위로 압축하여 독립적인 이진 분류를 수행할 수 있습니다.
손실 함수: 다중 레이블 분류에서 일반적으로 사용되는 손실 함수는 이진 교차 엔트로피 손실 (Binary Cross-Entropy Loss)입니다. 각 레이블마다 이진 분류의 손실을 계산하고, 모든 레이블에 대한 평균 손실을 구합니다.
댓글