1. 기울기 소실 문제와 활성화 함수 오차 역전파는 출력층으로부터 하나씩 앞으로 되돌아가며 각 층의 가중치를 수정하는 방법 층이 늘어나면 역전파를 통해 전달되는 기울기의 값이 점점 작아져 맨 처음 층까지 전달되지 않는 기울기 소실(vanishing gradient)문제 발생 이는 활성화 함수로 사용된 시그모이드 함수의 특성 때문 시그모이드 함수의 미분값 최대치는 0.3인데 1보다 작으므로 계속 곱하면 0에 수렴 따라서 여러 층을 거칠수록 기울기가 사라져 가중치를 수정하기 어려워짐 ※시그모이드 대체 함수 하이퍼볼릭 탄젠트 함수(tanh) 시그모이드 함수의 범위를 -1에서 1까지로 확장한 개념 미분한 값의 범위가 함께 확장됨 여전히 1보다 작은 값이 존재하므로 기울기 소실 문제 해결 X 렐루 함수(ReLU)..