본문 바로가기
Data Science/Machine Learning

[Machine Learning] 지도 학습 vs 비지도 학습 vs 강화 학습

by 인사이티드 2023. 1. 19.

머신러닝을 공부하다 보면 쉽게 지도 학습, 비지도 학습, 강화 학습과 같은 말들을 찾아볼 수 있다.
이름만 얼핏 들으면 지도 학습과 비지도 학습은 서로 반대되는 개념이고, 강화 학습은 점점 학습으로 인해 알고리즘이 강화되어가는 느낌이 든다.
하지만 나는 '지도'라는 단어 자체의 뜻이 헷갈렸다. 지도 학습에서의 지도는 다음과 같다.

지도(Supervised) : 어떤 목적이나 방향으로 가르쳐 이끌어 가는 것.


처음에 나는 어떤 지도(Map)가 있어서 그 방향으로 학습을 진행해나간다는 뜻인줄 알았지만, 누군가가 이끌어준다는 뜻의 지도였다.

지도 학습, 비지도 학습, 강화 학습 간의 차이는 다음과 같다.

 


1. 지도 학습(Supervised Learning)

지도 학습은 정답이 있는 데이터(labelled data)를 활용해 훈련 데이터로부터 프로그램 등을 학습시켜서 결과에 대한 예측을 만들어내는 기계 학습(Machine Learning)의 한 방법이다. 훈련 데이터와 정답을 주고서 프로그램을 학습시키는 것이다. 학습 후 검증 데이터를 통해 적절하게 학습되었는지 모델을 검증하는 과정을 거친다. 사람으로 비유하자면 학생이 학교에서 수업을 듣고(훈련 데이터로부터의 학습), 시험을 통해 평가(모델 검증)받는 것이다. 분류나 회귀 작업들이 대표적인 지도 학습의 예시이다.


하지만 데이터에 대한 레이블은 저절로 얻어지는 것이 아니다.
적절하게 레이블링하는 작업은 사람의 개입이 들어갈 수 밖에 없는 작업이다.
이런 작업들은 해당 분야 전문가들에 의해 수행되고 데이터의 양이 매우 많기 때문에 상당히 비용이 큰 작업들이다.
그래서 어떤 데이터들은 훈련할 수 있을 정도의 충분한 양이 되지 않기도 하다.

그렇다면 훈련 데이터가 적지만 레이블링 작업이 어려운 상황이라면 어떻게 해야 할까? 이에 대한 대안이 바로 비지도 학습이다.



2. 비지도 학습(Unsupervised Learning)


비지도 학습은 정답이 없는 데이터(Unlabelled data)를 분석함으로써 그 안에 숨어있는 패턴을 찾아내거나 데이터를 그룹화시키는 알고리즘을 말한다. 데이터 간의 유사성이나 차이점을 분석해서 적절한 해결책을 만들어낸다. 비지도 학습에는 차원축소(PCA), 군집 등이 있다.


3. 강화 학습(Reinforcement Learning)

강화 학습은 지도 학습, 비지도 학습과는 개념이 조금 다르다. 주어진 환경에 대해서 어떤 주체(software agent)가 행동을 취하고 보상을 받는다. 에이전트가 취한 행동에 따라 양의 보상 또는 음의 보상이 주어지며, 시행착오를 겪으면서 에이전트가 양의 보상이 최대로, 음의 보상이 최소가 되도록 학습하는 것을 강화학습이라고 한다. 2016년 3월에 이세돌과 바둑 경기를 두었던 구글 딥마인드의 바둑 인공지능 프로그램 알파고가 대표적인 강화학습의 결과물이다.

지도 학습, 비지도 학습, 강화 학습

 


참고자료:
[1] Aurélien Géron, 「Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow」, 한빛미디어, 2020
[2] What is Unsupervised Learning? - IBM, https://www.ibm.com/topics/unsupervised-learning

[3] Supervised, Unsupervised, and Reinforcement Learning - Medium, https://arshren.medium.com/supervised-unsupervised-and-reinforcement-learning-245b59709f68