이 블로그는 생활코딩 이고잉님의 머신러닝 야학을 듣고 스스로 이해한 내용을 바탕으로 작성합니다. 잘못된 내용이 있으면 댓글로 알려주세요 :)
머신러닝을 본격적으로 시작하기에 앞서, 머신러닝에는 어떤 종류들이 있고 각각 어떻게 분류되는지 보았습니다. 그래야 내가 해결하고자 하는 문제가 생겼을 때, 어떤 머신러닝을 사용하면 되는지 알 수 있고 공부를 할 때도 방향을 잡는데에 도움이 되기 때문입니다.
머신러닝의 분류
머신러닝은 크게 <지도학습, 강화학습, 비지도학습> 으로 분류됩니다.
*이미지 출처:머신러닝 야학 강의
지도학습 VS 비지도학습
지도학습과 비지도학습을 구분하면 종속변수의 유무입니다.
머신러닝에 사용하고자 하는 데이터 셋에 종속변수가 포함되어 있다면, 지도학습
없다면 비지도학습을 사용하면 됩니다.
독립변수: 원인, x
종속변수: 결과, y
지도학습은 X에 따른 Y 값이 기록되어 있으며 이 데이터 셋을 학습하여 주어진 X 값에 대한 Y값을 예측합니다.
비지도학습은 정답(Y)가 없습니다. 그래서 답을 알려주는 식으로 학습을 할 수 없습니다. 주어진 데이터 셋에서 원하는 패턴을 찾아내는 것이 비지도학습 입니다.
지도학습 - 분류, 회귀
예측하고자 하는 종속변수가 연속된 수 일때 회귀, 범주형 데이터 일 때 분류를 사용합니다.
예를들어서 구분해보겠습니다.
- 학습시간에 따른 시험 점수 예측 -> 회귀
- 학습시간에 따른 시험 합격 여부 예측 -> 분류
위의 첫번째 예에서 종속변수인 점수는 1~100 연속된 값을 가집니다. 두번째 예에서 종속변수인 합격 여부는 Yes OR No 둘 중 하나로 구분됩니다.
비지도학습 - 군집화, 연관
1) 군집화
주어진 데이터들을 어떠한 기준에 따라서 비슷하다고 판단되는 데이터끼리 묶어주는 작업입니다. 정답은 없으며, 주어진 데이터를 열심히 탐색해서 패턴을 찾아내어 군집을 만들어줍니다.
* 이미지 출처
2) 연관
말 그대로 서로 관련있는 특성(열)을 찾아주는 머신러닝 기법입니다.
*이미지 출처: 머신러닝 야학
위의 주문서 테이블 이미지에서 라면을 산 사람은 계란을 많이 사더라, 하는 연관성이 보입니다. 데이터가 적을때는 한눈에 보이지만, 판매하는 종류가 100개가 넘어간다면, 주문 수가 하루에 100개 이상씩 들어온다면 도저히 사람이 할 수가 없게 됩니다. 이럴때 사용하는것이 연관 머신러닝기법 입니다.
요즘 많은 서비스들에서 내가 한 행동에 기반하여 취향껏 추천해주는데, 거기에 이 알고리즘이 쓰인다고 이해할 수 있습니다!
넷플릭스 영화 추천, 쇼핑몰 옷 추천 등등 ..
강화학습
지도학습은 주어진 데이터 셋으로 학습하여 실력이 커나가는 것이라면, 강화학습은 데이터 셋이 주어지지 않고 경험으로 부딪히면서 실력을 쌓아가는 머신러닝 기법입니다.
적절한 행동을 한다면 상을 주고, 틀렸을 때엔 벌을 주면서 똑똑하게 만들어나갑니다.
강화학습을 통해 주차능력을 높이는 아래 영상을 보면 이해하는데에 도움이 됩니다.
https://www.youtube.com/watch?v=VMp6pq6_QjI
처음엔 주차가 무엇인지 전혀 모르는 듯 한데, 한 5만번 쯤 부터는 주차능력이 매우 높아져 있는 것을 확인 할 수 있습니다.
한번 학습시켜 놓은 알고리즘을 다양한 환경에서 재사용만 할 수 있다면 강력한 기법으로 생각됩니다.
머신러닝 지도
실제로 머신러닝으로 문제를 해결하려고 할 때 이보다 복잡하지만, 이렇게 도식화해서 사용하고자하는 머신러닝을 선택해 나간다는 관점에서 참고!
- 이미지 출처: 머신러닝 야학
느낀점
그 동안 랜덤 포레스트, 선형 회귀 등 따로따로 학습하면서 쉽게 잊어버리곤 했는데 전체적으로 어디에 속하는 개념인지 정리가 되어서 좋았습니다.
그리고 아직 수학, 코딩 등의 기술은 들어가지 않았지만 먼저 머신러닝에 친숙함을 느끼게 된 것이 가장 좋았습니다.
막연히 어렵고 나와 먼 세계라고 생각하지 않고, 충분히 활용해서 나만의 문제를 해결할 수 있는 고마운 도구로 생각하니 매우 두근거립니다 😍
평소에 추천 알고리즘에 관심이 많았는데, 이번 기회에 추천 시스템을 만들어보고 싶단 목표가 생겼습니다!!
'Today I Learned > 머신러닝' 카테고리의 다른 글
영화 리뷰 평점 예측해보기 (0) | 2020.09.30 |
---|---|
모델 평가 지표 - RMSE (0) | 2020.09.29 |
내가 쓰는 앱에서 추천시스템 찾아보기 (2) | 2020.09.27 |
Tensorflow 딥러닝으로 집 값 예측하기 (0) | 2020.09.13 |
Orange3로 코딩없이 머신러닝 지도학습 실습해보기 (0) | 2020.09.08 |