생활코딩/머신러닝야학(13)
-
비지도학습 정리
지금까지 비지도 학습에 해당되는 방법론을 살펴봤을것입니다 이번에는 그것들을 정리해보겠습니다. 비지도 학습을 통해서 서로 잘알아봅시다. 비지도 학습은 탐험적입니다. 탐험이 미지의 세계를 파악하는것이듯이 데이터의 성격을 파악하는 것이 목적입니다 독립,종속변수의 구분이 중요하지 않습니다. 그저 데이터만있으면됩니다. 지도학습은 역사적입니다 과거의 원인과 결과를 바탕으로 결과가 발생했을때 어떠한 결과를 초래할것인가 추측하는 것이 목적입니다 그래서 원인인 독립변수와 결과인 종속변수가 꼭필요합니다. 다시한번 강조하면 비지도학습은 데이터의 성격을 파악하는것이 목적입니다 비유를 들자면 나는 누구인가를 알수있는 좋은 방법이있습니다 바로 내가하는 말들의 빈도수들 을 정리정돈해서 조사해보는것입니다 긍정적인 단어를 많이 사용했..
2020.09.08 -
연관규칙학습
이번에는 비지도 학습에 속하는 연관을 해보겠습니다. 연관의 전체이름은 연관 규칙 학습 일명 장바구니 학습이라고 주로 불립니다 상상해봅시다 만약 자신이 온리인 쇼핑몰 사장이라면 더많은 상품을 판매하기위해 고민중이고 고객의 장바구니에 담긴 상품을 바탕으로 관심을 가질만한 상품을 추천하면 더많은 상품을 팔수 있겠네 라는 생각을 하게되었습니다. 이럴떄는 표를 봐야 합니다 이표는 지금 까지의 판매내역을 보여줍니다 하나 이상을 구매했다면 O 사지 않았다면 X입니다. 유심히 보면 라면을 구입한 사람은 계란을 구입할 확률이 높습니다. 즉 라면과 계란은 서로 연관성이 높다는 것을 알수 있습니다. 연관성을 파악할수 있다면 고객이 아직 구입하지 못했지만 구입할 가능성이 매우 높은 상품을 추천해줄수 있을것입니다. 이정도양의 ..
2020.09.07 -
군집화
이번에는 비지도 학습에 군집화에 대해 알아보겠습니다. 군집화는 비숫한 것들을 찾아서 그룹을 만드는 것입니다. 그러면 군집화와 분류와 햇갈릴수 있습니다 그러면 비교해보겠습니다 이사를 했는데 엄청나게 많은 물건들이 마구 어지럽혀져있을때 비슷한 것들 끼리 모아서 적당한 그룹을 만들것입니다. 이렇게 그룹을 만드는 것이 군집화 입니다. 그룹을 만든 후에는 각각의 물건은 적당한 그룹에 위치시키는 것을 분류입니다. 정리하자면 어떤 대상들을 구분해서 그룹은 만드는 것이 군집화라면 분류는 어떤 대상에 어떤 구룹에 속하는지를 판단하는것이라고 할수 있습니다 예를 들어 배달사업을 하고 서비스를 이용하는 사용자가 1000만명이 있다고 할때 위의 표에는 천만명의 위치가 표기되어 있고 이름 옆에는 위치정보인 위도 경도가 있고 이것..
2020.09.04 -
회귀와 분류
회귀 지도학습은 분류와 회귀와 분류로 나누어집니다 예측하고싶은 종속변수가 숫자일때 보통 회귀라는 머신러닝 방식을 사용합니다 그림에서 처럼 우리가 예측하고 싶은 1월 8일의 판매량은 어떤형태의 데이터인가요 바로 숫자입니다. 이럴떄 회귀를 사용합니다 앞으로 어떤문제를 만났는데 그문제에서 예측하고 싶다면 지도학습의 회귀로 해결해주세요 라고 요청하면됩니다. 공부를 직접하려면 지도학습에 회귀로 검색하면됩니다. 직접 스스로 해결하려면 지도학습 회귀라는 이름의 도구를 찾으면됩니다. 예시) 분류 이번에는 분류를 해보겠습니다 무엇인가를 분류한다는것은 어지럽혀있는 대상이 있을때 그것을 성격에 맞는 이름으로 구분해서 그룹화 시키는것을 그룹입니다 장난감을 장난감 수납장에 넣는것도 분류이고 바이러스를 검사한사람이 양성인지 음성..
2020.09.03 -
지도학습
지도학습은 역사와 비슷합니다 역사는 과거에 있었던 사건이 원인과 결과로 기록되어 있습니다 역사를 알면 어떤 사건이 일어났을때 그것의 결과로 어떤 일이 일어날지를 예측할수 있게됩니다 마찬가지로 지도학습은 과거의 데이터로 학습해서 결과를 예측하는데 주로 사용합니다. 위에 사진은 과거의 데이터로 이루어 져있습니다 데이터에는 온도라는 원인과 판매량이라는 결과의 관계가 맺어져있습니다. 일기예보를 보니 1월 8일에 온도가 25도라고 할때 그러면 우리가 알고싶은것은 1월 8일에는 몇개가 판매될지 예측하는것입니다 그래야 레몬이 몇개 필요하는지 알수 있으니까요 즉 과거의 대한 학습을 통해 미지의 데이터를 추측하고 싶은것이죠 이때 머신러닝의 지도학습이 이용될수 있습니다 이용하기위해서는 충분히 많은 데이터가 있어야 하고 데..
2020.09.02 -
머신러닝의 분류
머신러닝은 사실은 하나의 단일 기술이 아닙니다 머신러닝 안에는 서로다른 목적을 가진 여러도구들이 있습니다. 위의 사진만 보면 막막 하다고 느낄겁니다 그럴때 사용하는 것이 비유입니다 비유를 통해서 머신러닝의 여러분야들과 가벼운 인사를 나누어 봅시다 단 한가지 분명히 해야하는것이 있습니다 비유는 비슷한 것일뿐 진실이 아닙니다. 이상태에서 계속 머물러 있으면 안됩니다. 비유를 진실로 대처하려는 노력을 하거나 진실이 아니라는 것을 항상기억하고 열린 마음을 유지하셔야합니다. 지도 학습은 supervised learning 여기서의 지도는 기계를 가르친다는 의미입니다 마치 문제집을 푸는것과 같습니다 문제집에는 문제가 있고 정답이 있습니다 문제와 정답을 비교하고 맞추다 보면 점점 문제를 푸는것에 익숙해집니다 이후에는..
2020.09.01