1/2

데이터 분석 실무 테크닉: 다변량 분석과 머신러닝

중급
챕터 3개 · 1시간 25분
한국어 · 영어 · 일본어|오디오 한국어

이런 걸 배울 거예요

온라인 서점을 이용하는 고객은 어떤 특징을 가질까?

요인분석을 활용하면 설문조사에 나타난 고객의 특징을 파악할 수 있다!

고객분석을 통해 그룹을 나눠보자!

클러스터링을 활용하면 유사한 패턴을 보이는 고객을 그룹화 할 수 있다.


클래스 소개

안녕하세요, 저는 현재 금융회사 7년 차 데이터 사이언티스트로 일하고 있는 조르도입니다.

과거에는 추천 시스템 개발자로, 현재는 데이터 사이언티스트로 일하면서 데이터 분석의 실무에 대해 알려드리고자 클래스를 열게 되었습니다.

데이터 분석가의 실무 테크닉 배우기


해당 클래스를 수강하시는 분들 중에 클래스 1편인 [데이터 분석가에게 배우는 통계 실무: 가설 검증하기]를 수강하신 분도 있을 것입니다. 1편에서는 기초 통계 이론과 파이썬으로 통계 도구를 직접 만들어보는 시간을 가졌습니다. 여기까지만 들으셔도 큰 무리 없이 대부분의 데이터 분석 문제는 해결할 역량이 되셨다고 봐도 무방합니다.


이번 시간에는 한 발 더 나아가 다변량 데이터를 분석하는 방법론에 대해서 배웁니다.


다변량 데이터는 한 개의 개체가 여러 가지 특성을 가지는 것을 의미하는데요. 예를 들면 저라는 사람은 연령, 나이, 성별, 직업 등과 같은 여러가지 특징을 가집니다. 이것이 바로 다변량 데이터 입니다.

다변량 데이터는 언제 사용할까요?

마케팅 예산이 제한적인 상황에서 최대의 효과를 내는 마케팅을 한다고 상상해 봅시다. 과거 데이터를 통해 이를 해결할 수 있을까요? 당연히 가능합니다.


  1. 먼저 과거 마케팅을 진행했었던 데이터를 모두 수집합니다.(수집 방법은 클래스 1편에서 배운 pandas를 활용할 수 있습니다.)

  2. 고객을 하나의 단위로 해서 여러 가지 특징들(연령, 성별, 직업, 구매 횟수 등)을 모두 나열합니다.

  3. 마케팅에 반응했었던 고객을 반응 수준에 따라 나누어 하나의 변수로 만들고 군집화를 진행합니다. (계층적 군집화 활용)

  4. 군집이 끝났다면, 마케팅에 자주 반응하는 고객의 특징을 추출합니다.(Decision Tree 활용)

  5. 해당 특징에 맞는 고객들만을 추려서 마케팅을 진행합니다.

  6. 마케팅 성과를 집계합니다.

  7. 과거와 정말 비용 대비 효과가 있었는지 확인합니다.

자 이렇게 다변량 데이터 분석이 끝났습니다. 어떠신가요?

위에서 설명한 내용을 모두 수업에 담았습니다. 해당 강의를 들으시면 저 위와 비슷한 문제를 쉽게 푸실 수 있을 거라고 자신합니다!


수강 효과

  • 다변량 데이터를 분석할 수 있게 됩니다.

  • 효과(마케팅, 추천, 등) 검증을 할 수 있게 됩니다.

  • 뭘 하든 데이터가 있다면 이것을 기반으로 더 나은 의사결정을 할 수 있게 됩니다.


추천 대상

  • [데이터 분석가에게 배우는 통계 실무: 가설 검증하기] 클래스를 듣고 데이터 분석을 더 잘하고 싶으신 분

  • 머신러닝을 데이터 분석에 활용해 보고 싶으신 분

  • 금융 데이터 분석가의 실무 테크닉을 배우고 싶은 데이터 분석가

  • 고객 데이터를 다양하게 분석하고 인사이트를 얻고자 하는 현직자

  • -데이터 분석을 효율적으로 하고 싶은 직장인


수강 전 참고 사항

  • 노트북과 인터넷만 있다면 모두 수강 & 실습이 가능합니다.


이 클래스가 특별한 이유

어렵게 설명하지 않겠습니다.

직관적으로 바로 활용할 수 있게 실용적으로 접근합니다.


❶ 주성분 분석 vs 인자분석 뭐가 다를까?


  • 고객이 갖고 있는 대표적인 특징을 몇 개로 나눠볼 수는 없을까? 주성분 분석

  • 고객이 공통적으로 갖고 있는 특징은 뭘까? 요인 분석

주성분 분석은 많은 변수에 포함되어 있는 정보를 적은 수의 변수로 나타내고 싶을 때 사용합니다.

예로 알아볼까요?

  • 국어, 수학, 영어, 과학, 사회 점수의 데이터를 이용하여 주성분 분석하여 두 가지의 주성분을 추출한다면 이를 통해 종합적으로 뛰어난 것인지, 이과적인 특징이 있는지 알 수 있습니다.

인자 분석은 복잡한 관련성으로 인해 상관관계로는 알기 어려운 것을 인자 분석을 통하여 변수의 배후에 공통으로 존재하는 인자를 추출해 변수 간의 관련성을 알 수 있습니다.

예로 알아볼까요?

  • 설문조사 문항 10개는 사실 2개의 문항으로 표현된다면 설문조사 문항 설계가 잘못되어 있다는 뜻입니다. 이것을 인자 분석을 통해 찾아낼 수 있습니다.

❷ 고객을 특징 별로 그룹화 해보자! 클러스터링


  • 우리 회사의 고객은 대표적으로 몇 개의 그룹으로 나뉠까?

  • 가격에 예민한 고객과 아닌 군을 나눠볼 수 없을까?

  • 마케팅에 반응할 고객을 추려서 타겟 마케팅을 하려면 어떻게 해야 할까?

  • 정답은 클러스터링!

머신러닝 군집화의 대표적인 알고리즘인 계층적 군집화에 대해서 배웁니다. 계층 군집화 알고리즘을 통해 분류되지 않은 데이터를 그룹화할 수 있게 됩니다.

❸ 이 그룹에 속한 고객들의 특징이 뭘까? Decision Tree!


  • 머신러닝은 패턴을 학습하는 데에도 능하지만, 패턴을 해석하는 것에도 활용할 수 있습니다.

  • 클러스터링을 통해 고객을 그룹화했다면, 그 그룹이 갖는 특징을 Decision Tree로 추출할 수 있습니다.

머신러닝 분류기 중 대표적인 알고리즘인 Decision Tree에 대해 배웁니다. 해당 알고리즘의 원리와 기존 활용 방식을 학습하고, Decision Tree가 주는 강력한 장점인 해석력을 바탕으로 데이터 분석에서 어떻게 쓰일 수 있는지 사례를 기반으로 알려드립니다.

커리큘럼

크리에이터

조르도

조르도

[경력]

- 카이스트 산업및시스템공학과 석사 졸업

- 전) 카이스트 학부생 코딩 강사

- 전) LG CNS 인공지능 실무 강사

- 전) KB금융지주 추천시스템 모델링 실무 강사

- 전) 금융회사 추천시스템 개발자

- 현) 금융회사 데이터 분석가



안녕하세요, 저는 카이스트 산업공학과 석사를 마치고 현 금융회사 실무 데이터 분석가로 일하고 있는 조르도 입니다. 어렵고 모호할 수 있는 통계와 머신러닝을 재미있게 실전 사례로 풀어서 설명해 드리겠습니다.

이 클래스와 비슷한 추천 클래스

데이터 분석가에게 배우는 통계 실무: 가설 검증하기데이터분석  |  조르도

copyrightprotectionnoticetitle

  • copyrightprotectionnoticeanswer
고객센터오전 10시 ~ 오후 6시 (주말, 공휴일 제외)
주식회사 클래스101
대표 공대선
서울특별시 강남구 테헤란로 415, 4층(삼성동, 엘7강남타워)
대표전화 : 1800-2109
이메일 : ask@101.inc
사업자등록번호 : 457-81-00277
통신판매업신고 : 2022-서울강남-02525
클라우드 호스팅 : Amazon Web Services Korea LLC
사업자 정보 자세히 보기
클래스101은 통신판매중개자로서 중개하는 거래에 대하여 책임을 부담하지 않습니다.