클래스클럽커뮤니티
1/6

그림은 말보다 강하다! 문돌이도 쉽게 배우는 파이썬 데이터 시각화/EDA

초급
챕터 7개 · 5시간 50분
한국어 · 영어 · 일본어|오디오 한국어

이런 걸 배울 거예요

시각화를 왜 해야 할까요?

우리가 데이터를 시각화해야 하는 이유와 그 방법을 설명해드립니다.

탐색적 데이터 분석과 시각화

데이터사이언스에서의 EDA과정과 시각화의 역할에 대해 알아봅니다.

실무 프로젝트로 익히는 데이터 시각화

실무 HR, 마케팅 데이터로 시각화를 진행하며 인사이트를 함께 찾아요.

시각화 라이브러리의 효과적인 사용법

Seaborn, Matplotlib를 이용한 화려한 시각화를 배워봅니다.


데이터 시각화를

왜 해야 하나요?

어떤 자료가 더 한 눈에 들어오나요?

▶︎ 어떤 자료가 더 한 눈에 들어오나요?

표로 그려진 데이터보다, 히트맵 차트로 데이터의 상관관계를 더 빠르게 파악할 수 있습니다.

이렇듯 예뻐서가 아니라, 효율적으로 일하기 위해 우리는 시각화를 사용합니다. 시각을 사용해 히트맵을 보는 것이 인지기능을 사용해 표 숫자들을 이해하는 것보다 효율적이기 때문이죠.


차트는 엑셀로도

만들 수 있지만...

 15만개의 데이터를 차트로 그리려다 화면이 멈췄어요

▶︎ 15만개의 데이터를 차트로 그리려다 화면이 멈췄어요


이런 한계들이 있어요.


  • 용량 부족: 엑셀은 대용량 데이터를 가공하기 힘들어요. 클릭해놓고 한나절을 기다리다... 화면이 멈추고 모든 것이 날아가기도 하지요. (ㅠㅠ)
  • 한정적인 시각화 기능: 만들 수 있는 차트 종류가 적어요. 다양한 인사이트를 찾기 보다는 간단한 보고서 작성에 적합한 툴입니다.


파이썬을 사용하는

이유가 있나요?

파이썬파이썬2


파이썬 자체로도 완벽한 툴이에요.


  • 효율성: 100,000행 이상의 고용량 데이터를 1초 안에 시각화 할 수 있습니다. (초 단위로 쏟아져 나오는 공정 데이터 등을 다루시는 분들께는 파이썬을 이용한 데이터 시각화가 혁명적으로 다가오실 거예요.)
  • 기법의 다양성: 기본 그래프를 배우고 난 뒤, 라이브러리 페이지에서 나에게 필요한 그래프를 찾아 다루고 계신 실무영역에 응용해보세요. (Tip 강의에 해당 과정을 따로 담아 놓았습니다!)
  • 세밀한 옵션 설정: 이것만 보여주면 게임 끝일것 같은, 머릿속에 잘~ 그려져 있는 바로 그 차트! 다양한 옵션을 통해 그대로 시각화 할 수 있도록 도와드립니다.

보너스 장점도 있어요.


  • 빅데이터분석/기계학습/인공지능 에 연동 가능해요. (데이터 분석가의 80퍼센트 이상이 파이썬 툴을 사용하고 있답니다.)


다른 데이터분석 클래스와

무엇이 다른가요?

탐색적 데이터 분석

  • 본 과정은 빅데이터 분석 단계 중 하나인 탐색적 데이터 분석(Exploratory Data Analysis)을 위한 과정입니다.
  • 데이터를 마치 “탐험가처럼 샅샅히 뒤져서” 인사이트를 찾는 것이지요.
  • 간단한 경영 분석을 위한 대시보드를 만들 경우 보여줘야 할 보편적인 지표들이 있지만, EDA는 내가 궁금한 걸 전부 시각화 할 수 있어야 합니다. 이 둘의 차이를 알아볼까요?😉


시각화 자료

위는 "직원들의 퇴사 이유 현황" 을 보고하기 위해 만든 일반적인 시각화 자료입니다. 이런 시각화 자료들이 다양한 지표를 중심으로 모여 있으면 그것이 대쉬보드이지요. 직관적으로 정보를 이해하기 좋습니다.




시각화 자료 2


하지만, 이번에 인사 관리부에서는 높은 퇴사율로 인한 문제가 화두가 되어 그 원인을 파악하고자 합니다.


  • 그렇다면, 먼저 '몰입도 저하' , '보상 불만족' 등 상위 4개 케이스들을 빨갛게 묶어 이들의 특성을 살펴보면 답이 나오지 않을까요?



시각화 자료 3



짜잔~ 데이터를 따로 떼어 가장 먼저 해당 인원들의 직무를 알아보았더니,

'프로덕트 기술자(Production Techinition)'가 이상하리만치 많네요.


  • 이 직무에 뭔가 문제가 있나 봅니다.
  • 아니면, 단순히 기술자가 절대적으로 많은 회사라 높게 나온 것일 수도 있겠지요? (머릿수만 센 거니까요.)
  • 확인을 위해 전체 인원 대비 비율로도 그래프를 그려봐야 합니다.
  • 비율로 그려도 똑같이 높다면? 한층 더 깊이 들어가 원인을 찾아야 합니다.

이런 과정들이 바로 EDA 의 시작 단계 입니다. 차이가 보이시나요? 이 클래스에서는 이를 자유자재로 하기 위한 기본 스킬과 라이브러리들을 익힙니다. 또한, 실무 데이터를 통해 기본적인 EDA 과정도 맛볼 수 있도록 기획하였습니다.



분석이 어렵지 않도록

꼼꼼하게 알려드릴게요!

시각화 자료4시각화 자료 5시각화 자료 6


'이 데이터로 어떤 시각화를 해야 하지?'

'시각화는 했는데.. 여기서 인사이트를 어떻게 찾아?'


문과 출신 데이터 분석가로 일하며 겪었던 고충들, 강의를 진행하며 받았던 질문들을 기반으로 단순 시각화를 넘어 인사이트를 찾는 '시각적 분석'이 될 수 있도록 여러분만의 데이터 분석 멘토가 되어드릴게요!



코드는 저희가 드릴테니

호기심만 들고 오세요!

  • 실무에 바로 적용 가능한 시각화 코드를 제공합니다. 제공되는 코드에 데이터와 변수만 바꾸어 바로바로 고퀄리티 시각화를 완성해 보세요.
  • 저도 처음에는 이렇게 쉽게(?) 했습니다. 재밌으시면 스스로 더 공부하시게 될 거에요!


작은 시각화 스킬만 있다면 날개를 달고 나만의 강점을 만들어낼 수 있습니다.

0과 1의 데이터 세상에서 의미 있는 인사이트를 찾는 일에 모두 함께 해요!





준비물 · 코칭권

💌 데이터에반젤리스트의 1:1 코칭 (3회)

  • 1회 코칭권 당 1가지의 질문을 하실 수 있습니다.
  • 1개 질문에 대해 300자 내외 답변을 드립니다.


  • 첫 번째, 다루고 계시는 현업 데이터를 시각화 하고자 하시면, 막히는 부분을 같이 풀어드리거나, 상황을 고려해 더 좋은 시각화 방향도 찾아 드립니다.(추천)
  • 두 번째, 강의 내용(프로젝트 포함)과 관련된 추가 설명이 필요한 경우 사용하실 수 있습니다.
  • 세 번째, 이 외 클래스와 관련된 질문은 답변 한도 내에서 성심껏 답변해드립니다.


📌 코칭권 사용방법

  1. Class 101 웹 또는 앱에서 [내 클래스]를 눌러주세요.
  2. [내 클래스]에서 [코칭권 미션]으로 들어가 [코칭 받기]를 눌러주세요.
  3. [글 작성하기]에서 작성해서 보내주세요!
  4. 코칭은 질문 접수일 기준으로 진행되며 7~10일 내 답변을 받을 수 있습니다.


🚨코칭권은 구매일 후 20주 동안 사용하실 수 있으며, 기간 내 미사용은 환불되지 않습니다.

📢 패키지는 일부 변동될 수 있으며, 변동될 시 충분히 안내됩니다.

커리큘럼

크리에이터

데이터에반젤리스트

데이터에반젤리스트

안녕하세요, 문과 출신 데이터 분석가 데이터에반젤리스트입니다.


처음 외국계 기업에서 HR로 커리어를 시작했습니다. 데이터를 기반으로 인사이트를 발견하는 것이 흥미로워 이제는 데이터 분석가 및 컨설턴트로써 활동하고 있습니다.


파이썬을 처음 배웠을 당시 어렵고 낯설었던 기억을 되살려, 여러분들에게 최대한 쉽고 재미있게 파이썬 데이터 시각화를 알려드리고자 합니다.


  • (현) 이노밸류파트너즈 선임연구원
  • (전) 외국계 기업 근무 (산업: 반도체, 보안서비스)

이 클래스와 비슷한 추천 클래스

Python 101: 매일 30분, 40일 동안! LV. 1 파이썬 기초 프로젝트프로그래밍언어  |  Python101

copyrightprotectionnoticetitle

  • copyrightprotectionnoticeanswer
고객센터오전 10시 ~ 오후 6시 (주말, 공휴일 제외)
주식회사 클래스101
대표 공대선
서울특별시 강남구 강남대로94길 10, 11층 1101호(역삼동, 패스트파이브 강남4호점)
대표전화 : 1800-2109
이메일 : ask@101.inc
사업자등록번호 : 457-81-00277
통신판매업신고 : 2022-서울강남-02525
클라우드 호스팅 : Amazon Web Services Korea LLC
사업자 정보 자세히 보기
클래스101은 통신판매중개자로서 중개하는 거래에 대하여 책임을 부담하지 않습니다.