클래스클럽커뮤니티
1/2

데이터 분석가에게 배우는 통계 실무: 가설 검증하기

초급
챕터 5개 · 2시간 56분
한국어 · 영어 · 일본어|오디오 한국어

이런 걸 배울 거예요

데이터의 분포를 판단하는 왜도! 이런 걸 왜 외우세요?

외우지 말고 이해하세요! 평균과 중간값을 이해하면 외울 필요 없습니다.

내가 5분 안에 지하철을 탑승할 확률은?

지수분포를 실생활에 적용해 보자!

고혈압 환자에게 좋은 치료법은 무엇일까?

실제 의학 논문을 분석해 보며 기초통계의 힘을 느끼게 됩니다!


클래스 소개

안녕하세요, 저는 현재 금융회사 7년 차 데이터 사이언티스트로 일하고 있는 조르도입니다.

과거에는 추천 시스템 개발자로, 현재는 데이터 사이언티스트로 일하면서 데이터 분석의 실무에 대해 알려드리고자 클래스를 열게 되었습니다.

데이터 분석이라고 하면 엄청 공부 많이 한 석,박사들이나 하는 것 같고, 도전하기 어려운 분야라고 생각하고 계실 겁니다. 그러나 현업에서 하는 데이터 분석은 그렇게 복잡하지 않습니다.


회사에서 시행한 마케팅의 효과가 있었는지를 확인하기 위해서 어떻게 하면 될까요?


이 문제를 해결하기 위해서 과연 많은 통계 지식이 필요할까요?

마케팅을 시행할 고객과 아닌 고객을 나눠서 시행 이후의 데이터를 수집하고, 마케팅 효과에 영향을 줄 수 있는 독립변수들 예를 들면, 연령대와 성별 등을 고려하여 마케팅으로 촉발될 효과들을 서로 비교하면 그만입니다. 여기서 제가 사용한 지식은 1) 실험군/대조군을 나누는 것 2) 분포에 기반한 검정과 같은 기초 통계 지식 입니다.

이렇듯 회사에서 푸는 많은 데이터 분석 업무들은 기초 통계 지식에 기반한 문제가 95% 이상이라고 자신합니다.

기초 통계 지식들과 실무에서 사용하는 효율적인 방법론들 어려운 말 다 빼고, 직관적으로 이해되고 바로 활용할 수 있도록 클래스를 구성했습니다. 기초적인 통계 지식을 배우고 이를 기반으로 여러 가지 가설들을 검정해 봅니다. 또한 어려워 보이는 의학 논문을 배운 것을 기반으로 충분히 분석할 수 있다는 것 또한 수업 시간에 다룹니다.

꼭 완강하셔서 자신의 업무에 사용하시기 바랍니다.


데이터 분석가의 실무 테크닉 배우기


저의 클래스는 난이도별로 총 2개의 클래스로 구성되어 있습니다. 이번 클래스에서 기초 통계 이론을 충분히 배우신 후, 다음 클래스에서 데이터 분석을 더욱 효율적으로 해주는 머신러닝을 배우실 수 있도록 준비했습니다.


수강 효과

  • 데이터에 데짜도 모르는 생초짜 분들, 코딩 모르는 분들, 통계 모르는 분들이 데이터 분석을 자유롭게 할 수 있게 됩니다.

  • 데이터를 분석하기 앞서 통계적 사고방식에 대해서 알게 됩니다.

  • 회사에서 떠다니는 가설들을 데이터로써 입증하여 자신 있게 말할 수 있게 됩니다.


추천 대상

  • 귀무가설, 1종 오류 등과 같은 어려운 말 때문에 통계 강의 포기하신 분

  • 데이터 분석을 위한 코딩을 배우고 싶은데, 어디서부터 시작해야 될지 모르시겠는 분

  • 데이터 분석에 따른 의사결정을 하고 싶은 분

  • 데이터 사이언티스트의 실무 테크닉을 배우고 싶은 분


수강 전 참고 사항

  • 해당 클래스에서는 온라인 코드 노트북 Colab을 활용합니다. 노트북만 있다면 누구든 하실 수 있습니다.


이 클래스가 특별한 이유

❶ 실생활 & 실무에서 발생하는 예시로 기초 통계 이론 쉽게 이해하기

<산술평균? 기하평균? 뭘 써야할까?>


데이터의 특징을 파악하기 위한 지표인 평균

아무렇게 써도 괜찮을까요? 산술평균은 대부분의 경우에 항상 기하평균보다 큰 값을 가집니다.

지표의 특징을 모르고 쓰면 과대평가된 평균 값이 나오게 됩니다!

(EX: 내 수익률 500%!!!, 실제론 20%)


<나의 수학점수 50점, 영어 점수 80점 어떤 과목을 더 잘한 걸까?>

표준화변량

과목마다 다른 난이도, 영어 점수가 높다고 수학보다 잘한 걸까요? 이럴 때 사용하는 표준화 변량입니다.

표준화 변량을 활용하면 과목 간의 난이도를 고려하여 보다 정확한 비교가 가능합니다.


<어떤 마케팅이 가장 효과적이었을까?>

분산분석

마케팅은 정말 효과가 있었을까? 어떤 마케팅이 더 효과적이었을까?

매출(=실험결과)에 영향을 줄 것이라고 생각되는 마케팅(=요인)의 효과를 측정하기 위해 분산분석을 활용하여 어떤 마케팅이 효과적이었는지 알아봅니다.


❷ 데이터 핸들링을 위한 파이썬과 판다스 기초

데이터 분석을 위해 파이썬의과 판다스의 기초를 쉽게 알려드립니다. 쉬운 예시로 기본 문법과 나에게 맞는 사용자 정의 함수까지 알려드립니다. 충분한 복습을 하신다면 이후에 진행할 통계 패키지 제작과 실제 자료 가설 검증까지 따라오실 수 있습니다.



❸실제 의학 논문으로 가설 검증하기

지금까지 배운 것을 토대로 의학 논문에서 사용한 통계방법론을 검증하는 과정을 함께 실습하며, 실무에서 통계 지식을 어떻게 활용할 수 있는지 감을 잡아가는 시간을 가져보도록 하겠습니다.


커리큘럼

크리에이터

조르도

조르도

[경력]

- 카이스트 산업및시스템공학과 석사 졸업

- 전) 카이스트 학부생 코딩 강사

- 전) LG CNS 인공지능 실무 강사

- 전) KB금융지주 추천시스템 모델링 실무 강사

- 전) 금융회사 추천시스템 개발자

- 현) 금융회사 데이터 분석가



안녕하세요, 저는 카이스트 산업공학과 석사를 마치고 현 금융회사 실무 데이터 분석가로 일하고 있는 조르도 입니다. 어렵고 모호할 수 있는 통계와 머신러닝을 재미있게 실전 사례로 풀어서 설명해 드리겠습니다.

이 클래스와 비슷한 추천 클래스

직접 보고 느끼는 기초 통계 이론 완성데이터분석  |  슬기로운통계생활

copyrightprotectionnoticetitle

  • copyrightprotectionnoticeanswer
고객센터오전 10시 ~ 오후 6시 (주말, 공휴일 제외)
주식회사 클래스101
대표 공대선
서울특별시 강남구 강남대로94길 10, 11층 1101호(역삼동, 패스트파이브 강남4호점)
대표전화 : 1800-2109
이메일 : ask@101.inc
사업자등록번호 : 457-81-00277
통신판매업신고 : 2022-서울강남-02525
클라우드 호스팅 : Amazon Web Services Korea LLC
사업자 정보 자세히 보기
클래스101은 통신판매중개자로서 중개하는 거래에 대하여 책임을 부담하지 않습니다.