내일배움카드(6)
-
[데이터분석 인강] 코호트 분석과 푸쉬 노티피케이션
코호트 분석 데이터 분석 기법 중 하나로 코호트(동질 집단) 분석이 있다. 코호트란 특정 기간동안 공통된 특성이나 경험을 갖는 사용자 집단을 분석하는 것을 말하는데 대표적인 분석 예시가 사용자 이탈률/패턴, 재구매율같은 것들이 있다. # 구매 횟수 기준 우수 고객 확인 retail.groupby('CustomerID').count()['Quantity'].sort_values(ascending=False) # 지불 금액 기중 우수 고객 확인 retail.groupby('CustomerID').sum()['CheckoutPrice'].sort_values(ascending=False) # 사용자 기준으로 최초 구매한 월 연산하기 ## Month : 구매월, MonthStarted : 사용자가 최초 구매한 ..
2022.07.16 -
[데이터분석 인강]검색광고 데이터 분석 : 데이터 탐색 시각화ver. (선그래프)
matplotlib을 이용한 Series 시각화를 통해 데이터 탐색을 해보고자 한다. import pandas as pd from pandas import DataFrame from pandas import Series import matplotlib.pyplot as plt # matplotlib 한글 폰트 출력코드 # 출처 : 데이터공방( https://kiddwannabe.blog.me) import matplotlib from matplotlib import font_manager, rc import platform try : if platform.system() == 'Windows': # 윈도우인 경우 font_name = font_manager.FontProperties(fname="c:/W..
2022.07.09 -
Seaborn : scatterplot&pairplot&heatmap (데이터분석 인강)
Scatterplot lineplot과 비슷하게 x, y에 대한 데이터의 전체적인 분포를 확인하는 plot이다. 차이점이 있다면 lineplot이 x,y 관계를 선으로 그었다면 scatterplot은 물감을 뿌리듯 흩뿌려서 나타내준다. 산포도, 산점도라고도 한다. 그렇다 보니 lineplot은 경향성에 초점을 둔다면, scatterplot은 전체적인 데이터가 퍼져있는 모양에 중점을 둔다. # penguin 데이터에 scatterplot을 출력. ## 1. 질량과 부리 길이 관계 - 종별 차이 sns.scatterplot(data=penguins, x="body_mass_g", y="flipper_length_mm", hue="species") ## 2. 부리 길이와 깊이(두께) 관계 - 성별 차이 sns..
2022.07.03 -
[데이터분석 인강/Python 독학] 데이터 입출력(IO)
I/O (Input / Output) 말 그대로 프로그램 입장에서 들어오는 모든 데이터를 Input, 나가는 걸 Output이라고 한다. 스토리지로부터 파일을 불러오는 것도 input이고, 프로그램 결과를 스토리지에 저장하는 것 역시 ouput이라고 한다. 이 작업을 file I/O라고 통칭한다. 그 외에 키보드로 입력받는 걸 stdin이라고 하며, 반대로 모니터로 출력하는 걸 stdout이라고 한다. STDIN / STDOUT (Standard IN, Standard OUT) 이미 자주 사용하고 있는 input()과 print()가 여기에 해당된다. input()이 stdin이고, print()가 stout이다. python에서 stdin은 무조건 문자열 타입으로 들어오기 때문에 type casting..
2022.06.26 -
K-digital 기초역량훈련 데이터분석 인강 - 02. DT와 데이터 기반 의사결정+알고리즘을 활용한 정보 고도화
디지털 트랜스포메이션(digital trnasformation, DT, DX) 업무 프로세스 조직 문화의 변화 방향 제시 전산화와 디지털화로 2가지 전략으로 나뉜다. 전산화(computerization) 종이 서류로 처리하던 일을 태블릿으로 바꾸는 것이 대표적인 예인데, 만약 상부에 결재서류를 올릴 때 태블릿으로 한다면 지정란에 각자 입력하는 시스템이라 정보를 잘못 기입할 확률도 낮아지고 무엇보다 입력 즉시 데이터베이스에 저장된다는 높은 업무 효율성이 장점이다. 디지털화(digitalization) 데이터 기반 리서치와 결정을 내리는 프로세스를 뜻한다. 때문에 그러한 리서치 자료를 보고 올바른 의사결정을 내릴 수 있는 역량을 지녀야 한다. 또한 날짜만 바꾸고 분석 방법이 바뀌지 않는 경우의 업무의 경우,..
2022.06.19 -
K-digital 기초역량훈련 데이터분석 인강 - 01. 비즈니스 데이터
빅데이터 말 그대로 대용량의 데이터를 말한다. 대표적인 예시로 우리가 소비자로서 상품을 구매하는 일련의 과정에서 일어나는 모든 정보들이 -결재 날짜/수단, 구매한 상품, 카드 정보, 이용 택배사, 택배 수수료 등- 데이터에 해당된다. 우리가 구매 내역을 다시 확인할 수 있는 것도 이런 데이터들이 잘 정리되어 있기 때문이다. 따라서 개인에 대한 객관적인 정보를 담고 있기 때문에 최근 기업들이 이것에 주목하고 데이터를 분석할 수 있는 능력을 가진 전문가를 보유하고자 하는 것이다. 일반적인 비즈니스 데이터 기업은 거래라는 것을 하는데 거래 대상에 따라 B2B, B2C로 구분이 된다. B2B(Business-to-Business) 기업대 기업간의 사업이라 데이터의 규모는 크지만, 빈도는 적다. B2C(Busin..
2022.06.18