numpy(7)
-
Kaggle Survey EDA 03 : 직업과 관련된 EDA
교육수준 EDA를 했던 것과 동일한 방식으로 진행된다. 직업과 관련된 질문은 Q5, 20, 22가 있었다. Q5 Select the title most similar to your current role Q20 What is the size of the compnay where are employed? Q22 Does your current employer incorporate machine learning methods into their business? Q5 column Q5 = final_data["Q5"][1:] Q5를 정의해주고 plt.figure(figsize=(12, 12)) plt.hist(Q5) plt.xticks(rotation='vertical') plt.title("Histogra..
2022.07.06 -
Numpy Array Aggregation functions
Aggregation functions Numpy에서 많이 사용되는 또다른 함수들로 전체 데이터에 대한 계산값을 돌려주는 함수라 따로 뺐다. mat1 = np.random.randn(5.3) 앞서 만들었던 mat1을 이어서 사용할 거다. # 행렬의 모든 값들의 합 np.sum(mat1) # 옵션 추가 - column 별 총합 뽑아내기 np.sum(mat1, axis=0) # 옵션 추가 - row 별 총합 뽑아내기 np.sum(mat1, axis=1) # 평균 np.mean(mat1) 옵션에서 axis=0은 열을 의미하고, axis=1은 행을 의미한다고 이미 약속되어 있는 거다. mat3 = np.random.rand(5,3) 다른 평균값들 계산을 위해 행렬을 하나 더 생성하였다. 근데 이때 사용한 함수는..
2022.06.29 -
Numpy Array Functions
Numpy Methods 암기 ❌! 구글링 ⭕ 그래도 자주 사용하는 기본적인 몇 가지는 알아두는 것이 이용에도, 이해에도 좋으므로 아래 것들은 가능한 익숙해지기! # 표준정규분포에서 random sampling을 한 원소를 가지는 5x3 행렬 만들기 mat1 = np.random.randn(5, 3) # mat1에 절대값 씌우기 np.abs(mat1) # mat1의 square root(제곱근) 구하기 np.sqrt(mat1) 제곱근의 경우 위와 같이 입력하면 Error는 아니지만 RuntimeWarning 발생한다. 그 이유는 mat1 값들 중 음수가 있어서 루트 안에 음수가 들어가게 되는 바람에 허수 발생해서 그런데, imagnary numbers = nan 표시라고 뜬다. compl = np.arr..
2022.06.29 -
Numpy Indexing+Masking
Indexing pandas에서 빛을 발하는 기능으로 python list와 거의 같다. 이 부분만 잘 이해하고 내것으로 만든다면 Excel보다도 빠르고 편하게 느낄 수 있다. arr1 = np.arange(10) output : array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 예시로 설명하기 위해 array 하나 생성한다. # 첫번째 원소 arr1[0] # 마지막 원소 arr1[-1] # 앞에서부터 원소 3개 slicing arr1[:3] 여기까지는 python list와 똑같다. arr2 = np.array([1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]) 이제는 2차원 행렬일 때의 케이스다. # arr2의 2,3, 원소 (2번째 row의 3번째 (열..
2022.06.29 -
Numpy Operation
Array Operation (like vector) → Universal Function vector처럼 사용할 수 있다는 것이 가장 큰 특징이자 Numpy를 이용하는 이유이다. 또한 데이터 분석에서 쓰이는 대표적인 라이브러리들(scipy, matplotlib, scikit-learn, pandas, tensorflow, pytorch 등) 대부분이 numpy array를 사용하고, 데이터 분석은 99.9% 데이터를 벡터로 표현하여 분석하기 때문에 매우 중요하다. 1. 벡터 v1, v2 생성하기 v1 = np.array((1, 2, 3)) v2 = np.array((4, 5, 6)) 이때 주의할 건 v1 = (1, 2, 3) 가 아니라 앞에 꼭' np.array'를 붙여줄 것! 붙이지 않으면 그건 단순..
2022.06.29 -
Numpy Array 만들기
Numpy 기본 사용 방법 ① Numpy array creation 우선 라이브러리를 불러와야 한다. import numpy as np 전세계 만인 공통 문장. # python에서 list를 미리 선언한 후에 numpy array로 변환 data = [1, 2, 3, 4, 5] arr1 = np.array(data) # python list를 np.array로 변환 np.array([1, 2, 3, 4, 5]) array를 만드는 방법은 위와 같이 간단히 2가지가 있다. 위 arr 들의 type을 찍어보면 numpy.ndarray라고 뜨는데 이건 ndarry(d-dimensional array)라고 부르며 간단히 다차원의 array를 지원 가능하게끔 벡터로 인지할 수 있는 array라는 뜻이다. np.a..
2022.06.28