2022. 6. 28. 22:12ㆍData Science/with Python(Numpy, Pandas …ect.)
Numpy 란..?
"numerical python"의 약자로
Numerical Computing은 컴퓨터가 실수값을
효과적으로 계산할 수 있도록 하는 연구 분야를 말한다.
참고로 Vector Arithmetic 역시 중요한 개념 중
하나인데 벡터 연산을 뜻하며 데이터가
벡터로 표현되기 때문에 알아두면 좋다.
다양한 머신러닝 라이브러리들에
의존성을 가지고 있고, 일반 python 리스트나 튜플에
비해 numpy array가 훨씬 성능이 좋아 데이터 사이언스,
혹은 분석 분야에서 많이 쓰이는 라이브러리이다.
여기서 arryay는 C언어와 JAVA에서
사용하는 array와 비슷한 개념이다.
Numpy 특징
1) numpy array는 모든 원소의 자료형이 동일해야 한다.
python에선 자동으로 타입 변경이 되는데 그걸
dynamic type binding(타입 동적 할당)이라고 한다.
numpy에서는 이 기능이 없기 때문에
우리가 직접 지정해 주어야 한다.
2) numpy array는 선언할 때 크기를 지정한 뒤, 변경할 수 없다.
append라는 함수가 있으나 기존에 배웠던 것과 의미가 다르다.
(array를 복사해서 하나 더 큰 걸로 만든 뒤 추가)
3) 사실 numpy array는 C,C++로 구현 되어 있다.
python이 Numerical Computing에 취약하다는
단점을 보완한 라이브러리이다.
4) numpy arrary가 python list보다 연산이 빠른데
그 이유 중 하나는 원소의 type checking을
할 필요가 없기 때문이다.
5) numpy arrary는 universal function(through
broadcast)를 제공하기 때문에 같은 연산 반복에
대해 훨씬 빠르고 데이터의 크기가 클수록
그 차이가 더 크다.
'Data Science > with Python(Numpy, Pandas …ect.)' 카테고리의 다른 글
Numpy Array Functions (0) | 2022.06.29 |
---|---|
Numpy Indexing+Masking (0) | 2022.06.29 |
Numpy Operation (0) | 2022.06.29 |
Numpy Array 만들기 (0) | 2022.06.28 |
아나콘다(ANACONDA) 및 Jupyter Notebook (0) | 2022.06.27 |