Python(파이썬)을 활용한 데이터 분석을 진행하기 앞서 버전확인, 라이브러리 설치에 대해 포스팅하고자 한다.
파이썬은 전공자, 비전공자에게도 인기있는 언어로 데이터 분석을 할때 많이 사용되고 있다.
사용자에 따라 jupyter, PyCharm, Anaconda 등 오픈 소스 소프트웨어를 활용할 수 있다.
본 포스팅에서는 SPYDER를 사용한다.
명령프롬프트(윈도우-검색-CMD)를 키고, 'python --version' 를 치면 파이썬 버전을 확인할 수 있다.
현재 사용하고 있는 Python 버전은 3.9.7 로 명령 프롬프트에 뜬 것이 확인되었다.
데이터를 핸들링하고 활용하는데 있어서 파이썬에선 pandas를 가장 많이 사용하게 된다.
판다스(pandas)는 데이터 프레임과 시리즈를 사용하기 쉽게 도와주는 라이브러리라고 생각하면 된다.
쉼표(,), 탭(\t) 등으로 분리되어 있는 데이터를 표 형태로 예쁘게 정렬해주는 역할이라고 생각하면 쉽게 이해될 것이다.
pandas를 사용하기 앞서 라이브러리에 설치를 해주는 것이 첫 단계이다.
설치해주는 것은 매우 간단하다.
1. 윈도우 - 검색 - CMD 를 입력하면 아래와 같은 화면이 보일 것이다.
2. 명령 프롬프트(CMD) or Anaconda Prompt(anaconda3) 실행
3. pip install pandas 입력 (ModuleNotFoundError : No module named 'pandas' 같은 에러메세지가 뜨면 재입력)
설치가 완료되면, pandas를 이용하여 다양한 데이터 분석 등을 진행할 수 있다.
다음 포스팅에선 pandas를 이용한 데이터 불러오기, read_cvs 등을 활용하는 방법에 대해 포스팅 할 예정이다.
'Python' 카테고리의 다른 글
[python] 문자열 조작, 문자열 추가, str, format, split 활용, 문자열 추출, 특정 문자 추가, 조건분리 (0) | 2022.06.24 |
---|---|
[python] replace 문자열 조작, 문자열 치환, 문자열 변경 (2) | 2022.06.22 |
[python] 문자열조작, 문자열 인덱스, 문자열 찾기, 문자열 슬라이싱 (0) | 2022.06.22 |
[python] 데이터타입 확인(int, float, str...), 문자열, 비교연산자 연습 (0) | 2022.06.21 |
[Python] 기본 타입(숫자형, 정수형) / print 익히기 및 응용 / 파이썬 print (0) | 2022.06.21 |