반응형
DataFrame using Pandas module(feat. matplotlib.pyplot)
파이썬으로 데이터 분석을 진행하는데 있어서 많은 기능을 제공하는 라이브러리이다.
(현재 통계 기반 언어인 'R' 기초를 공부하고 있는데 확실히 python의 dataframe과 비슷하다는 느낌을 많이 받았다.)
예제 2개와 실제 데이터를 이용한 실습 1개를 해보았는데,
python DataFrame이나 matplotlib의 경우 블로그에 올리는 것 보다 jupyter notebook으로
코드 마다 테이블 모양을 보면서 이해하는게 좋을 것 같아서 이번 포스팅 내용은 아래 링크들로 대체한다.
예제1(DataFrame 날짜별 테이블 생성, Series, 간단한 조회 등)
예제2(concat, groupby, 새로운 column 생성 등)
실습1(airbnb 데이터를 간단하게 다뤄보기)
반응형
'IT study > Big Data' 카테고리의 다른 글
| [YouTube]Apache Spark Tutorial Full Course - Job, Stage, Task (3) (0) | 2021.05.12 |
|---|---|
| [YouTube]Apache Spark Tutorial Full Course - RDD (2) (0) | 2021.05.10 |
| [YouTube]Apache Spark Tutorial Full Course - Intro, spark, cluster (1) (0) | 2021.05.01 |
| Hadoop MapReduce( + Yarn) (0) | 2021.04.27 |
| HDFS(feat. S3) (0) | 2021.04.09 |