본문 바로가기

데이터 분석/파이썬

5-2) 탐색적 데이터 도구 : pandas_profiling / sweetviz

>>오늘 배운 것 List
1. pandas_profiling을 통한 report만들기
2. sweetviz를 통한 EDA 기술통계 report

 

1. Pandas_Profiling을 통한 report 작성

 

# pandas_profiling 설치

 

명령 프롬프트에 다음 코드를 입력해 pandas_profiling을 설치합시다

!pip install -U pandas-profiling

 

이후, 구글 코랩에서 런타임 다시 시작을 클릭한 후,

다시 첫 행부터 실행해줍시다.

 

pandas_profiling에서 ProfileReport 기능을 임포트한 이후

profile 변수에 df 데이터셋에 대한 리포트를 저장합니다.

 

colab 환경에서 profile을 불러오면

R프레임으로 보여주기 때문에 보기가 어렵습니다

 

따라서, html로 변환 후 리포트를 저장해보겠습니다.

report이름.to_file("파일이름.확장자명")

 

>> 다운로드 된 ProfileReport를 통해 다양한 기술통계값을 한눈에 파악가능합니다.

pandas_profile_report.html
2.78MB


 

2. Sweetviz를 통한 report 작성

 

# sweetviz 설치

 

명령 프롬프트에 다음 코드를 입력해 sweetviz를 설치합시다

!pip install sweetviz

 

# analyze를 통한 report 생성

 

sweetviz를 import한 이후, analyze(데이터셋)을 통해 report를 만듭니다.

sv.analyze(데이터셋) : 데이터셋 요약레포트를 생성

>> 다운로드 된 Report를 통해 다양한 기술통계값을 한눈에 파악가능합니다.

SWEETVIZ_REPORT.html
0.97MB