ChatGPT가 2023년 10월 기능이 업데이트 되면서 Advanced Data Analysis를 지원합니다.

Advanced Data Analysis의 기능
- 통계 분석: 기술통계, 상관관계, 회귀분석, 가설검정 등의 통계적 분석을 수행할 수 있습니다.
- 데이터 시각화: 데이터를 그래프나 차트로 시각화하여 보다 쉽게 이해할 수 있게 해줍니다. 예를 들어, 히스토그램, 선 그래프, 산점도, 파이 차트 등을 생성할 수 있습니다.
- 머신 러닝: 기계 학습 모델을 사용하여 예측, 분류, 군집화 등의 작업을 수행할 수 있습니다. 예를 들어, 선형 회귀, 의사결정 나무, k-평균 클러스터링 등의 알고리즘을 사용할 수 있습니다.
- 시계열 분석: 시간에 따라 변하는 데이터를 분석하고 예측하는 것입니다. 예를 들어, ARIMA와 같은 모델을 사용하여 시계열 데이터를 분석할 수 있습니다.
- 텍스트 분석: 자연어 처리(NLP)를 사용하여 텍스트 데이터를 분석하고, 감정 분석, 토픽 모델링 등을 수행할 수 있습니다.

Advanced Data Analysis 사용 조건
ChatGPT Plus(유료) 이용자(월20불)만 사용가능합니다.
Advanced Data Analysis 지원 언어
Advanced Data Analysis는 파이썬(Python) 언어를 통해 데이터 분석을 지원합니다.
Advanced Data Analysis 지원 주요 파이썬 라이브러리
- Pandas
데이터 분석과 조작을 위한 강력한 라이브러리입니다. 대량의 데이터를 빠르고 효과적으로 처리할 수 있으며, 데이터 가공, 정리, 분석을 위한 다양한 기능을 제공합니다. - NumPy
수치 데이터 처리를 위한 핵심 라이브러리입니다. 고성능의 다차원 배열 객체와 이를 처리하기 위한 도구를 제공합니다. - Matplotlib
데이터 시각화를 위한 라이브러리입니다. 플롯, 히스토그램, 파워 스펙트럼, 바 차트, 오류 차트, 스캐터플롯 등을 만드는데 사용할 수 있습니다. - Scikit-learn
머신 러닝 라이브러리입니다. 분류, 회귀, 클러스터링, 차원 축소, 모델 선택, 전처리 등의 기능을 제공합니다. - Seaborn
Matplotlib 기반의 데이터 시각화 라이브러리입니다. 통계적 그래픽을 생성하는 인터페이스를 제공합니다. - NLTK (Natural Language Toolkit)
자연어 처리를 위한 플랫폼입니다. 분류, 토큰화, 어간 추출, 태깅, 구문 분석, 의미 추론 등의 기능을 제공합니다. - SciPy
과학 계산용 라이브러리로, 선형 대수, 최적화, 미적분, 확률론 등의 모듈을 포함하고 있습니다. - Keras
TensorFlow 위에서 동작하는 고수준 딥 러닝 API입니다. - PyTorch
딥 러닝 연구 및 프로덕션을 위한 오픈소스 라이브러리입니다.
그 외 지원 라이브러리 리스트
- statsmodels
- networkx
- BeautifulSoup
- requests
- Pillow
- nltk
- gensim
- spacy
- textblob
- bokeh
- plotly
- wordcloud
- openpyxl
- xgboost
- lightgbm
- catboost
- flask
- django
- sqlalchemy
- pymongo
- redis
- pytz
- dateutil
- pyyaml
- csv
- glob
- os
- sys
- re
- math
- random
- statistics
- collections