3.5 KiB
3.5 KiB
name, label, description, icon, requires, tabs
| name | label | description | icon | requires | tabs |
|---|---|---|---|---|---|
| data-visualize-adv | 고급 데이터 시각화 | Python matplotlib/seaborn을 사용하여 히트맵, 산점도, 상관관계 등 고급 시각화를 생성합니다. | \uE9D9 | python | cowork |
데이터를 고급 시각화 차트로 변환하세요.
사전 준비
필요한 패키지를 설치하세요:
process_run: pip install matplotlib seaborn pandas numpy
작업 절차
- 데이터 확인: 사용자가 제공한 CSV/JSON/Excel 데이터 파일 확인
- 데이터 로드: pandas로 데이터 읽기
- Python 스크립트 작성: file_write로 시각화 스크립트 생성
- 스크립트 실행: process_run으로 실행
- 결과 확인: 생성된 차트 이미지 경로를 사용자에게 안내
시각화 유형별 템플릿
공통 설정
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
# 한글 폰트 설정
plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['axes.unicode_minus'] = False
sns.set_theme(style='whitegrid', font='Malgun Gothic')
히트맵 (상관관계 행렬)
df = pd.read_csv('data.csv')
corr = df.select_dtypes(include=[np.number]).corr()
fig, ax = plt.subplots(figsize=(10, 8))
sns.heatmap(corr, annot=True, fmt='.2f', cmap='RdBu_r',
center=0, square=True, linewidths=0.5, ax=ax)
ax.set_title('상관관계 히트맵')
plt.tight_layout()
plt.savefig('heatmap.png', dpi=150)
산점도 (Scatter Plot)
df = pd.read_csv('data.csv')
fig, ax = plt.subplots(figsize=(10, 8))
sns.scatterplot(data=df, x='col_x', y='col_y', hue='category',
size='value', sizes=(20, 200), alpha=0.7, ax=ax)
ax.set_title('산점도')
plt.tight_layout()
plt.savefig('scatter.png', dpi=150)
시계열 분석
df = pd.read_csv('data.csv', parse_dates=['date'])
fig, ax = plt.subplots(figsize=(12, 6))
sns.lineplot(data=df, x='date', y='value', hue='category', ax=ax)
ax.set_title('시계열 트렌드')
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig('timeseries.png', dpi=150)
분포 비교 (박스플롯 + 바이올린)
fig, axes = plt.subplots(1, 2, figsize=(14, 6))
sns.boxplot(data=df, x='group', y='value', ax=axes[0])
axes[0].set_title('박스플롯')
sns.violinplot(data=df, x='group', y='value', ax=axes[1])
axes[1].set_title('바이올린 플롯')
plt.tight_layout()
plt.savefig('distribution.png', dpi=150)
다중 차트 대시보드
fig, axes = plt.subplots(2, 2, figsize=(14, 12))
# 좌상: 히트맵
sns.heatmap(corr, annot=True, fmt='.1f', ax=axes[0,0])
# 우상: 산점도
sns.scatterplot(data=df, x='x', y='y', ax=axes[0,1])
# 좌하: 히스토그램
sns.histplot(data=df, x='value', kde=True, ax=axes[1,0])
# 우하: 박스플롯
sns.boxplot(data=df, x='group', y='value', ax=axes[1,1])
fig.suptitle('데이터 분석 대시보드', fontsize=16, fontweight='bold')
plt.tight_layout()
plt.savefig('dashboard.png', dpi=150)
페어플롯 (변수 간 관계 전체)
g = sns.pairplot(df, hue='category', diag_kind='kde')
g.fig.suptitle('변수 간 관계', y=1.02)
plt.savefig('pairplot.png', dpi=150)
스타일 옵션
- seaborn 테마:
whitegrid,darkgrid,white,dark,ticks - 컬러 팔레트:
Set2,husl,coolwarm,RdBu_r,viridis - 출력 형식: png, svg, pdf
- 해상도:
dpi=150(기본),dpi=300(인쇄용)
한국어로 안내하세요. 작업 폴더에 Python 스크립트와 결과 파일을 저장하세요.