본문 바로가기
KT AIVLE school

KT AIVLE school 9기 2주차 후기

by 심금희 2026. 4. 13.

안녕하세요 ⌯’▾‘⌯

KT AIVLE school 9기 2주차 후기입니다.

숫자가 아직 작다

 

 

1주차의 경우 내용이 기초적이기도하고, 시간에 많이 쫒기는 느낌은 없었는데

2주차가 되면서 내용이 심화되고 많아지다보니 약간 시간에 쫒기는 느낌이 들었습니다.

 

 

2주차에는 python을 활용한 데이터 분석, 머신러닝 수업 일부를 진행하였습니다.

 

 

수업에 집중해서 잘 따라간다면 난이도는 어렵지 않은 것 같습니다!

정말 딱 알아야하고, 새로운 기술을 배울 때 알아야할 핵심 부분들을 짚고 넘어가는 것 같습니다.

학부생 시절에 배웠던 내용들이라 반갑기도 하고, 기억 너머에 있던 지식들도 다시 보면서

복습이 많이 됐던 것 같아요!

 

 

데이터 분석

데이터 분석 수업의 경우 데이터 전처리, 데이터 시각화 부분에서 필요한 내용들을 다루었습니다.

시각화 라이브러리 중 Matplotlib, Seaborn을 활용하여 진행되었습니다. 

 

간단하게, matplotlib 라이브러리를 활용하여 그래프를 그려보겠습니다.

import matplotlib.pyplot as plt

plt.plot([1, 2, 3, 4], [1, 4, 9, 16]) # x, y
plt.show()

plt.plot([1, 2, 3, 4], [1, 4, 9, 16])

 

이런 식으로 값에 맞는 그래프를 그려줍니다. 추가로 색, 점의 스타일, 선의 스타일 지정 등 다양하게 활용 가능합니다. 

 

추가 항목들은 아래 사이트를 참고하면 좋습니다.

https://wikidocs.net/92071

 

01. Matplotlib 기본 사용

![](https://static.wikidocs.net/images/page/92071/basics_00.png) Matplotlib 라이브러리를 이용해서 그래프를 그리는…

wikidocs.net

 

수업 중에서는 단순 그래프 그리기 뿐만 아니라, 그래프 위에 글자 표시하기, 한번에 여러 그래프 표시 등 Matplotlib에 관련한 다양한 내용들을 다루었습니다.

 

 

Matplotlib 이후, Seaborn을 활용하여 다양한 style의 그래프를 그렸습니다. 

 

아래는 그 예시입니다. 

seaborn components used: set_theme(), jointplot()

import numpy as np
import seaborn as sns
sns.set_theme(style="ticks")

rs = np.random.RandomState(11)
x = rs.gamma(2, size=1000)
y = -.5 * x + rs.normal(size=1000)

sns.jointplot(x=x, y=y, kind="hex", color="#4CB391")

jointplot

 

 

시각화에 대해 학습한 뒤, 본격적인 데이터 분석 수업을 진행하게 됩니다.

이어서 진행된 수업은 단변량 분석이변량 분석에 대해서 수업을 진행하였습니다.

 

 

단변량 분석과 이변량 분석의 차이는 " 한 번에 몇 개의 변수를 볼 것인가? "에서 갈립니다.

 

 

1. 단변량 분석(Univariate Analysis)

단변량 분석은 하나의 변수가 가진 특성을 파악하여 데이터 자체를 이해하는 것을 목표료 평균, 중앙값, 최반값, 분산, 표준편차, 결측치 등을 확인합니다.

 

수치형 데이터를 통해 

- Histogram

- Box Plot

- KDE (커널 밀도 추정 그래프)

 

수치형 데이터

 

범주형 데이터를 통해

- Bar Chart

- Pie Chart

 

범주형 데이터

 

 

위와 같은 그래프들을 그려 확인할 수 있습니다.

 

 

개별 데이터의 분포와 특성을 파악하여 데이터가 어디에 몰려있는지 확인합니다. 평균, 표준편차, 사분위수를 확인하여 데이터를 이해합니다.

 

 

 

2. 이변량 분석(Bivariate Analysis)

이변량 분석은 두 변수 사이의 관계를 분석하여 한 변수가 변할 때, 다른 변수가 어떻게 변하는지를 확인합니다. 상관계수 계산, 교차 분석, 그룹별 평균 비교를 통해 상관관계나 인과관계를 찾습니다.

 

- 수치형 VS 수치형 : Scatter Plot을 통해 두 변수의 선형성을 확인 할 수 있습니다.

- 범주형 VS 범주형 : 범주 별 Box Plot, Bar Plot을 그려 집단 간의 차이를 확인할 수 있습니다.

- 범주형 VS 범주형 : Mosaic Plot, Stacked Bar chart 를 통해 확인할 수 있습니다.

 

이변량 분석

 

x가 변할 때, y도 변하는지 확인합니다. 상관계수, 결정계수를 확인하여 데이터 간의 상관관계를 확인할 수 있습니다.

 

 

+ 통계에 기본 지식이 있으면 더욱 이해하기 좋을 것 같습니다~!

 

 

 

3주차 후기에는 머신러닝 수업 후기로 돌아오겠습니다!

 

 

오프라인으로 만나 같이 수업 내용 리뷰 및 추가 공부를 하는 스터디를 가입했는데

잘 진행됐으면 좋겠습니다...

 

 

공모전 스터디도 가입하고 싶은데 제가 진행하기엔 공모전 경력도 없어서 

괜히 감투쓰고 민폐끼칠까봐

누군가 열어주기를 깊게 바라고 있습니다

제발

 

 

 

3주차에 진행하게 될 미니 프로젝트도 파이팅!!!

팀원분들 소통이 잘 되는 것 같아 아주 GREEN FLAG 상태입니다 우하하