MOOC(36)
-
[머신러닝을 위한 파이썬] Case Study - Air Passengers
pandas 를 사용하여 csv 형태의 time series 데이터를 처리하는 방법에 대해 직접 코드를 실행하며 설명하는 Case Study 를 진행 1. AirPassengers 예시 (시계열 데이터)1.1 데이터 불러오기 및 확인"import pandas as pddf_time_series = pd.read_csv('./data/AirPassengers.csv')df_time_series.head()"CSV 파일을 불러오고, head()를 통해 상단 몇 줄을 확인1.2 새로운 열 추가: step"df_time_series['step'] = range(len(df_time_series))df_time_series.head()"range(len(df_time_series))로 0부터 시작하는 정수 시퀀스..
2024.12.26 -
[머신러닝을 위한 파이썬] Visualization - matplotlib
1. 기본 선 그래프 (Line Plot)plt.plot을 사용해 간단한 선 그래프를 그림.import matplotlib.pyplot as pltimport numpy as npX = range(100)Y = range(100)plt.plot(X, Y)plt.show()2. 다중 선 그래프여러 그래프를 한 플롯에 그림.X_1 = range(100)Y_1 = [np.cos(value) for value in X_1]X_2 = range(100)Y_2 = [np.sin(value) for value in X_2]plt.plot(X_1, Y_1, label="Cosine")plt.plot(X_2, Y_2, label="Sine")plt.legend()plt.show()3. 서브플롯하나의 Figure에 여러 ..
2024.12.26 -
[머신러닝을 위한 파이썬] Pandas #2
1. Group By 및 Aggregation데이터를 특정 열 기준으로 그룹화하고, 합계 등을 계산.import pandas as pdipl_data = {'Team': ['Riders', 'Riders', 'Devils', 'Devils', 'Kings', 'kings', 'Kings', 'Kings', 'Riders', 'Royals', 'Royals', 'Riders'], 'Rank': [1, 2, 2, 3, 3, 4, 1, 1, 2, 4, 1, 2], 'Year': [2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2017], 'Poi..
2024.12.26 -
[머신러닝을 위한 파이썬] Pandas
1. 데이터 로드 및 기본 정보 확인1.1 CSV 데이터 로드import pandas as pd# 데이터 URLdata_url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data'# 데이터 로드df_data = pd.read_csv(data_url, sep='\s+', header=None)# 칼럼 이름 지정df_data.columns = [ 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']# 데이터 확인print(df_data.head())2. Series 객체 ..
2024.12.26 -
[머신러닝을 위한 파이썬] Numerical Python (Numpy) Overview and Usage
1. Numpy 개요Numpy는 Python의 고성능 수학 연산 패키지로, 배열(Array) 기반 연산의 표준.주요 특징:빠르고 메모리 효율적.반복문 없이 데이터 배열 처리 가능.선형 대수 관련 다양한 기능 제공.대규모 데이터 계산 시 효율적.2. Numpy 설치 및 실행# 가상환경 실행 후 Numpy 설치activate ml_scratchconda install numpy# Jupyter Notebook 실행jupyter notebook3. 배열 생성1) 기본 배열 생성import numpy as np# 1차원 배열 생성test_array = np.array([1, 4, 5, 8], float)print(test_array)# 출력: [1. 4. 5. 8.]# 배열 정보print(test_array.d..
2024.12.22 -
[머신러닝을 위한 파이썬] Basic Linear Algebra
벡터와 행렬 연산 함수 정리아래는 벡터 및 행렬 연산을 위한 함수들의 정의 및 예제를 정리한 내용이다.1. vector_size_check벡터 연산 가능 여부를 확인.코드def vector_size_check(*vector_variables): return all(len(v) == len(vector_variables[0]) for v in vector_variables)# 실행결과print(vector_size_check([1, 2, 3], [2, 3, 4], [5, 6, 7])) # Trueprint(vector_size_check([1, 3], [2, 4], [6, 7])) # Trueprint(vector_size_check([1, 3, 4], [4], [6, 7])) ..
2024.12.22