전체 글(187)
-
[SQL] European Soccer Database analyst
축구 데이터베이스를 활용하여 리그별 경기당 평균 득점수를 분석해보도록 하겠다. 데이터를 SQLite 데이터베이스에서 가져와 Pandas를 이용해 조작하고, Matplotlib를 통해 시각화할 것이다.1. 데이터베이스 연결 및 테이블 확인먼저, SQLite 데이터베이스와 연결하여 테이블 목록을 확인하였다. 이를 통해 데이터베이스에 어떤 테이블이 있는지 파악할 수 있었다.2. 국가 리스트 확인Country 테이블을 조회하여 데이터베이스에 저장된 축구 리그가 있는 국가들을 확인하였다. 이를 통해 어떤 국가의 리그들이 데이터베이스에 포함되어 있는지 알 수 있었다.3. 리그와 국가 테이블 조인League 테이블과 Country 테이블을 조인하여 각 리그가 어떤 국가에 속해 있는지 정보를 가져왔다. 이 정보를 통해..
2024.05.16 -
[공모전] 「2024 날씨 빅데이터 콘테스트」
이 프로젝트는 기상 데이터를 통합, 전처리, 분석 및 모델링하여 기상 변화를 예측하는 데 중점을 둔다.1. 데이터 로드1.1 파일 경로 설정프로젝트에서 사용할 다양한 CSV 파일의 경로를 설정하였다. 이 파일들은 각각 적산온도, 기온, 바람, 습도, 일조일사, 강수량 데이터를 포함하고 있다.1.2 데이터 로드각 파일을 Pandas 라이브러리를 사용하여 데이터프레임으로 불러왔다. 이 과정에서 각 파일의 인코딩 방식을 'cp949'로 설정하고, 불필요한 헤더 행을 건너뛰도록 설정하였다.2. 데이터 전처리2.1 열 이름 변경 및 날짜 형식 변환데이터의 일관성을 위해 열 이름을 변경하고, 날짜 형식을 통일하였다. 예를 들어, '년도' 열을 '날짜'로 변경하고, 문자열 형태의 날짜를 Pandas의 to_datet..
2024.05.14 -
[데이콘] 결측치 보간 챌린지 : 월간 데이콘 파일럿
결측치 보간 챌린지 : 월간 데이콘 파일럿 - DACON 결측치 보간 챌린지 : 월간 데이콘 파일럿 - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io 이 프로젝트에서는 여러 가지 결측치 보간 방법을 적용하고 비교하여 가장 적합한 방법을 찾는 과정을 진행하였다. 주어진 데이터는 온도를 측정한 단변량 시계열 데이터로, 결측치가 포함되어 있다. 이 결측치들을 다양한 보간 기법을 사용하여 채웠고, 그 결과를 비교 분석하였다.1. 데이터 준비먼저, 주어진 시계열 데이터를 불러와 결측치의 위치와 개수를 파악하였다. 이 과정에서 데이터의 기본 통계치를 확인하고, 시각화를 통해 결측치의 분포를 파악하였다.2. 결측치 보간 기법 적용다음으로, 다양한 결측치 보간 기법..
2024.05.14 -
[딥러닝] 흉부 엑스레이 이미지 폐렴(PNEUMONIA) 분류 실습
프로젝트 개요1. 데이터 준비먼저 Kaggle에서 흉부 X-ray 데이터를 다운로드하여 Google Colab에 업로드하였다. 데이터를 Google Drive에 저장하고 Colab과 연동하여 사용하였다. 데이터는 'train', 'val', 'test' 세트로 나뉘어 있었으며, 이를 압축 해제하여 작업 디렉토리에 저장하였다.2. 데이터 확인데이터가 제대로 로드되었는지 확인하고, 각 데이터 세트의 정상(NORMAL) 이미지와 폐렴(PNEUMONIA) 이미지의 개수를 출력하였다. 이를 통해 데이터의 분포를 확인하고, 학습에 사용할 수 있는 데이터의 양을 파악하였다.3. 데이터 시각화정상 폐 사진과 폐렴 사진을 5개씩 불러와 시각화하였다. 이를 통해 데이터의 형태를 직접 확인하고, 정상과 폐렴 사진의 차이를 ..
2024.05.09 -
[SQL] 프로그래머스 7 Level 2
문제설명 대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.Column nameTypeNullableIDINTEGERFALSEPARENT_IDINTEGERTRUESIZE_OF_COLONYINTEGERFALSEDIFFERENTIATION_DATEDATEFALSEGENOTYPEINTEGERFAL..
2024.05.02 -
[SQL] SQL과 python 연동을 통하여 aircrafts_data 분석
이 프로젝트에서는 Python의 SQLite3 모듈과 Pandas 라이브러리를 활용하여 데이터베이스에 저장된 데이터를 불러오고, 다양한 분석을 수행하였다. 단계별로 프로젝트를 진행한 방법을 설명하겠다.프로젝트 개요1. SQLite 데이터베이스 연결먼저, SQLite 데이터베이스 파일에 연결하기 위해 sqlite3.connect() 함수를 사용하였다. 이 함수는 데이터베이스 파일의 경로를 인자로 받아 연결을 생성한다. 또한, conn.cursor() 메서드를 사용하여 커서 객체를 생성하였다. 커서 객체는 SQL 명령을 실행하고, 데이터베이스에서 데이터를 검색하는 데 사용된다.2. 데이터베이스 테이블 확인데이터베이스에 정의된 모든 테이블에 대한 정보를 조회하기 위해 SQL 쿼리를 실행하였다. pd.read_..
2024.05.02