2025. 8. 3. 12:15ㆍ카테고리 없음
이번에 대구 빅데이터 분석 경진대회에 참여하게 되었다.
이번 경진대회 주제는 자유주제 또는 2가지 지정주제 중에 하나를 고르는 것이었는데, 나는 지정주제 중에 한개인 대구시 소방차 출동로 취약지역 분석 기반 맞춤형 서비스 제안 주제를 정하게되었다.
다른 지정주제는 대구시 주차 수요분석을 통한 주차 정책 제안이었는데, 이 주제는 다른 경진대회나 공모전에서도 다른 팀들이 진행한것을 본적이있어서, 조금더 생소한 주제로 정해보았다.
프로젝트 계획
프로젝트를 진행하기전에, 어떻게 진행을 할건지 계획의 큰틀을 정해보았다.
먼저 최종적으로 어떤 결과를 원하는지를 설정하였다.
첫번째는 위치데이터가 존재하는 데이터를 통해서 Tableau 대시보드를 도로 정보를 시각화하는 것이다.
두번째는 출동 취약지역 군집화이다.
세번째는 알고리즘을 통한 최단경로 계산이다.
이 세가지를 통해 각 도로가 어떤 문제점을 가지고 있는지 시각적으로 확인할수있고, 군집화와 최단경로 및 해당 지역의 특성을 참고하여 소방차 출동로 취약지역에 대한 서비스 제안을 진행할수있을것이다.
프로세스로는
1.각 데이터의 특성과 내용을 파악하기 위해서 각 칼럼의 분포도 및 그 외의 탐색을 진행하여 EDA 를 진행한다.
2. EDA를 바탕으로 데이터 전처리 진행
3. 데이터에서 위치 관련 데이터를 구분하여 Tableau에 시각화 한다.(취약지점 및 경로 시각화)
4. 취약지역 군집화
5. 경로최적화를 통한 최단경로 계산
6. 추가적 분석 & 지역 특성 조사를 통한 서비스 제안
가설설정
분석을 진행하기전에 분석의 방향성을 위해서 가설을 설정한다.
첫째, 인구가 많은 지역일수록 교통량과 혼잡도가 높을것이다.
둘째, 교통량이 많은지역의 소방서일수록 도착시간이 지연될것이다.
셋째, 외곽지역일수록 도로가 협소한곳이 많을것이다.
넷째, 출동 취약도가 높은곳은 한 군집에 몰려있을것이다.
다섯째, 최적화 경로는 교통량이 많은 중심가는 제외할것이다.
데이터 수집
데이터는 두가지 웹사이트에서 수집을 하였다.
첫번째는 공공데이터포털,
공공데이터 포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase
www.data.go.kr
두번째는 D-데이터허브 이다.
D-데이터허브
데이터현황 2025.08.03 현재 데이터셋 18,839 서비스 13,829
data.daegu.go.kr
공공데이터 포털은 대구시뿐 아니라, 다양한 데이터를 수집할수있는곳이고, D-데이터허브는 대구시의 데이터를 보거나 수집할수있는곳이다.
데이터는 대구시의 교통량이나 소방출동 주소나 기타 정보를 수집하였다.
아쉬운점은 가장 중요하다고 할수있는 도로의 면적에 대한 상세한 데이터를 구하지 못하였다. 다른 자료를 많이 찾아봤지만, 도로면에 대한 데이터는 공개되지 않는것같다. 그래서 시,도별 도로현황에서 대구시의 대략적인 도로정보 데이터로 분석을 진행하고, 그 이외의 도로정보는 지도 데이터를 통해서 직접 판단하는 식으로 진행하려고 한다.
데이터 목록
교통 관련 데이터
- 구간별 시간별 통계.csv (226,472행, 5열)
- 도로 구간별 속도 및 통과시간 통계
- 간선도로 지점교통량.csv (3,071행, 11열)
- 간선도로 교통량 15분 단위 측정
- 교량 지점교통량.csv (27,647행, 11열)
- 교량 지점 교통량 15분 단위 측정
- 버스전용차로 지점교통량.csv (3,647행, 11열)
- 버스전용차로 교통량 15분 단위 측정
- 시경계 지점교통량.csv (35,327행, 11열)
- 시 경계 지점 교통량 15분 단위 측정
- 신호등.csv (20,263행, 32열)
- 신호등 위치, 설치방식, 제어방식 정보
- 주요교차로 교통량.csv (62,592행, 11열)
- 주요 교차로별 회전 방향별 교통량
- 상습 지정체 통계.csv (476,140행, 6열)
- 상습 정체 구간별 교통 상황 통계
소방 관련 데이터
- 소방 구조구급 법정동 주소.csv (2,388행, 6열)
- 법정동별 주소 코드 및 변환 정보
- 소방 구조구급 차량목록.csv (34행, 3열)
- 소방 구조구급 차량 종류 및 목록
- 소방 긴급구조 교통통제상황.csv (2,631행, 13열)
- 긴급상황 시 교통통제 현황
- 소방 긴급구조 기타정보.csv (1,368행, 15열)
- 긴급구조 출동 및 활동 상세 정보
- 소방 긴급구조 월간 사고종별 집계.csv (11,440행, 9열)
- 월별 사고 종류별 구조 건수 집계
- 소방 긴급구조 주소정보.csv (1,000행, 22열)
- 긴급구조 관련 상세 주소 정보
- 소방 긴급구조 출동관제내역.csv (4,979행, 20열)
- 긴급구조 출동 지령 및 관제 내역
- 대구소방관서현황.csv (12행, 15열)
- 소방관서별 인력, 장비, 관할구역 현황
- 소방 긴급구조119공동대응현황.csv (36,251행, 6열)
- 119 공동대응 처리 현황