[DA 프로젝트] 디지털화가 경제 성장에 미치는 영향에 대한 데이터 분석 (분석 과정)
1. 데이터 시각화
Python : matplotlib, seaborn, plotly


라인차트


- GDP의 증가율은 고소득국가와 저소득국가간의 차이가 크지않다.
- IU(인터넷 사용률/5번 그래프) 에서는 고소득국가는 증가율이 크지만, 저소득국가에서는 증가율이 크지않다. 하지만, 시간이 지나면서 증가율이 점점 커지는 것을 볼수있다.
- 모바일 부문과 디지털 지수 부문은 고소득국가와 증가율이 비슷하다.
- 고정지출은 고소득국가는 횡보를 보여주고있지만, 저소득국가에서는 계속해서 증가하는추세를 보여준다.
- 무역 개방도도 고소득국가에 비해서 저소득국가에서 증가를 보여주지 못한다.
- 물가지수는 고소득국가는 점진적으로 증가하지만, 저소득국가에서는 물가가 너무 가파가파 올라가는 것을 볼수있다.
- 연구개발비도 저소득국가에서는 증가세를 보여주지 못한다.
산점도

1. 고소득 국가:
- 인구가 많을수록 통신 인프라도 좋은 경향을 보이며, 디지털화 수준이 향상됨.
2. 저소득 국가:
- 인구가 많을수록 통신 인프라 수준이 떨어지는 경향을 보이며, 디지털 접근성이 심각하게 제한됨.
- 이는 경제적 제약, 도시농촌 격차, 인프라 확충 부족 때문.



- 소득이 높은 국가에서는 2000년대부터 비교적 높은 인터넷과 모바일 사용량을 보이고 있으며, 시간이 지나면서 인터넷과 모바일 사용량이 일정하게 증가하는 추세를 보인다.
- 소득이 낮은 국가에서는 인터넷이 등장하던 2000년에는 거의 0에 수렴하며 시간이 지나면서 사용량이 증가하지만, 인터넷 사용량보다 모바일의 사용량이 더 크게 증가하는 경향을 보인다.
지도 시각화

- 북미와 유럽은 디지털화가 시간이 지나면서 가장 높게 나타난다.
- 중동과 동유럽, 북아프리카와 남미에서는 비교적 준수한 디지털화를 이루어내고 있다.
- 동남아시아와 아프리카 지역에서는 시간이 지나도 디지털화가 0근처이거나 음의 계수를 보여주고 있다.

- 연구개발비 와 GDP : GDP가 높은 국가일수록 연구개발비가 높아진다. 특히 GDP가 높은국가중 중동국가들은 연구개발비가 낮으며 유럽과 아시아의 경우 연구개발비가 높게 나타난다.
- 고정자본형성총액(GFCF)이 높은 국가일수록 비교적 디지털화가 낮고, GFCF가 낮은 국가가 디지털화가 높다는것을 볼수있다.
- 소득이 높은국각는 연구개발비가 높아야 디지털화도 높지만, 저소득 국가의 경우 디지털화가 높더라도 연구개발비가 높지가 않다. 이는 저소득국가는 연구개발을 통해서 디지털화를 이루어낸것이 아닌 고소득국가의 연구개발 성과의 낙수효과를 통해 디지털화를 이루어낸다는 것을 유추할수있다.
디지털화와 경제성장간의 관계 분석
디지털화(DDI) 지수가 경제성장(에 어떤 상관관계를 가지고, 어떤 영향을 미치는지 시각화와 회귀분석 수행

- - 눈에 띄는 관계는 디지털화 지수와 노동력 사이의 관계이다.
- - 디지털화 지수가 높아질수록 노동력은 감소하는 경향을 보인다.
- - 이는 디지털화가 높아질수록 노동 효율성이 증가하기때문으로 보인다.
- - 연구개발비 투자가 높을수록 디지털화 지수가 높다
결과적으로 연구개발비가 증가하면 디지털화가 증가하고 이는 노동력 효율성을 올려줘 노동력 지수를 감소시키며 결국 GDP가 성장하는 인과관계를 유추해낼수있다.

디지털화가 진행되면 노동력이 감소하는 추세를 확인할 수 있다
GDP와 다른 변수들간의 회귀분석

GDP와 디지털화, 연구개발비 가 높은 양의계수를 나타내며,
노동력과 물가지수는 음의계수를 나타내고 있다.
노동력과 디지털화가 관계가 유의미한건지 회귀분석을 진행
디지털화와 노동력 간의 회귀분석

다중공선성 문제를 해결하기위해 상관관계가 높은 디지털화 관련 변수에서 대표지수로 DDI 지수 하나만 사용
1. DDI (디지털화 지표)
- 계수(coef): -0.0295, p-값: 0.000
- 해석
- DDI가 1 단위 증가하면 Labor는 평균적으로 0.0295 단위 감소.
- 디지털화는 자동화와 기술 혁신을 통해 노동력 수요를 줄이는 경향이 있음.
2. CONSUM (정부 소비)
- 계수(coef): -0.0520**, p-값: 0.000
- 해석
- CONSUM이 1 단위 증가하면 Labor는 평균적으로 0.0520 단위 감소
- 정부 소비는 기술 도입과 생산성 향상으로 노동력 수요를 줄이는 데 영향을 미칠 가능성이 있음.
변수중요도 분석

- 가장 높은 중요도를 나타내는 3가지 변수는 정부지출, 인구, 디지털화 이다.
- 유의미성이 낮은 인구 변수를 제외하면 정부지출과 디지털화가 노동력 변수에 영향을 크게 주는것을 확인할수있다.
이렇게 노동력의 효율성을 올리면 노동력 감소가 되고 이는 GDP 상승으로 이어지는 것을 회귀분석으로 살펴볼 수 있다.
변수 변화에 따른 LGDP 변화 예측
모델링을 통해서 LGDP를 종속변수로 하는 모델을 만들고 향후 개발도상국의 정책변화에 따라 변수들의 성장성에 변화를 주었을 때 LGDP를 예측하여 미래의 변화를 예상해본다

모델은 가장 성능이 좋게 나타난 Random Forest 모델을 사용한다



- 유선전화 가입수와 인터넷 사용자가 10% 가 증가할수록 LGDP 변화는 각각 0.43% 와 0.11%가 증가한다. 이는 통신망 구축이 소득증가에 큰 영향을 끼친다는 것을 알수있는 부분이다.
- 디지털화의 부문에서 특히 유선전화 가입자수와 인터넷 사용자수의 증가가 고소득 국가의 척도가 된다는 것을 볼수있다.
가설검정
- H0: 연구개발비(RD)는 디지털화 수준(FPS, MPS, BBS, IU, DDI)과 유의미한 관계가 없다.
- H1: 연구개발비(RD)는 디지털화 수준(FPS, MPS, BBS, IU, DDI)과 유의미한 관계가 있다.


- 연구개발비와 DDI,IU의 상관관계는 통계적으로 유의미하다.
- 연구개발비가 증가할수록 디지털화도 가속화된다느것을 확인할수있다.
FPS와 MPS는 LGDP에 미치는 영향 차이 검정



- 상관관계 차이가 20.6582 표준오차 만큼 크다는것을 나타낸다.
- 매우높은값으로 , 두 상관계수간 차이가 명확하다.
MPS와 FPS는 확실한 차이가 있다는것을 알수있다
LGDP와 DDI, FPS, MPS 관계 산점도


- 추세적인 가파른정도는 FPS > DDI > MPS 임을 확인할 수 있다.
- GDP가 높은 국가일수록 FPS가 높다는 것을 볼수있다. 하지만, 고소득 국가의 FPS는 이미 하향추세로 가는것으로 보아, 저소득 국가의 경우 FPS에 집중하기보다는 전체적인 통신망 구축을 목표로 하는 것이 효율적으로 보인다.
결론
- 디지털화는 노동 효율성을 높이고, 노동 수요 감소로 이어지며, 이는 GDP 성장을 촉진함.
- 고소득 국가는 지속 가능한 디지털화와 연구개발비 투자가 중요.
- 저소득 국가는 통신망 확충과 디지털 접근성 개선이 필요.
- 디지털화는 경제성장의 주요 동력으로 작용하며, 정책적 접근이 국가별로 차별화되어야 함.