Data Analyst Project

데이터 분석 아이디어 경진대회 EDA

ParkS2 2023. 12. 26. 23:14

 

참가자 수:

대부분의 대회에서 참가자 수가 상대적으로 낮은 것으로 보인다. 이는 특정 대회들이 높은 인기를 끌었을 가능성을 시사한다. 일부 대회에서는 매우 높은 참가자 수를 보이며, 이러한 대회들은 특히 주목할 필요가 있다.

 

제출 수:

제출 수의 분포도 마찬가지로 대부분의 대회에서 낮은 수준을 보이지만, 일부 대회에서는 상당히 높은 제출 횟수를 나타낸다. 이는 해당 대회들이 높은 참여율을 유도했음을 나타낸다.

토크 수:

대부분의 대회에서 토크 수가 상대적으로 낮은 수준임을 볼 수 있다. 이는 대회 중 커뮤니티 활동이 일부 대회에 집중되어 있음을 나타낼 수 있다. 높은 토크 수를 보이는 대회는 커뮤니티 내에서 더 많은 관심과 토론을 유발했다고 볼 수 있다.

 

코드 공유 수:

코드 공유 활동은 대부분의 대회에서 매우 제한적인 것으로 보인다. 이는 참가자들이 코드를 공유하는 것이 일반적이지 않거나, 특정 대회에서만 활발한 활동이 이루어졌음을 나타낼 수 있다. 특정 대회에서는 코드 공유가 활발하게 이루어졌을 가능성이 있으며, 이러한 대회는 특히 주목할 필요가 있다.

알고리즘과 정형 데이터:

'알고리즘'과 '정형'이 가장 많이 언급된 키워드로, 이는 대부분의 데이콘 경진대회가 알고리즘 개발과 정형 데이터 처리에 중점을 두고 있음을 나타낸다.

회귀와 분류:

'회귀'와 '분류'는 머신 러닝의 두 가지 주요 문제 유형으로, 데이콘 대회에서 자주 다뤄지는 주제임을 시사한다.

특정 분야의 인기:

'금융'과 같은 특정 분야가 상대적으로 더 많은 관심을 받고 있는 것으로 보인다.

평가 방법론:

'RMSE', '정성평가', 'CV' 등의 키워드는 대회의 평가 방법론에 대한 특징을 나타내며, 다양한 평가 기준이 사용되고 있음을 보여준다.

알고리즘 중심:

두 해 모두 '알고리즘'이 가장 많이 언급된 키워드로, 데이콘 대회가 알고리즘 기반의 해결 방법에 큰 중점을 두고 있음을 보여준다.

회귀와 정형 데이터의 중요성:

'회귀'와 '정형'은 두 해 모두 상위 키워드로 등장하여, 회귀 분석과 정형 데이터 처리가 데이콘 대회의 주요 주제임을 나타낸다.

분야의 다양화:

2020년에 '분류'와 '분석'이 더 높은 빈도로 언급되어, 대회 주제와 기술이 다양화되고 있음을 시사한다.

 

다음글

데이터 분석 아이디어 경진대회 - LDA(Latent Dirichlet Allocation) (tistory.com)

 

데이터 분석 아이디어 경진대회 - LDA(Latent Dirichlet Allocation)

이전글 데이터 분석 아이디어 경진대회 EDA (tistory.com) 데이터 분석 아이디어 경진대회 EDA 참가자 수: 대부분의 대회에서 참가자 수가 상대적으로 낮은 것으로 보인다. 이는 특정 대회들이 높은

ojko.tistory.com