본문 바로가기
Data Science

[kaggle] 캐글(kaggle) 시작하기

by 꼬마 고래 2023. 6. 28.

 캐글(kaggle)은 데이터 사이언스 경진대회 플랫폼이라고 한다. 데이터 사이언티스트 입문자들을 위한 학습 플랫폼을 검색하다 알게된 캐글. 일단 입문자에게는 쉽게 접근하기 어려운 플랫폼임이 분명하고, 영어가 익숙하지 않은 사용자라면 더더욱 어렵다고 느껴질 것이다. 현재는 구글에 속해 있기 때문에 DE와 DS 사이에서 유명하다. 아직은 python만 조금 할 줄 아는 실력이지만, 그럼에도 불구하고 시작이 반이기 때문에 오늘은 캐글에 접속하여 가입도 하고 뭐하는 곳인지 살펴보기만 해야지! 

 

일단 아래가 kaggle 사이트

 

https://www.kaggle.com/

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

일단 사이트에 접속해서 가입을 해본다. 가입은 Google 계정으로 하면 되고 기존 계정으로 30초면 할 수 있다. 

 

 캐글 내부에는 progression system이라는 등급 시스템이 있다. 쉽게 말하면 캐글 내부에서 정해주는 등급 정도라고 생각하면 되려나? 등급을 매길 수 있는 분야는 Compertitions, Notebooks, Datases, Discussion 이렇게 4가지가 있다. 각각의 분야에서 나눌 수 있는 등급은 Novice, Contiributer, Expert, Master, Grandmaster 이렇게 5가지가 존재한다. 

 

1. Novice 

: 가입만 하면 주어지는 자격이다. 

2. Contributor

: 4가지 조건이 필요하며, 1번 이상 notebook이나 script를 실행 / 1번 이상 competition이나 task를 제출/ 1번이상 댓글 달기/1번 이상 upvote하기 등이 이에 해당한다. 

3. Expert 

: Expert 등급부터는 "메달"로 결정되는데 다음 등급으로 넘어가기 위한 메달의 수가 다르다. 

4. Master & Grandmaster 

: 메달의 개수와 퀄리티로 결정된다. 

 

 왼쪽 카테고리 항목에서는 Competition 항목에서는 경쟁을 개최할 수 있는 버튼과 내가 참여한 이력을 볼 수 있는 Your work 버튼이 있다. 스크롤을 내리면 현재 진행중인 대회와 상금, 최근에 완료된 대회가 나열되어 있고 클릭하여 들어가면 대회에 대한 설명과 참여한 팀과 경쟁자들의 정보가 친절하게 나와 있다. 전세계 사용자들이 가진 지식을 뽐내고 경쟁하는 플랫폼이라니 설렌다. 나도 참여해서 겨룰 수 있는 날이 곧 오겠지. 

 

 다음은 datasets. 서치바 밑에는 computer science, education, classification, computer vision, data visualization 등 많은 카테고리가 있다. 각각의 항목별 관심이 가는 내용을 클릭하면 data card에는 dataset에 대한 간략한 정보와 스크롤을 내리면 csv 파일들을 다운 받을 수 있다. code 항목에는 이 코드를 다운 받아 분석한 여러 사람이 올린 data를 공유해 놓은 항목이다. 흥미로운 테마들이 많아 재밌는 분석을 해볼 수도 있을 것 같고. 

 

 Code 항목에서는 dataset으로 만든 코드를 공유한다. 본인 notebook를 공유하면 comment에 더 좋은 제안을 달아주기도 하는 것 같다. (이 곳에 있는 코드들만 따라 분석해봐도 공부에 많은 도움이 될 것 같다..) 항목들의 구성은 대부분 비슷한 것 같다. Code 항목에서도 python, R, beginner, NLP, Random Forest 등 sorting하여 확인할 수도 있게 되어 있다. 

 

 

 커리어 전환을 통해 들어선 data 분야의 open source는 상상했던 것보다도 더 엄청나다. 영어를 조금 더 잘하게 된다면 활용할 수 있는 자료들도 무한대로 늘어날 것이라고 생각하고. 예전만큼 뇌가 팽팽 돌아가지 않는 것 같아 걱정이긴 하지만 쓰다보면 또 받아 들이는 것들이 자연스럽게 들어오는 느낌이 들겠지. 재밌다!