K-Digital2 [인공지능 통합과정] 6주차 : 타이타닉 실습 (미니프로젝트 2) # 머신러닝 프로젝트의 교과서, 타이타닉 6주차 (사실 5주차 마지막 날 + 6주차 첫 날) 에는 머신러닝을 배우는 사람이라면 누구나 입문하게 되는 '캐글 타이타닉 프로젝트' 를 진행하게 되었다. (캐글 데이터셋: www.kaggle.com/c/titanic) Titanic - Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com 이틀이라는 짧은 시간 동안 진행되었기에, '프로젝트'라고 부르기엔 약간의 어폐가 있는 것 같고 '실습활동' 정도가 적당한 것 같다. 본 실습의 목적은 정형데이터셋을 활용하여 일주일 간 배운 머신러닝 이론들을 코드로 .. 2021. 3. 8. [인공지능 통합과정] 4주차: 세미프로젝트1 # 데이터 전처리의 늪 지난 글에 이어 세미프로젝트 1의 후기를 작성해본다. 우선 세미프로젝트1을 통해 가장 크게 배운 점을 요약하자면: !! 데이터 전처리는 데이터 분석의 핵심이다 !! 사실 이 당시, 데이터 전처리... 라고 하기에도 부끄러운 작업을 너무 오래 했었다. 지금 생각해보면 별 것도 아닌 일들에 쩔쩔매고, 어려워했다. 원인을 분석해보면, 팀원 전원이 pandas 에 익숙하지 않았음 -> 단순한 작업 하나도 구글링하거나 수업 자료 뒤적이느라 오래걸림 데이터 선정의 미스 -> 공공데이터 한두개 정도 선정해서 작업했어야 하는데 취합할 데이터가 5-6개로 늘어남 그도 그럴 것이, 우리 조의 주제는 '서울시 어린이 교통사고 발생 지역 분석' 이었는데, 우리가 다뤘던 공공데이터만 해도 10가지가 넘었.. 2021. 2. 9. 이전 1 다음