본문 바로가기

인공지능7

[인공지능 통합과정] 6주차 : 타이타닉 실습 (미니프로젝트 2) # 머신러닝 프로젝트의 교과서, 타이타닉 6주차 (사실 5주차 마지막 날 + 6주차 첫 날) 에는 머신러닝을 배우는 사람이라면 누구나 입문하게 되는 '캐글 타이타닉 프로젝트' 를 진행하게 되었다. (캐글 데이터셋: www.kaggle.com/c/titanic) Titanic - Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com 이틀이라는 짧은 시간 동안 진행되었기에, '프로젝트'라고 부르기엔 약간의 어폐가 있는 것 같고 '실습활동' 정도가 적당한 것 같다. 본 실습의 목적은 정형데이터셋을 활용하여 일주일 간 배운 머신러닝 이론들을 코드로 .. 2021. 3. 8.
[인공지능 통합과정] 5주차 : SQL, 머신러닝 # SQL, 데이터베이스의 초입 첫 번째 세미프로젝트가 끝난 뒤, 잠시 쉬는 차원에서 이틀간 DB (Database) 이론과 SQL 기초 문법을 배웠다. 이론적인 내용에 깊이 들어가지 않았는데, 다뤘던 내용의 핵심을 나열하면 다음과 같다. DBMS (Database Management System) 의 개념과 유형 데이터모델링 3단계와 단계별 세부내용 (개념적, 논리적, 물리적 모델링) SQL 과 데이터 언어 (DDL, DML, DCL) SQL 과 NoSQL 이론적인 내용은 블로그에 추후 보완할 내용이거나 잘 설명되어 있는 다른 출처가 많으므로, SQL 학습 과정과 이에 대해 느낀 점 위주로 작성해보고자 한다. 우리는 SQL 기반 RDBMS 중 SQLite 로 실습을 진행했다. DB 를 본격적으로 다루기.. 2021. 2. 13.
[인공지능 통합과정] 4주차: 세미프로젝트1 # 데이터 전처리의 늪 지난 글에 이어 세미프로젝트 1의 후기를 작성해본다. 우선 세미프로젝트1을 통해 가장 크게 배운 점을 요약하자면: !! 데이터 전처리는 데이터 분석의 핵심이다 !! 사실 이 당시, 데이터 전처리... 라고 하기에도 부끄러운 작업을 너무 오래 했었다. 지금 생각해보면 별 것도 아닌 일들에 쩔쩔매고, 어려워했다. 원인을 분석해보면, 팀원 전원이 pandas 에 익숙하지 않았음 -> 단순한 작업 하나도 구글링하거나 수업 자료 뒤적이느라 오래걸림 데이터 선정의 미스 -> 공공데이터 한두개 정도 선정해서 작업했어야 하는데 취합할 데이터가 5-6개로 늘어남 그도 그럴 것이, 우리 조의 주제는 '서울시 어린이 교통사고 발생 지역 분석' 이었는데, 우리가 다뤘던 공공데이터만 해도 10가지가 넘었.. 2021. 2. 9.
[인공지능 통합과정] 3주차 : Selenium, 기초통계, 미니프로젝트1 # Selenium 을 통한 웹 크롤링 지난 주차에서 진행되었던 웹 크롤링에 이어, 이번에는 Selenium 과 Chrome Driver (코드로 커서를 조종할 수 있는 가상의 브라우저) 를 활용하여 조금 더 세심한 조작을 하는 웹 크롤러를 만들어보았다. Beautiful Soup 과 Selenium 의 가장 큰 차이는 어떤 페이지를 크롤링할 수 있는지이다. 전자는 페이지 내의 정보가 변하지 않거나, 추가 로그인이나 버튼 클릭이 필요하지 않은 '정적 페이지' 크롤링을 위한 라이브러리이다. 실제로 속도도 빠르고 사용하기 간편하다는 장점이 있으나, 크롤링할 수 있는 페이지가 제한적이며 페이지 곳곳에 설치된 버튼을 누르거나 javascript 코드를 실행할 수 없다는 단점도 있다. 따라서 Beautiful S.. 2021. 1. 22.
[인공지능 통합과정] 2주차 : Pandas 라이브러리, 웹 크롤링 기초 # 일 7시간 강의의 강행군 본격적인 수업이 시작되어 매일 아침 9시에 일어나 수업을 듣고, 17시에 마무리하는 일 7시간의 일정을 몸으로 소화하게 되었다. 평소 철저한 새벽형 인간 생활을 했던 나는 늘 2-3 시에 잠들어 10시쯤 일어나 하루를 시작하곤 했는데, 갑자기 아침에 일어나 9시부터 뇌를 굴리려니 적응이 잘 되지 않았다. 이 시기에는 쉬는 시간에 틈틈이 자는 대신 저녁에 복습을 몰아서 하며 학습 진도를 따라갔다. 모든 국비교육/코딩교육 프로그램이 그렇지는 않겠지만, 내가 수강하고 있는 교육과 같이 하루에 5시간 이상의 강의를 듣게 되는 경우, 이후 내용을 따라가기 위해서 제때 복습하는 것이 중요하다고 느낀다. (그리고 이 부분은 특히 1차 세미프로젝트 이후 머신러닝 파트에 진입하면서 더 체감하.. 2021. 1. 21.
[인공지능 통합과정] 1주차 : '코드라이언'을 활용한 파이썬 기초 학습 # 코드라이언 국비교육 첫째 주 월요일부터 목요일까지 멋쟁이사자처럼의 온라인 코딩교육 플랫폼 '코드라이언(Code Lion)'을 통해 파이썬 기초를 배웠다. 멋재이사자처럼의 대표 이두희 씨의 기초 강의와 코드라이언 개발팀의 심화 강의까지, 총 3개의 강의를 들었다. http://www.codelion.net 코드라이언 | 손으로 하는 진짜 코딩 멋쟁이사자처럼이 만든 온라인 코딩 교육 서비스 코드라이언, 이제 눈으로만 공부하지 말고 손으로 진짜 코딩 공부를 시작해보세요! www.codelion.net 사이트에 들어가보면 강의 카탈로그가 나오는데, 파이썬을 비롯해 javascript, Ruby, html, css 등 원하는 강의를 선택해 수강할 수 있게 되어 있었다. 강의 내용이 간결하고 쉽게 되어 있어서 .. 2021. 1. 6.
[인공지능 통합과정] 0주차 : 인공지능 통합과정 지원부터 선발까지 # 멋쟁이사자처럼 인공지능 통합과정 지난 12월 7일부터 코딩교육으로 유명한 에서 진행하는 인공지능 통합과정 1기에 선발되어 국비지원을 받으며 교육을 받고 있다. 1기임에도 불구하고 지원자 수가 1,000 명이 넘었다고 하니, 인공지능에 대한 사회의 관심이 부상하고 있다는 사실을 직접 체감할 수 있었다. # 지원 동기 나는 비전공자 중에서도 사회과학을 공부한 문과생으로, 학부를 다니면서는 IT 분야를 깊이 공부해본 적이 없었다. 그나마 했던 생각은 '요즘 코딩이 뜨는 분야라던데 나도 언젠가 파이썬이라도 배워봐야 하나?' 였다. 코딩이 무엇인지, 어디에 쓰이는지, 파이썬이 어떤 언어인지, 파이썬으로 무엇을 할 수 있는지조차 몰랐던 시절이었음에도 막연히 언젠가는 도전해보겠다는 생각을 했었다. 올해 초, 졸업.. 2020. 12. 29.