안녕하세요!
6주간의 데이터 분석 프로그램인 DSA 1기 활동이 모두 종료되었습니다. 이번 프로그램을 통해서 새로운 관점에서 문제해결력을 바라보게 되었고 데이터 분석과 관련된 경험을 쌓을 수 있었기 때문에 여러분들에게도 한 가지 프로그램을 소개해드리려고 해요.
데이터 분석 역량을 기르기 위해 서치하던 중, 유튜브에서 DataStation Academy 1기를 모집한다는 글을 보았고 프로그램에 대한 설명글에서 특히, 실무와 밀접한 데이터 분석 프로젝트를 진행하는 점에 이끌려서 바로 신청하게 되었습니다. 다음은 제가 진행했던 DSA 1기 프로그램 활동에 대한 후기입니다.
1. 활동개요
6주만에 실무 데이터 분석 경험을 쌓을 수 있는 파이썬 데이터 분석 프로젝트 (기간: 11/4 ~ 12/16)
2. 스터디
본격적으로 실무 팀 프로젝트 전, 1~4주 까지 DSA 강의를 통해 python 기초를 다지는 과정을 거치게 됩니다.
DSA 홈페이지 링크: https://data-station.liveklass.com/
학습 내용에 대해서 좀 더 구체적으로 알려드리자면,
1주차는 빅데이터에 대한 개념, Anaconda 설치 그리고 기본적인 python 문법을 학습했습니다.
2주차부터는 본격적으로 데이터전처리를 배우게 됩니다! 예를 들면, 기술통계량 실습, 날짜 데이터 처리, pivot table, 결측치 처리 등이 있습니다. 저희가 대학교나 학원에서 배우는 데이터전처리 내용 대부분을 배우게 된다고 할 수 있습니다. 실제로, 저는 DSA 실무 데이터 프로젝트를 진행하면서 빅데이터분석기사 자격증도 함께 취득을 하였는데 DSA 강의 덕분에 이때 실기 평가에서 데이터전처리 유형 파트를 별도의 공부없이 준비할 수 있었습니다.
3주차에는 EDA와 통계 가설 검정 그리고 머신러닝 기초에 대해서 학습했습니다. DSA 강의에서 새로웠던 것은 plotly, scipy를 이용한 가설 검정 수행이었습니다. 저는 대학교에서 plotly, scipy를 안배웠기 때문에 더 집중해서 강의를 들었습니다!
4주차는 실무 팀 프로젝트 바로 전 주로, 1~3주차 내용을 전체적으로 복습하고 머신러닝을 집중적으로 학습합니다. 개인적으로 4주차가 가장 어려웠습니다. 1~3주차에 비해 내용도 많았고 코드도 훨씬 복잡했기 때문이죠! 주된 내용은 특성공학, 분류/회귀 모델, 파이프라인, 그리드서치에 대해서 배우게 됩니다. 참고로 특성공학은 데이터전처리와 같다고 보시면 됩니다. 이때, DSA 강의가 제 진로와 관련된 IT/제조 데이터로 진행이 되기 때문에 더 주의깊게 들었던 것 같습니다.
3. 체계적인 계획과 팀 미션
DSA 프로젝트의 장점을 몇 가지 더 첨언하자면, 첫째로, 교육생들에게 강의만 제공하는 것이 아닙니다. 1~4주차 수업에 대한 체계적으로 강의 계획을 제공하여 비전공자, 의지가 강하지 않은 사람도 끝까지 따라올 수 있게 구성하였습니다. 예를 들어, 전공자는 챕터3을 건너뛰어도 된다거나 비전공자는 월요일부터 화요일까지 챕터1을 수강한다든지 등 수강생의 상황에 맞춰 디테일하게 타임라인을 정해주었기 때문에 누구라도 끝까지 완수할 수 있습니다! 아래 사진은 실제 타임라인 중 일부입니다.
둘째로, 매 주 팀미션을 통해 팀원들과 강의내용과 미션에 대하여 토의를 진행한다는 것입니다. 회의를 통해 팀원들과 이해가 가지 않는 내용을 추가적으로 학습할 수 있을 뿐만 아니라, 매 주마다 미션(과제)가 부여되는데 자신의 코드를 팀원들과 공유하면서 다양한 로직을 접할 수 있어서 학습에 많은 도움이 되었습니다.
4. 온라인 세미나
1~4주차 데이터 분석 프로젝트를 진행하면서 중간중간 온라인 세미나로 진행하였습니다. 온라인 세미나는 유튜브로 진행되었고 세미나의 주된 내용은 미션에 대한 솔루션, 코드에 대한 피드백, 취업에 관한 Q&A로 구성되었습니다! 특히, 강사님께서 대기업 인사 경험도 갖고 계셨기 때문에 자기소개서나 면접에 대한 팁을 많이 주셨습니다. 아래는 데이터스테이션 유튜브 링크입니다.
데이터 스테이션 유튜브 링크: https://www.youtube.com/@data_station
5. 팀 프로젝트
마지막 단계로, 팀 프로젝트를 진행하였습니다. 프로젝트는 각 팀별로 실무 데이터 한 세트씩 주어지는데 해당 데이터로 데이터 분석을 하는 것입니다. 이렇게 말하면 학교에서 과제로 진행하는 프로젝트나 여타 다른 교육 프로그램과 다를 바가 없어보이지만 DSA는 실제로 대기업에서 진행되는 데이터 분석 프로세스 그대로 프로젝트를 진행한다는 것이 차별화된 점입니다! 실제로, 강사님이 여러 기업 임직원을 대상으로 데이터 분석 강의를 하시며 실무에서 진행되는 데이터 분석 프로세스를 그대로 가져왔기 때문에 자기소개서나 면접에서 활용하기에 좋은 소스가 될 수 있습니다.
저희 팀에게 주어진 데이터는 반도체 공정 데이터였습니다. 프로젝트에서도 체계적으로 절차와 계획을 제공해주셨는데 과제 정의 > 분석 계획 > 분석 결과 및 인사이트 > 개선안 도출 순으로 진행되었습니다. 위에서도 언급하였지만 이 절차는 실제 실무에서도 똑같이 사용되는 데이터 분석 절차입니다.
프로젝트 2주간 진행이 되었고 저희는 반도체 시황 분석, 문제점 도출, 도메인 이해, 데이터 분석 계획 수립, 인사이트 도출 등 제공된 데이터 분석 절차를 더 세분화하여서 진행하였습니다! 반도체 공정은 특히, 도메인 지식이 다른 도메인보다 더 전문적이기 때문에 진로가 반도체가 아닌 분들은 자료 수집에 더 많은 시간을 투자하셔야 할 것 같습니다.
6. 최종발표
마지막 최종발표는 12월16일 강남에서 오프라인으로 진행되었습니다. 저희 팀은 한 분이 안오셔서 3명이서 진행하였습니다. 저희 팀에는 공대생이 많았는데 다른 팀들을 보니 직장인 분들도 계셨고 다른 단과대학 대학생 분들도 계셨습니다. 평가는 대표님을 비롯하여 멘토님 2분이 평가를 하셨습니다. 한 가지 팁을 드리자면, 의외로 홈쇼핑 데이터가 분석하기 어려운 것 같았습니다.
7. 후기
6주간 프로젝트에 참여하면서 DSA만의 차별화된 점을 많이 느낄 수 있었습니다! 특히, 분석 절차대로 데이터 분석을 한 경험이 정말 인상깊었습니다. 대학교에서 많은 프로젝트를 경험해봤지만 별다른 느낀 점 없이 주어진 양식대로 진행하였는데 DSA에서는 대표님께서 실제 현업과 계속해서 연결하며 분석 절차의 중요성을 설명해주셨기 때문에 수월하게 이해할 수 있었던 것 같습니다. 이렇게 DSA 1기 활동은 끝이 났지만 실무 프로젝트 경험과 제가 느낀 점은 앞으로 회사를 가서도 요긴하게 사용할 수 있을 것 같습니다! 끝으로, 실무와 밀접한 프로그램을 만들어주신 대표님과 항상 친절하게 대해주신 멘토님께도 감사드립니다!