정말정말 정신없이 2020년 2학년이 끝났다!
작년 이맘때 1학년을 막 마치고, 패기있게 BOAZ 14기 리크루팅에 지원했고 운좋게 합격했었다. 물론 난 막내였다..!
그땐 머신러닝 모델이 DT와 RF밖에 없는줄 알았다ㅎㅎ,,,
그 후 1년동안 정말 많은 성장을 했는데, 비록 어렵고 힘든 순간도 많았지만 지금 돌아보면 조은 시간이었다🥰
그래서 1년동안 BOAZ에서 배운것들을 중심으로 차근차근 기록을 해보려한다.
1. 2020.01~2020.02 겨울방학 정규세션 + 스터디(멘토멘티, 기초 R)
정말 머신러닝이고 딥러닝이고 제대로 기초도 모르던 시절이다......... lambda를 처음봤고 딥러닝도 처음봤다....! 🤢
(그냥 나에겐 Titanic 데이터가 전부였는걸..)
나보다 훨씬 뛰어난 선배님들과 동아리원 분들이 정말 많았다.
그래서 나도 더 열심히해야겠다고 생각했던 것 같다.
특히 나는 통계전공도 제대로 듣지 않았던 1학년이라, base 지식이 너무 없어서 더욱 힘들었다.
그래도 멘토멘티 스터디로 도움을 정말 많이 받았고, 모든 내용을 하나하나 받아적으면서 이해하고 복습했다.
정규세션도.... 거의 이해하지 못했지만 그 주에 배운 내용을 복습하고 예습하고를 반복했다.
유튜브로 성킴 딥러닝강의도 듣고, 매주 나오는 정규과제에도 최선을 다 했던것 같다.
덕분에 점차 동아리에 적응할 수 있었다! 😊🙋🏻♀️
2월경에 미니 컴퍼티션도 진행했었는데, House price 데이터였다!
비록 아는게없어서 커널 앙상블을 했지만, 이때 부스팅계열 모델들을 처음 돌려봤다.
진짜 무작정 시작했고 그냥 무작정 성능 오르는 방향을 찾았던 것 같다.
난생 첫 컴퍼티션이었는데, 운좋게 성능이 잘 올라서 최종 3등을 했다. 굉장히 뿌듯했던 기억이다!
2. 2020.03 ~ 2020.07 학기 중 세션(ML)과 카카오아레나 도전
2월말에 konlpy 설치 실패의 기억과, 미니 컴퍼티션의 좋은 성과때문에 난 ML팀을 선택했다.
이때 코로나 영향으로 세션이 비대면으로 바뀌어서 아쉬웠다.
그래도 ML팀과 매주 신촌에서 만나 여러가지를 공부했다.
특히 PRML(패턴인식과 머신러닝, Pattern Recoginition and Machine Learning) 회귀 부분 발표가 기억에 남는다.
역시 통계 찐이었던 나는 아무것도 이해하지 못했고
회귀분석도 이제 막 듣고있는데 베이지안으로 회귀를 이해하라니!
그래도 또 과몰입했다. 😂
기저함수부터 편향과 분산, 베이지안 선형모델까지 모두 낯선 것들이었지만 그래도 엄청엄청 노력했다.
비대면 세션이었는데도 동아리원분들이 열심히 발표를 들어주셨다.
정말 감사했다!
그리고, 카카오 아레나에 도전하게됐다.
이때 난 정말정말 멍청했다. 머신러닝 제대로 시작한지 4개월도 채 되지 않았는데.... 추천시스템 공모전을 나가게 됐다.
팀원 오빠들이 하는말을 처음에 알아들을 수 없어서 받아 적기만 했다.
대체 임베딩을 뭘 어떻게한다는건지 사실 잘 모르는데 그냥 조용히 받아적고,
그 주를 쏟아 임베딩에 대해 공부했다. task 이해에만 한달이 걸렸다.
정말 힘들었다.
마감 한달 전에는 내가 제안한 CF(Collaborative Filtering)로 팀 방향이 바뀌었다.
마감 전 한달을 KNN의 도입과, 여러 side info 삽입에 총력을 기울인 결과 최종 Private 16위에 오를 수 있었다.
팀원 오빠들에게 정말 감사한 대회이다.
정말 많이 배울 수 있었고, 추천시스템에 관심을 가질 수 있었던 소중한 기회였다.
3. 2020.07~2020.08 여름방학 스터디(Dacon, 멘토멘티, 태블로, 추천시스템)
15기 분들이 들어오시고, 놀랍지만 나는 멘토를 맡게 되었다. 정말정말 걱정이 많았지만........ 나름 열심히 준비했다.
매주 발표를 열심히 들어준 우리 멘토멘티 A조 분들에게 너무 감사하다.
그리고 다양한 스터디에 참여했는데, 가장 열심히했던건 DACON study 였다.
1차, 2차컴퍼티션으로 나누어 진행되었는데 두 컴퍼티션 모두 정말 뼈를 갈아서 참여했다.
1차는 DACON 제주 퇴근시간 버스승차량 예측 경진대회였다.
또 과몰입해서 스터디원 내 1등을 했고, 비록 대회 기간이 끝난 public이지만 1등을 만들고서 컴퍼티션을 끝냈다.
멱평균도 처음 써보고, feature도 엄청 만들어보고, TPOT도 처음 써봤다.
2차 컴퍼티션은 성별예측 문제였는데, 처음으로 극심한 Overfitting을 경험했다.
정말 열심히했는데, 모델링에 너무 치중했고 feature를 groupby를 통해 편향된 방향으로 계속 생성한게 문제였다.
정말 큰 충격이었지만, 주변 사람들 덕분에 다시 일어설 수 있었다.
같은 실수를 반복하지 않기 위해 그 당시 하던 네이버 블로그에 과오를 정리했다.
태블로도 처음 다뤄봤다.
태블로는 쌩 처음이라 스터디를 따라가기가 쉽지않아서, 유튜브 강의를 보며 따로 공부했다.
나름 재밌게 했던 것 같다!
카카오 아레나에서 얻은 추천시스템에 대한 관심을 지속하고 싶어서 추천시스템 스터디도 참여했다.
특히 KNN-CF와 FM(Factorization Model)에 대한 세션을 진행했다. 모듈은 Lightfm을 이용했다.
# LightFM 예측 과정 from lightfm import LightFM from lightfm.evaluation import precision_at_k from lightfm.evaluation import auc_score model = LightFM(learning_rate=0.05, loss='bpr') model.fit(train, epochs=10) train_precision = precision_at_k(model, train, k=10).mean() test_precision = precision_at_k(model, test, k=10).mean()
4. 2020.09~2020.12 [2020 금융 빅데이터 페스티벌]과 통계적 머신러닝 강의 도전
한참 overfitting의 충격에 휩싸이고 있을 때 쯤, 미래에셋에서 공동 주관하는 금융 빅데이터 페스티벌에 참가하게 됐다. 자신감이 없었는데, 또 팀원 오빠들한테 고마웠다.
예선에서는 Extra Tree가 우세했고,
특유의 Randomness를 잡기위해 Random seed를 여러개 섞고, Knn도 추가했다.
해석이 복잡해질까봐 다른 모델은 섞지 않았다.
본선과 결선에서는 비즈니스 활용 가치를 녹여내야했다.
매우 난감했지만 '고객 유형화를 통한 청구 정정성 평가 및 추천 서비스 제안'을 최종 타이틀로 내걸 수 있었다.
그리고 보험금 청구 분야에서는 1등을 했다.
정말 많은 시간을 할애했고, 정말 눈물나게 노력했던 것 같다. 😂😂
그리고, 4학년 전공과목인 '통계적 머신러닝' 강의에 도전했다.
2학년은 나밖에 없었다. 🙋🏻♀️
매주 과제가 나왔고,
최종적으로는 과제가 11번? 정도 나온 강의였고 final report도 써야하는 강의였지만
과제가 나올 때마다 밤을 새서 정말 완벽하게 하려고 노력했다.
BOAZ에서 익혔던 머신러닝 태크닉을 심화해서 통계적으로 이해할 수 있어서
정말 값진 시간이었다. 📚📊📈✨
아이패드로 매주 따로 공부했던 내용을 기록했다.
2020/12/22 - [머신러닝(ML) 📚/통계적머신러닝(20-2학기)] - 아이패드로 썼던 Add study 모음
정말 정신없는 한해였다. 그리고 지금은 앞으로 나아가야할 방향을 설정하고 있다.
그래도 BOAZ와 함께여서 행복하고 많이 성장했던 한해였다! 💖😉
이번년에는 다양한 경험에 초점을 뒀다면, 새해부터는 관심있는 한 분야에 집중하고 싶다.
< 2021 목표 > - 추천시스템 집중하기 - 자료구조, 알고리즘 개발역량 기르기 - 티스토리 블로그에 열심히 기록하기 - 다양한 경험 하기 |
2021년도 화이팅 해야지 👩🏻
'Achieved 👩🏻' 카테고리의 다른 글
[BOAZ ADV 컨퍼런스] AI Personal Home Traniner (0) | 2021.01.29 |
---|---|
[미래에셋 인턴십] 한달동안 내가 여의도에서 배우고 느낀점 (4) | 2021.01.29 |
지금까지 정리했던 기초 Python과 ML (0) | 2020.12.22 |