오늘은 이지스퍼블리싱에서 출간된 Do it! 시리즈인 ⌜BERT와 GPT로 배우는 자연어처리⌟ 를 간단히 리뷰해보려고 합니다 :)
이 리뷰는 이지스퍼블리싱 측에서 책을 제공받아 작성되었습니다.
이 책은 소제목에 맞게 트랜스포머 핵심 원리와 허깅페이스 패키지 활용법에 대해 중심적으로 다루고 있는데요, NLP(자연어처리)를 처음 접하는 분들도 그림과 함께 쉽게 이해하실 수 있을 것 같습니다.
특히 저자는 유명한 ratsgo blog의 이기창선생님으로, 모든 실습은 아래 github의 패키지를 통해 진행됩니다. 그리고 실습시 이슈가 생기면 아래 github의 issue를 통해 적극적으로 해결할 수 있다는 점이 굉장히 좋았습니다.
관심있으신 분들은 아래 github을 참고해보시면 될 것 같습니다!
나아가 제가 본 도서에서 개인적으로 인상 깊었던 점을 정리해보자면 다음과 같습니다.
1. 이해하기 쉬운 그림과 설명
사실 NLP 공부에서는 어텐션 개념이나 트랜스포머 개념이 상당히 중요하지만, 처음 공부하는 입장에서 다소 어려운 개념이기도 하다고 생각합니다. 하지만 본 책에서는 이러한 모든 개념을 먼저 그림으로 쉽게 설명합니다. 위 그림은 전이학습을 설명할 그림인데요, 전이학습의 개념은 특정 태스크를 학습한 모델을 다운스트림 태스크에 적용하는 방법입니다. 따라서 본 그림도 이러한 개념을 바탕으로 트랜스퍼 러닝이 길을 알려준다는 내용을 담고 있는데요, 독자 입장에서 이해하기 비교적 어려움이 없었습니다.
2. 기초적인 딥러닝 개념부터 실전 코드까지 설명
사실 소제목은 트랜스포머의 원리와 허깅페이스 패키지의 활용법이지만, 이 책은 기본적인 딥러닝 개념에 대한 설명도 담고 있습니다. NLP 모델들의 이해에 필수적으로 필요한 배치정규화나 FCN (Fully Connected Network) 등의 기초적인 설명 후 본격적으로 NLP 모델에 대해 소개해 독자 입장에서 거부감이 없었습니다.
본 책의 목차는 다음과 같습니다.
3. 실습으로 colab을 활용
본 도서는 모든 실습을 colab으로 진행합니다. colab은 구글에서 제공하는 무료 gpu가 내장되어있는 서비스입니다. 보통 딥러닝은 gpu를 필요로 하기 때문에, 개인 컴퓨터나 노트북에 gpu가 내장되어 있지 않으신 독자분들은 실습에 접근하기 어려우실 수 있습니다. 이러한 점을 고려한 듯, 본 도서는 위 github의 패키지를 이용해 colab에서 실습을 진행하는 점이 좋았습니다.
이렇게 책 ⌜BERT와 GPT로 배우는 자연어처리⌟ 을 간단히 리뷰해보았는데요, NLP에 처음이지만 트랜스포머의 원리와 허깅페이스의 개념까지 다뤄보고 싶으신 독자분들께 추천합니다. 다만 딥러닝에 아예 처음이시라면, NLP 중심 도서이다보니 앞선 딥러닝 기본 개념 설명이 불충분하다고 느끼실 수 있으실 듯 하니 관련 도서를 보충해서 읽어보시는걸 추천드립니다.
'NLP' 카테고리의 다른 글
[NLP] LORA : Low-Rank Adaptation of Large Language Models 논문 리뷰 (0) | 2023.04.04 |
---|---|
[NLP] Transformer(트랜스포머, Attention is all you need) (0) | 2021.02.09 |
[NLP] Attention Mechanism (어텐션 메커니즘) (0) | 2021.02.09 |
[NLP] Sequence-to-Sequence (Seq2Seq, 시퀀스 투 시퀀스) (0) | 2021.02.08 |