티스토리 뷰

TIL/TIT 2019-08-16

딥러닝 NLP 손쉽게 따라해보기(Tutorial, PyCon Korea 2019) - GluonNLP

어제부터 파이콘 행사(PyCon 한국 2019)를 하고 있다. 이틀동안 튜토리얼, 이틀동안 키노트와 발표 세션을 진행한다. 어제 서울시 따릉이 데이터 분석 튜토리얼에 참석한 것에 이어서 딥러닝 NLP 손쉽게 따라해보기 - GluonNLP 참여하고 왔다.

최근에 어렴풋이 깨닫게 된 것중에 머신러닝(딥러닝)의 기능을 활용하기를 원한다면   밑바닥부터 다 개발하는 것이 아니라 api나 라이브러리를 잘 활용하는 것이 중요하다는 것이다. 그치만 그 종류를 많이 알고 있는것도 아니고, 탄탄히 공부하면 뭐라도 도움이 되겠지 싶어서 머신 러닝 이론들을 가능한대로 공부를 하고 있었다. 

NLPNatural Language Processing(자연어 처리)를 의미한다. 머신 러닝 책을 보면 꼭 절반을 지나서야 등장하는 개념이다. 그래서 사실 지금까지도 어려운 것처럼 느껴진다. 초반부 내용만 해도 끙끙 거리면서 조금 씩 읽고 있는데 자연어 처리는 언제 공부하려나 하면서...

그런 상황에서 오늘 gluonNLP 튜토리얼의 구성은 꼭 필요한 개념만 잘 추려온 것 같아서 좋았다. 자연어 처리 개발의 깊이있는 내용을 다루는 대신, 이 분야에서 일반적으로 쓰이는 이론과 용어들을 소개하고 이를 gluonNLP로 실행해보는 식으로 진행을 했는데, 이론과 실습, 그리고 gluonNLP에 대한 소개까지 적절하게 들어가 있었던 것 같다.

오늘 튜토리얼을 참여해보고 딥러닝, 자연어 처리가 프로젝트에 들어가면 무조건 어려울 것이라고 생각했는데, 라이브러리를 설치하고 코드 몇줄로 나오는 것을보니 생각보다 쉽게 할수도 있다는 생각이 들었다. 

하지만 나는 대부분의 내용을 멍 때리면서 들었는데, 처음 접하는 개념, 모르는 용어가 너무 많았다. 슬라이드에 있는 내용에 대해서는 쉽게 설명해 주는것 같았지만 그렇게 알게 된 것이 머리에 잘 남지는 않는것 같다. 말하는 문장의 반이상이 모르는 용어다 보니 그 다음, 또 그 다음 내용도 잘 모르는 악순환에 걸려들었던 것이다.

다행인건 후반부에 주변을 둘러봤을 때 나만 못알아 듣고 있는건 아닌거같다는 생각이 들었다. 먼저 짐 싸서 가시는 분이나, 맨 뒷자석에서 한숨 쉬면서 떠들던 학생들(?)도 있던거 보면...

유익하긴 했지만 머릿속이 혼란스러운 나에게 적용하는 점.

(1) NLP 를 개발에 활용하는 것은 신경망을 직접 개발하는 것과는 다르다. 
(2) 자주 쓰이는 개념, 용어를 알아가는 식으로 공부해보자.(어떤 정보를 접했을 때 문맥을 파악하기 위한 필수 조건....)

오늘 들은 강연을 다 기억할 수는 없지만, 하루가 가기 전에 자료를 다시 보면서 용어를 몇개라도 짚어본다. 용어를 다시 떠올리니까 머리가 아프긴 한데 과정이라고 생각하자...

...더보기

순서는 뒤죽박죽일수도 있다.

  • Reshape, transpose
  • RNN - Recurrent Neural Network 순환신경망
  • DNN - Deep Neural Network
  • 드롭 아웃
  • 시퀀스 데이터
  • 시퀀스 모델링
  • intent
  • 엔티티(entity) - E, C? 
  • LSTM - Long Short Term Network 장단기기억 네트워크(의존성이 긴 시퀀스를 모델링하는 기본적인 방법임)
  • 어텐션
  • seq2seq
  • MNIST(엠네스트 라고 발음했다)
  • 그래디언트?
  • 게이트?
  • Vocab
  • 임베딩(embedding)
  • validation split
  • word2vec

...

 

https://gluon-nlp.mxnet.io 에서도 소개/Tutorial/API Document 등을 볼 수 있다.

반응형
댓글