AI 머신러닝
텍스트, 시퀀스를 위한 딥러닝
KIMYOUNGIN
2019. 9. 17. 15:29
반응형
이번에 알아볼 것은 텍스트 데이터를 어떻게 쓸만한 형태로 만들지... 전처리하는 방법에 대해 알아보겠습니다.
단어의 시퀀스, 문자의 시퀀스, 시계열 또는 일반적인인 시퀀스 데이터를 처리 할 수 있는 딥러닝 모델을 알아보겠습니다!
* 시퀀스 : 문자의 열이라고 생각하면 될것 같아요...
시퀀스(sequence)는 데이터에 순서(번호)를 붙여 나열한 것이며, 다음은 장바구니에 담을 물건을 메모한 목록이다.
- 아이스크림, 라면, 간장, 소금, 메론
위 목록은 시퀀스다. 시퀀스에서는 순서로 요소를 가리킬 수 있다. 첫 번째 요소는 아이스크림, 두 번째는 라면, 마지막은 메론다. “네 번째 데이터가 무엇이냐”라는 질문에 “소금”라고 답하는 것도 가능하다. 이 예처럼 시퀀스는 데이터를 하나씩 순서대로 나열한 것이다.
딥러닝 모델은 RNN, 1D 컨브넷 두 가지 입니다.
다음 애플리케이션들이 이런 알고리즘을 사용합니다.
* 문서 분류나 시계열 분류. 예를 들어 글의 주제나 책의 저자 식별하기
* 시계열 비교. 예를 드면 두 문서나 두 주식 가격이 얼마나 밀접한 관련이 있는지 추정하기
* 시계열 예측. 최근 날씨 데이터가 주어졌을 때 앞으로의 날씨 예측하는 것!
* 시퀀스 TO 시퀀스 학습, 예를 들면 영어 문장을 일본어로 번역하기
* 감성 분석. 영화리뷰가 긍정적인지 부정적인지 분류
반응형