본문 바로가기

반응형

자연어처리(NLP)

(21)
4-1. Transformer(Self Attention) [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다. 현재 저는 '초등학생도 이해하는 자연어 처리'라는 주제로 자연어 처리(NLP)에 대해 포스팅을 하고 있습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 자연어 처리(NLP)에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 지금부터 알아볼 내용은 'Transformer'입니다. Transformer 개념은 너무 방대하기 때문에 이번 시간에는 "Self Attention"을 집중적으로 다루겠습니다. 이후 내용들은 다음 글에서 다루도록 하겠습니다. Transformer 란? 본론 부터 말씀드리면 Transformer 모델은 Attention만으로 이루어진 encoder-decoder 구조의 seqence ..
3. Attention [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다. 현재 저는 '초등학생도 이해하는 자연어 처리'라는 주제로 자연어 처리(NLP)에 대해 포스팅을 하고 있습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 자연어 처리(NLP)에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 오늘 알아볼 내용은 요즘 핫한 뉴진스의 'Attention'입니다. Attention 이란? Attention이란 문맥에 따라 집중할 단어를 결정하는 방식을 의미합니다. 우리는 글을 읽을때 모든 단어들 집중해서 읽지 않습니다. 중요하다고 생각하는 단어에만 집중을 하고 나머지는 그냥 읽습니다. 이 방법이 문맥을 파악하는 핵심입니다. 이러한 방식을 딥러닝 모델에 적용한 것이 'Atten..
2-1. BOW(Bag of Words)기반 'TF-IDF' [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다. 현재 저는 '초등학생도 이해하는 자연어 처리'라는 주제로 자연어 처리(NLP)에 대해 포스팅을 하고 있습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 자연어 처리(NLP)에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 오늘 알아볼 내용은 'TF-IDF(Term Frequency-Inverse Document Frequency)'입니다. https://codingopera.tistory.com/36?category=1094804 2. BOW(Bag of Words)기반 '카운트 벡터(Count Vector)' [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 '..
2. BOW(Bag of Words)기반 '카운트 벡터(Count Vector)' [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다. 현재 저는 '초등학생도 이해하는 자연어 처리'라는 주제로 자연어 처리(NLP)에 대해 포스팅을 하고 있습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 자연어 처리(NLP)에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 오늘 알아볼 내용은 'BOW(Bag of Words)'입니다. BOW(Bag of Words) 란? 우리는 어떻게 글을 이해할까요? 아마 가장 간단한 방법은 글에 나와있는 단어의 빈도를 이용하는 것일 겁니다. 이유는 당연합니다. 축구에 관한 글에서는 '축구'라는 단어가 많이 나올 것이고, BTS관련 기사에서는 'BTS'가 많이 나오기 때문입니다. 이러한 상식으로부터 출발한 것이 바로..
1. 토큰화 [초등학생도 이해하는 자연어처리] 안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다. 오늘부터는 '초등학생도 이해하는 자연어 처리'라는 주제로 자연어 처리(NLP)에 대해 포스팅하도록 하겠습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 자연어 처리(NLP)에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 오늘 알아볼 내용은 '토큰화'입니다. 토큰화란? 우선 토큰화가 무엇이지 알아야겠죠? 토큰화란 문장을 분석하기 위해 더 이상 쪼개 지지 않을 때까지 잘게 분해는 작업을 의미합니다. 여러분들이 레고 모형을 더 이상 쪼개 지지 않는 레고 블록 단위로 분해하는 것과 유사하다고 생각하면 됩니다. 여기서 '토큰(token)'은 우리나라 말로는 '형태소(morpheme)'로 가장 작은 말의 단위..

반응형