DNA/DATA

R studio 워드 클라우드

KIMYOUNGIN 2019. 10. 4. 21:36
반응형

#---------텍스트 마이닝------------

# 단어 분류 또는 문법적 구조 분석

## 지역별 인구수의 변화에대한 워드클라우드 출력
Sys.getenv("JAVA_HOME")
install.packages("wordcloud")
library(wordcloud)


word = c("인천광역시", "강화군", "용진군", "대구광역시", "서울특별시")
frequency <- c(651, 85, 61, 402, 999)
wordcloud(word, frequency, colors = rainbow(length(word)))

# 워드 클라우드
# - 데이터 시각화 기법 중 하나로 하나의 텍스틑에 출현하는 단어를 빈도에 비례하는 크기로 표출한 그래프


install.packages("KoNLP")
install.packages("wordcloud")
library(KoNLP)
library(wordcloud)

useSejongDic()
a <- c("우리나라 이름은 대한민국입니다. 옆에는 일본도 있습니다.")
extractNoun(a) # 명사추출

b <- c("우리나라 이름은 대한민국이며 영어로 korea 입니다","옆나라는 일본이며 영어로 japan입니다.")
c <- sapply(b, extractNoun,USE.NAMES = F)
c

getwd

반응형