1. |
|
텍스트분석 기본 개요
|
비정형 데이터의 분석 기술들을 이해하고 비정형 데이터들의 특성에 대해 학습합니다. 또한, 텍스트분석에 대한 기본적인 개념에 대해 설명합니다. |
|
2. |
|
R설치 및 사용법
|
R에 대한 소개와 R과 R Studio를 설치하고 분석을 위한 환경을 세팅합니다. |
|
3. |
|
R기초 문법
|
R 프로그래밍의 데이터 구조 및 기초 문법을 학습합니다. |
|
4. |
|
Tidy와 dplyr 라이브러리
|
Tidydata가 무엇이며, tibble 데이터객체에 대해 이해합니다. Tidy와 dplyr 라이브러리를 다루는 방법에 대해 학습합니다. |
|
5. |
|
데이터시각화-ggplot2
|
ggplot2라이브러리를 이용하여 데이터시각화 방법을 학습하며, 다양한 그래프들을 그려봅니다. |
|
6. |
|
텍스트데이터 전처리 개요
|
말뭉치의 개념과 텍스트 데이터의 전처리 방법을 학습합니다. |
|
7. |
|
stringr 라이브러리
|
정규표현식을 다루는 방법과 stringr 라이브러리를 다루는 방법을 학습합니다. |
|
8. |
|
단어빈도분석
|
실제 데이터들을 통해 전처리하고 토큰화하여 단어빈도를 분석하는 방법에 대해 학습합니다. |
|
9. |
|
형태소 분석이용 단어빈도분석
|
형태소 분석기를 사용하여 단어를 추출하고 빈도분석을 수행합니다. |
|
10. |
|
단어비교분석
|
여러 개의 텍스트를 비교해 차이를 알아보는 분석 방법에 대해 학습합니다. |
|
11. |
|
감정분석
|
텍스트에 담겨있는 감정을 분석하는 방법에 대해 학습합니다. |
|
12. |
|
의미망 분석(1)
|
동시출현단어, 동시출현네트워크 생성방법에 대해 학습합니다. |
|
13. |
|
의미망 분석(2)
|
다른 단어에 비해 상대적으로 자주 함께 사용된 단어, 연이어 사용된 단어쌍 등을 생성하는 방법을 학습합니다. |
|
14. |
|
토픽모델링(1)
|
토픽모델링에 대한 개념을 학습하고 토픽별 주요단어들을 살펴봅니다. |
|
15. |
|
토픽모델링(2)
|
문서를 토픽별로 분류하고 최적의 토픽수를 정하는 방법에 대해 학습합니다. |
|