바로가기

모두를 위한 열린 강좌 KOCW

주메뉴

  • 주제분류
    사회과학 >경영ㆍ경제 >경영학
  • 강의학기
    2022년 2학기
  • 조회수
    1,194
  •  
강의계획서
강의계획서
본 과목에서는 텍스트 마이닝과 관련된 다양한 기법을 학습한다. 비정형자료 전처리 기법, 웹데이터 수집 방법, 텍스트 데이터 구조, 감성분석, 텍스트 클러스터링 기법, 토픽 모델링 기법을 학습한다.

R프로그래밍 기반의 다양한 사례 학습 훈련을 통하여 실제 데이터 분석 능력을 확립하는 것을 목표로한다.

차시별 강의

PDF VIDEO SWF AUDIO DOC AX
1. 문서 파이썬 기초 정형자료는주체, 변수, 관찰치로구성되어일반적인통계분석에적절한구조(스프래드시트)로작성됨.비정형자료는문서, 이미지, 음성, 동영상등으로전통적인통계분석기법을적용하기어렵고, 분석을위한전처리과정이필요함. URL
2. 문서 비정형자료 전처리1 정규식을이용한문자열검색 URL
3. 문서 비정형자료 전처리2 외부 데이터 불러오기 및 저장 URL
4. 문서 웹데이터 수집1(파싱) 웹 기본 용어, 웹분석 기본 용어 URL
5. 문서 웹데이터 수집2(OPEN API) URL 파일 다운로드와 저장 URL
6. 문서 웹데이터 수집3(Selenium) 웹 분석 응용 URL
7. 문서 텍스트데이터 구조 Open API URL
8. 문서 감성분석 웹 스크래핑 : Selenium URL
9. 문서 텍스트클러스터링과 분류 텍스트 데이터 구조 URL
10. 문서 토픽모델 정수 인코딩 (Integer Encoding) URL

연관 자료

loading..

사용자 의견

강의 평가를 위해서는 로그인 해주세요. 로그인팝업

이용방법

  • 문서 자료 이용시 필요한 프로그램 [바로가기]


    ※ 강의별로 교수님의 사정에 따라 전체 차시 중 일부 차시만 공개되는 경우가 있으니 양해 부탁드립니다.

이용조건