Footnote:
Nach Informationen von SSRN wurde die ursprüngliche Fassung des Dokuments June 18, 2019 erstellt
Description:
Korean Abstract: 본고에서는 텍스트 분석이 이루어지는 과정, 주요 방법론, 경제 분석에의 적용 사례 등을 상세히 기술하였다. 텍스트 마이닝이란 빅데이터 분석 또는 데이터 과학의 대표적인 분야이며, 머신러닝 등 전산기술을 활용하여 언어에 담긴 정보를 정형적 데이터로 추출해내는 과정이다. 언어는 다의성과 비정형성 등 고유한 특성이 있어 이로부터 원하는 정보만 추출해내기는 쉽지 않다. 텍스트 마이닝을 활용할 경우 기존 경제학적 방법으로 예측이 어려운 실시간 예측 및 불확실성 측정 등이 가능하며, 중앙은행 커뮤니케이션 분석 등 기존 모형의 적용이 어려웠던 주제들에 대한 분석도 가능하다. 전산기술의 발달과 동시에 텍스트 마이닝 기법은 빠른 속도로 발전해가고 있으며, 최근 학계와 중앙은행의 관심도 지속적으로 증가함에 따라 경제학 분야에서도 텍스트 마이닝을 활용한 연구가 주요 학술지에 게재되고 있다. 경제학적 분석에 주로 사용되는 구조화된 수치자료의 한계를 보완함과 동시에 새로운 정보의 원천으로써 텍스트 데이터의 수요는 더욱 증대될 것으로 기대된다
English Abstract: We provide detailed description of how text data analysis is done and review series of studies done through text mining. Natural language can be characterized with ambiguity and obscurity compared to structured data. It is hard to retrieve useful information from text data as it carries natural language itself. Text mining or natural language processing is a multi-discipline area of modern technic in which we can distill and obtain just what we need from text. With the development of AI and machine learning, text mining is becoming one of the high-end technology in various fields of research even in economics. We expect there will be more demand for text data analysis as it will be complementary to traditional structured data and also as a new source of information