ISBN/价格: | 978-7-111-58855-9:CNY59.00 |
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 文本挖掘/.Julia Silge, David Robinson著/.刘波, 罗棻, 唐亮贵译 |
出版发行项: | 北京:,机械工业出版社:,2018 |
载体形态项: | 161页:;+图:;+24cm |
丛编项: | O'Reilly精品图书系列 |
一般附注: | 华章IT |
相关题名附注: | 英文题名原文取自版权页 |
提要文摘: | 全书共9章,主要介绍如何使用基于R的整洁工具来进行文本分析。首先介绍了整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍了如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍了如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通信信息。 |
并列题名: | Text mining with R eng |
题名主题: | 程序语言 程序设计 |
中图分类: | TP312R |
个人名称等同: | 斯拉格 (Silge, Julia) 著 |
---|
个人名称等同: | 罗宾逊 (Robinson, David) 著 |
个人名称次要: | 刘波 译 |
---|
个人名称次要: | 罗棻 译 |
---|
个人名称次要: | 唐亮贵 译 |
记录来源: | CN 湖北三新 20180608 |