导图社区 文本处理技术
这是一篇关于文本处理技术的思维导图,主要内容包括:文本的可视化,文本的获取,文本的常用格式,详细介绍了文本处理技术在不同方面的关键内容,列举了多种文本格式及其说明,包括CAJ、RTF、HTML、PDG、TXT、DOCX、PDF等格式,介绍了它们的应用场景和打开方式。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
文本处理技术
文本的常用格式
CAJ格式:中国学术期刊全文数据库(China Academic Journals),一般用CAJ全文浏览器阅读。
RTF格式:一种跨平台的文本格式。
HTML格式:一种用于创建网页的标记语言
PDG格式:超星数字图书的格式,一般用超星阅读器打开
TXT格式:微软在操作系统上附带的一种文本格式,主要用于保存文本信息。
DOCX格式:Microsoft Office系列软件Word生成的文档格式。 国内金山公司WPS Office系列Word的文档格式。
PDF格式:便携文档格式(Portable Document Format),由Adobe公司开发的跨平台文件格式
文本的获取
键盘输入:优点是不需要附加其它录入设备, 缺点是费时费力。
手写输入:优点是符合人们写字的习惯, 缺点是录入速度慢、只适合少量文本的输入。
语音输入:优点是录入速度快, 缺点是语音识别率受话筒质量、录入者的普通话标准程度等因素的影响。
OCR识别输入 OCR(Optical Character Recognition)技术是光学字符识别技术的英文缩写。OCR识别是将图像中的文字识别出来,并转换为文本格式的文件,同时可对识别不正确的文本进行编辑修改。 优点是省时省力。 缺点是必须有原文稿,最后还要人工进行核对编辑。
网络下载 (1)百度 (2) CNKI
文本的可视化
思维导图
思维导图的概念
常用的思维导图软件
绘制思维导图的原则
思维导图的教学应用
MindMaster软件的基本操作
词云
词云的概念
词云图的制作软件
词云图的教育应用