导图社区 人工智能训练师 高级
人工智能训练师,此脑图涵盖了TTS和ASR的核心技术,还扩展到了人工智能训练师在文本生成、分类和意图识别等高级领域所需的知识和技能。通过这份思维导图,读者可以全面了解到人工智能训练在语音合成和语音识别领域的先进技术和应用,并为其在相关领域的研究和实践提供有价值的参考。一起了解吧!
《Linux就该这么学(第2版)》是一本值得推荐的Linux入门教程,它内容丰富、实用性强、易于理解,并且提供了丰富的配套资源,非常适合想要学习Linux技术的读者使用。
这是一篇关于智能网联车安全员(初级)的思维导图,主要内容包括:第4章 平行驾驶线上安全守护,第3章 高精地图lmap,第2章 自动驾驶原理与传感器概述,第1章 自动驾驶与智能网联车概览。从自动驾驶的概述和发展历程入手,介绍了NHTSA和SAE等组织在自动驾驶领域的作用。在高精地图部分,内容详细介绍了高精地图的作用、生产过程、交付标准及其在自动驾驶中的关键应用,如辅助环境感知、路径规划等。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
人工智能训练师 高级
智能语音分享-语音合成TTS
1、TTS基础知识点
从文本到语音
应用场景
电子邮件阅读、IVR系统的语音提示、导航、有声音读物等
2、TTS流程
3、SSML语音合成标记语言的介绍
W3C语音接口框架的一部分
使用SSML标签
声音
语速
音量
采样率
语调
背景音
分句
分词
发音
数字/字母/符号/读法
停顿
智能语音分享-语音识别ASR
1、ASR基础知识点
人机对话
C端应用
智能手机
可穿戴设备
智能家电
智能音箱
导航系统
智能机器人
B端应用
在线客服
呼叫中心
口语评测
电子病历
业务办理
安防系统
旅游
自动语音识别
将声音转换成文字
两部分
声学模型
声学现象
声学单元
语言模型
基于最大概率输出,两者联系:词典
评价指标(一场考试)
1、语音测试集(语音+答案)
老师在出试卷100道单选题
2、语音识别结果
ASR模型就是考生,答题
3、计算识别字准率
对答案得出考生考试分数
业界唯一的评价标准就是测试内容的字准率
CER中文
WER英文
不含标点
插入错误
删除错误
替换错误
2、ASR流程
建立测试集
1-2小时语音数据
摸底测试
错误分析和目标评估
字准率不足85%
模型优化
热词/语言模型/声学模型优化三种
测试集验证
周期长,可分批次迭代优化
3、ASR模型优化
语音特点
听语音
标注是否正确
对答案
识别错误类型
看识别
4、常见问题解答
方言模型
从底层的词典建设开始
文本生成的原理与应用
1、了解什么是文本生成
指预测句子中的下一个单词传达信息
一般是怎么做的
概率统计
无脑黑盒
有迹可循
理解常识
2、文本生成常见的任务有哪些
机器翻译
文本摘要
故事生成
对话生成
多模态生成
3、怎么衡量生成文本内容的好坏
人工
内在评价
外在评价
自动化
一些好玩的例子
4、文本生成未来的方向及现阶段的瓶颈
意图识别和分类算法
1、了解分类和意图识别的背景
算法+数据=模型
2、了解分类任务
二分类
是否
多分类
多标签分类
3、了解意图识别
业务场景
航班预订
电商客服
通用对话
情绪模型
行业模型
通用模型
正向样本
负向样本
4、了解数据标和模型优化
数据优化
更多的数据
质量更高数据
没有噪音数据
训练数据样本平衡
负向样本充足,种类丰富