下载 数据集并解压:确保您可以访问 train 文件夹中的所有音频文件(如.wav)
进行音频和梅尔频谱图预处理: python pre.py <datasets_root> -d {dataset} -n {number} 可传入参数:
-d {dataset} 指定数据集,支持 aidatatang_200zh, magicdata, aishell3, data_aishell, 不传默认为aidatatang_200zh
-n {number} 指定并行数,CPU 11770k + 32GB实测10没有问题