- docs
-
egs
-
build_your_own_voice
- 构建一种新语言合成模型的一般流程
-
fls_blizz ard2017
- 以Blizzard数据集构建一个语音合成模型,作为benchmark
-
hybrid_synthesis
- 混合语言合成模型,目前还在开发之中,有很多bug
-
mandarin_voice
-
conf
- logging_config.conf
-
scripts
-
prepare_config_files.sh
- 准备当前流程的 时域配置参数文件
- 准备当前流程的 声学配置参数文件
-
prepare_config_files_for_synthesis.sh
- 准备当前流程的 语音合成时 时域配置参数文件
- 准备当前流程的 语音合成时 时域配置参数文件
-
prepare_labels_from_txt.sh
- 将文本转换为lab文件
- 1. 从txt文本使用前端工具生成scheme文件
- 2. 从scheme文件生成 utt文件
- 3. 将 festival utt转换为lab文件
- 4. state_align或phone_align,规范化lab
-
remove_intermediate_files.sh
- 移除中间产生的文件
-
run_phone_aligner.sh
- 执行音素对齐(phone align)
- run_state_aligner.sh
- submit.sh
- test_nan.sh
- 01_setup.sh
- 02_prepare_labels.sh
- 03_prepare_acoustic_features.sh
- 04_prepare_conf_files.sh
- 05_train_duration_model.sh
- 06_train_acoustic_model.sh
- 07_run_merlin.sh
- run_demo.sh
- run_mandarin_voice.sh
-
nick_hurricane
- Nick语料库的语音合成方法,但是数据没有公开
-
slt_arctic
- CMU指导的均衡语音库ARCTIC合成的语音流程
-
speaker_adaptation
-
发音人适应模型训练流程,
- 1. 构建一个多发音人的平均语音模型AVM
- 2. 为需要适应的发音人构建一个单独的模型
- 3. 将平均模型AVM适应到适应者
-
voice_conversion
- 将源发声着的发音特色转移到目标发音者,使用CMU ARCTIC
数据集(包含了7个发音人,每个人都念相同的文本)
-
misc
-
questions 问题集
-
questions-mandarin.hed
- 普通话标准问题集
-
questions-radio_dnn_416.hed
- 普通话问题集,包含416条问题
-
questions-unilex_dnn_600.hed
- 普通话问题集,包含600条问题
-
recipes
- glstm
- dnn
- general_config
- lstm
- lstm_variants
- MGE
- acoustic_demo.conf
- duration_demo.conf
-
scripts
- alignment
- frontend
- hybrid_voice
- vocoder
- voice_conversion
- src
- test
- tools
- 目录结构都与mandarin_voice一致,流程化不同的语音合成步骤