questions 问题集
questions-mandarin.hed
普通话标准问题集
questions-radio_dnn_416.hed
普通话问题集,包含416条问题
questions-unilex_dnn_600.hed
普通话问题集,包含600条问题
recipes
blstm
blstm.conf
hybrid_blstm.conf
hybrid_blstm_no_dynamic.conf
hybrid_blstm_WORLD.conf
hybrid_blstm_WORLD_no_dynamic.conf
dnn
feed_forward_dnn.conf
feed_forward_dnn_ossian.conf
feed_forward_dnn_ossian_DUR.conf
feed_forward_dnn_WORLD.conf
feed_forward_dnn_WORLD_bc16.conf
general_config
logging_config.conf
lstm
deep_lstm.conf
deep_lstm_WORLD.conf
hybrid_lstm.conf
hybrid_lstm_WORLD.conf
lstm_variants
deep_gru.conf
deep_lstm.conf
deep_lstm_nfg.conf
deep_lstm_nig.conf
deep_lstm_nog.conf
deep_lstm_nph.conf
deep_sgru.conf
MGE
feed_forward_dnn_cm.conf
feed_forward_dnn_cm_MGE.conf
run_dnn_cm.py
run_mge_dnn.py
acoustic_demo.conf
duration_demo.conf
scripts
alignment
phone_align
run_aligner.sh
使用festvox工具clustergen强制对齐
将festival utts转换为lab文件
setup.sh
下载CMU的arctic数据集
准备配置文件config.cfg,merlin,festival,前端工具等的目录
state_align
binary_io.py
numpy数组和二进制文件互转
forced_alignment.py
使用HTK工具训练HMM模型以及做对齐
htk_io.py
读写HTK格式的文件
htkmfc.py
读写HTK所使用的声学特征文件
mean_variance_norm.py
规范化数据
prepare_labels_from_txt.sh
将文本转换为lab文件
1. 从txt文本使用前端工具生成scheme文件
2. 从scheme文件生成 utt文件
3. 将 festival utt转换为lab文件
4. state_align或phone_align,规范化lab
run_aligner.sh
执行状态对齐
1. 使用HTK的HVite做强制状态对齐
2. 先使用Festival前端工具准备无时间戳的上下文相关lab文件
setup.sh
下载CMU的arctic数据集
准备配置文件config.cfg,merlin,festival,前端工具等的目录
frontend
festival_utt_to_lab
extra_feats.scm
label.feats
label-full.awk
label-mono.awk
make_labels
utils
genScmFile.py
从文本路径下读取所有文本内容,生成utt文件
normalize_lab_for_merlin.py
根据align 类型规范化lab文件
prepare_txt_done_data_file.py
hybrid_voice
compute_tcoef_features.py
计算tcoef 特征
convert_hts_label_format_to_festival.py
将HTS格式的lab文件转换为festival格式
processHybridInfo.py
vocoder
magphase
extract_features_for_merlin.py
从一批wav文件中抽取低维的声学特征,抽取的特征包括
mag : Mel-scaled Log-Mag
.real : Mel-scaled real
.imag : Mel-scaled imag
.lf0 : Log-F0
straight
copy_synthesis.sh
extract_features_for_merlin.py
使用 straight 抽取特征
raw wav
sp
ap
bapd
f0
lf0
mgc
bap
extract_features_for_merlin.sh
world
copy_synthesis.sh
extract_features_for_merlin.py
使用 world抽取特征
raw wav
sp
ap
bapd
f0
lf0
mgc
bap
extract_features_for_merlin.sh
synthesis.py
使用WORLD,输入merlin格式的特征,合成语音
1. lf0转 f0
2. 过滤mgc
3. mgc转sp
4. bapd转bap
5. 合成wav
world_v2
copy_synthesis.sh
使用WORLD_V2,输入merlin格式的特征,合成语音
1. lf0转 f0
2. 过滤mgc
3. mgc转sp
4. bapd转bap
5. 合成wav
extract_features_for_merlin.py
使用 world抽取特征
raw wav
sp
ap
bapd
f0
lf0
mgc
bap
voice_conversion
binary_io.py
读写numpy存写的二进制文件,载入DTW文件等
align_feats.py
dtw_aligner.py
dtw_aligner_festvox.py
dtw_aligner_festvox_magphase.py
dtw_aligner_magphase.py
transform_f0.py
compute_lf0_stats.py
计算所有 lf0的均值和方差
使用不同的声码器做对齐,用的是DTW(动态时间调整)