Initial investigation of an encoder-decoder end-to-end TTS framework using marginalization of monotonic hard latent alignments
Authors: Yusuke Yasuda, Xin Wang, Junichi Yamagishi
Oral Session 6: Sequence to sequence model, SSW10, 2019
System | Natural | Analyisis by synthesis | Self-attention Tacotron | Tacotron | SSNT (proposed) | |
---|---|---|---|---|---|---|
1: 空中へ飛びだしかけた。 | ||||||
2: プレートは二年まえのままだった。 | ||||||
3: 依然として立ちつくしている。 | ||||||
4: 踊りにいきませんか。 | ||||||
5: 取り寄せはできますか。 | ||||||
6: 課題は山積している。 | ||||||