仔細看了一下 tts 資料... 還有一些 normalization 要做 然後也是要搭配 misq 資料才比較有用