所以才用了替代的词文字转WAV音频