不过他真的认为文字转WAV音频