虽然表面上看上去他是在修炼文字转WAV音频