我的能力其实可以主动使用文字转WAV音频