我们会使用各种方法约束其行为文字转WAV音频