## NeuTTS Air:设备端、逼真语音AI Neuphonic的NeuTTS Air是一款突破性的文本转语音(TTS)模型,将最先进的语音AI直接带到您的设备上——手机、笔记本电脑,甚至树莓派——无需依赖网络API。它基于0.5B LLM构建,提供令人惊叹的自然语音、实时性能以及内置安全功能,如水印。 主要特性包括:在同等尺寸下最佳的逼真度,仅需3秒的音频即可实现即时语音克隆,并通过GGML格式针对设备端使用进行优化。它支持英语,利用神经音频编解码器(NeuCodec)实现低比特率下的高质量音频,并处理约30秒的音频,具有2048 token的上下文窗口。 NeuTTS Air可通过HuggingFace获得,需要安装依赖项,如`espeak`,以及可选的`llama-cpp-python`或`onnxruntime`以获得最佳性能。该项目强调负责任的使用,并提供清晰的指南,用于准备用于克隆的参考音频和最大限度地减少延迟。