概要
NVIDIA PersonaPlex-7Bは、ユーザーの話を「聞きながら同時に話す」完全な双方向会話(フルデュプレックス)を実現した、オープンソースの音声AIモデル。従来の音声認識や合成のステップを単一モデルに統合することで、人間のような自然な割り込み、相槌、超低遅延な応答が可能に。70億(7B)パラメータと軽量ながら、テキストで役割(ペルソナ)を、音声サンプルで声質を自由に制御。商用利用可能(NVIDIA Open Model License)。
ソース: Hugging Face (nvidia/personaplex-7b-v1) | GitHub (NVIDIA/personaplex)
ソース: Hugging Face (nvidia/personaplex-7b-v1) | GitHub (NVIDIA/personaplex)
7B
パラメータ数(軽量)
Full Duplex
聞きながら話す
単一モデル
ASR/LLM/TTS統合
商用OK
NVIDIA Open License