数か月前に OpenAI が行った、人間そっくりの音声で世界を震撼させた GPT-4o の音声デモを覚えていますか? しばらくの間、AI と話していることを忘れさせ、映画「her/世界でひとつの彼女」のスカーレット・ヨハンソン演じる AI キャラクターを多くの人に思い出させた (そして、それに対する批判も受けた) デモです。
OpenAI は、X で共有したように、ついに少数の ChatGPT Plus ユーザーに対してアルファ版の展開を開始した。当初、同社は 6 月に展開を開始する予定だったが、安全上の理由と「[OpenAI の] 開始基準に達する」ことを確実にするために延期された。そのため、同社は外部のレッド チーム チームとともにモデルの改善に取り組んでおり、特定のコンテンツを検出して拒否できるようにしていた。
ChatGPT Plus ユーザーの小グループに高度な音声モードを展開し始めています。高度な音声モードは、より自然なリアルタイムの会話を提供し、いつでも中断でき、感情を感知して反応します。pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 2024 年 7 月 30 日
現在、一部の有料ユーザーは ChatGPT アプリでモデルにアクセスし始めていますが、現時点ではアルファ版へのアクセスは限定的です。同社によると、アクセスを徐々に拡大し、秋にはすべての有料ユーザーに提供する予定とのことです。
高度な音声モードへのアクセスをリクエストする方法はないようです。アルファ版にアクセスできる少数のユーザーのリストに載っている場合は、音声モードを試すための手順が記載されたメールと、ChatGPT アプリの通知が届きます。
高度な音声モードでは、Juniper、Amber、Cove、Breeze の 4 つのプリセット音声でのみ話すことができます。注目すべきは、OpenAI が Sky を削除したことです。Sky は、春のイベントでデモが公開された直後にスカーレット ヨハンソンに似た声で、ヨハンソンは会社に手紙を送って、その声がどのように作られたのかを尋ねました (OpenAI はこれに対して回答しなかったようです)。Sky はまだラインナップに含まれていないようです。
ChatGPT-4o は、ユーザーのプライバシーを保護するために、プリセットの音声以外の音声で出力することはできません。また、暴力的または著作権で保護されたコンテンツのリクエストをブロックするためのガードレールも用意されています。
ChatGPT アプリで高度な音声モードにアクセスできる場合は、ぜひ試してみてください。視覚機能も取得するまではデモで紹介されているすべての機能を実現することはできませんが、アクセスできるユーザーが共有したいくつかのビデオによると、それでもかなり印象的だそうです。
コメントを残す