Last Updated on September 24, 2024 7:29 pm by Laszlo Szabo / NowadAIs | Published on September 24, 2024 by Laszlo Szabo / NowadAIs
OpenAI stellt den erweiterten Sprachmodus für ChatGPT vor und vermeidet die Kontroverse um Scarlett Johansson
- OpenAI führt die Funktion “Advanced Voice Mode” (AVM) für zahlende ChatGPT-Benutzer ein, beginnend mit den Stufen Plus und Teams.
- AVM führt 5 neue, von der Natur inspirierte Stimmen und verbesserte Spracherkennungsfunktionen ein.
- OpenAI musste eine frühere Stimmoption, “Sky”, aufgrund eines Rechtsstreits mit Scarlett Johansson wegen der Ähnlichkeit mit ihrer Stimme entfernen.
ChatGPT erhält einen erweiterten Sprachmodus für zahlende Kunden
Advanced Voice wird im Laufe der Woche für alle Plus- und Team-Benutzer in der ChatGPT-App eingeführt.
Während Sie geduldig gewartet haben, haben wir benutzerdefinierte Anweisungen, Speicher, fünf neue Stimmen und verbesserte Akzente hinzugefügt.
Sie kann auch “Entschuldigung, ich bin zu spät” in über 50 Sprachen sagen. pic.twitter.com/APOqqhXtDg
– OpenAI (@OpenAI) September 24, 2024
Am Dienstag erklärte OpenAI, dass es den Advanced Voice Mode (AVM) für eine größere Gruppe von zahlenden Kunden von ChatGPT einführen wird. Dieses neue Audio-Feature, das die Konversationserfahrung mit ChatGPT verbessert, wird zuerst für die Plus- und Teams-Stufen der ChatGPT-Kunden verfügbar sein. Enterprise und Edu Kunden werden ab nächster Woche Zugang zu dieser Funktion erhalten.
AVM erhält ein Redesign
AVM wird im Rahmen der Veröffentlichung neu gestaltet. Die Präsentation der Funktion zeigt nun eine blaue animierte Kugel anstelle der früheren animierten schwarzen Punkte, die von OpenAI im Mai bei der Veröffentlichung der Technologie vorgestellt wurden.
Neue Sprachoptionen für ChatGPT
ChatGPT führt fünf zusätzliche Stimmen ein, mit denen die Benutzer experimentieren können: Arbor, Maple, Sol, Spruce, und Vale. Damit steigt die Gesamtzahl der Stimmen bei ChatGPT auf neun, was fast der Anzahl der Stimmen entspricht, die bei Googles Gemini Live verfügbar sind. Diese neuen Stimmen, nämlich Breeze, Juniper, Cove und Ember, sind alle von der Natur inspiriert und passen zu dem allgemeinen Ziel von AVM, die Natürlichkeit der Nutzung von ChatGPT zu verbessern.
Scarlett Johansson Kontroverse und Entfernung der “Sky”-Stimme
Eine der Stimmen, die nicht in diesem Lineup enthalten ist, ist Sky, die Stimme, die von OpenAI in ihrem Frühjahrs-Update angezeigt wurde. Dies führte zu einem Rechtsstreit, als Scarlett Johansson, die in dem Film “Her” ein KI-System darstellte, behauptete, dass die Stimme von Sky ihrer eigenen zu ähnlich klang. Daraufhin entfernte OpenAI schnell die Stimme von Sky und erklärte, dass es nicht beabsichtigt war, dass sie Johanssons Stimme ähnelt, obwohl mehrere Mitarbeiter damals in ihren Tweets auf den Film Bezug nahmen.
Multimodale Fähigkeiten stehen noch aus
Die neueste Version von ChatGPT enthält nicht die Video- und Bildschirmfreigabefunktion, die von OpenAI in ihrem Frühjahrsupdate vor vier Monaten eingeführt wurde. Diese Funktion sollte es GPT-4o ermöglichen, sowohl visuelle als auch akustische Daten gleichzeitig zu verarbeiten. Während der Demonstration zeigte ein Mitglied des OpenAI-Teams die Möglichkeit, ChatGPT in Echtzeit Fragen zu auf Papier geschriebener Mathematik oder auf einem Computerbildschirm angezeigtem Code zu stellen. Allerdings gibt es derzeit keinen Zeitplan, wann diese multimodalen Fähigkeiten verfügbar sein werden.
Verbesserungen und Beschränkungen von AVM
Laut OpenAI wurden an AVM nach der anfänglichen Veröffentlichung des eingeschränkten Alpha-Tests einige Verbesserungen vorgenommen. Die Sprachfunktion von ChatGPT ist Berichten zufolge besser in der Lage, Akzente zu verstehen, und das Unternehmen behauptet, dass Unterhaltungen jetzt nahtloser und effizienter verlaufen. Bei der Verwendung von AVM in unseren Tests sind wir auf gelegentliche Fehlfunktionen gestoßen, aber das Unternehmen versichert, dass diese Probleme behoben wurden.
Erweiterte Anpassungsoptionen für AVM
Darüber hinaus erweitert OpenAI auch den Umfang der Anpassungsoptionen von AVM, wie z. B. die benutzerdefinierten Anweisungen, die es den Benutzern ermöglichen, ihre Interaktionen mit ChatGPT zu personalisieren, und den Speicher, der es ChatGPT ermöglicht, Unterhaltungen zur späteren Bezugnahme zu speichern.
Begrenzte regionale Verfügbarkeit für AVM
Laut einem Vertreter von OpenAI ist die AVM derzeit in verschiedenen Regionen wie der EU, Großbritannien, der Schweiz, Island, Norwegen und Liechtenstein nicht verfügbar.
Beschreibungen:
Advanced Voice Mode (AVM): Dies ist eine neue Audiofunktion von OpenAI, die die Konversationserfahrung mit ChatGPT verbessert. Sie ermöglicht es den Nutzern, mit dem KI-Assistenten über natürliche Sprachbefehle zu interagieren, anstatt nur textbasiert.
Stimmen: ChatGPT führt 5 zusätzliche Stimmen ein, mit denen Nutzer experimentieren können – Arbor, Maple, Sol, Spruce und Vale. Diese neuen Stimmen, zusammen mit den bestehenden (Breeze, Juniper, Cove und Ember), sind alle von der Natur inspiriert und sollen die Sprachinteraktionen lebensechter machen.
Kontroverse um Scarlett Johansson: Eine der früheren Sprachoptionen, “Sky”, musste von OpenAI aufgrund eines rechtlichen Problems entfernt werden. Die Schauspielerin Scarlett Johansson, die in dem Film “Her” ein KI-System darstellte, behauptete, die Stimme klinge zu ähnlich wie ihre eigene. OpenAI erklärte, es sei nicht beabsichtigt gewesen, dass die Stimme der von Johansson ähnelt.
Multimodale Fähigkeiten: Das neueste ChatGPT-Update enthält nicht die zuvor angekündigten Video- und Bildschirmfreigabefunktionen. Diese sollten es der KI ermöglichen, sowohl visuelle als auch akustische Daten gleichzeitig zu verarbeiten, so dass Benutzer Fragen zu geschriebener Mathematik oder angezeigtem Code stellen können. Es ist jedoch noch unklar, wann diese Funktionen verfügbar sein werden.
Anpassungsmöglichkeiten: OpenAI erweitert die Anpassungsoptionen für AVM, wie z. B. “Custom Instructions” (personalisierte Benutzerinteraktionen) und “Memory” (Speicherung des Gesprächsverlaufs).
Regionale Verfügbarkeit: AVM ist derzeit in bestimmten Regionen nicht verfügbar, unter anderem in der EU, Großbritannien, der Schweiz, Island, Norwegen und Liechtenstein.
Häufig gestellte Fragen:
- Was ist der “Erweiterte Sprachmodus” (AVM) in ChatGPT?
AVM ist eine neue Audiofunktion von OpenAI, die das Gesprächserlebnis mit ChatGPT verbessert. Es ermöglicht den Nutzern, mit dem KI-Assistenten über natürliche Sprachbefehle zu interagieren, anstatt nur textbasiert. - Welche neuen Sprachoptionen hat ChatGPT eingeführt?
ChatGPT führt 5 neue Stimmen ein, mit denen die Nutzer experimentieren können: Arbor, Maple, Sol, Spruce, und Vale. Diese neuen Stimmen, zusammen mit den bestehenden, sind alle von der Natur inspiriert, um die Sprachinteraktionen lebensechter zu machen. - Warum hat OpenAI die Stimmoption “Himmel” entfernt?
Die “Sky”-Stimmenoption musste aufgrund eines rechtlichen Problems entfernt werden. Die Schauspielerin Scarlett Johansson, die in dem Film “Her” ein KI-System darstellte, behauptete, die Stimme klinge zu ähnlich wie ihre eigene. OpenAI erklärte, es sei nicht beabsichtigt gewesen, dass die Stimme der von Johansson ähnelt. - Wann werden die multimodalen Fähigkeiten von ChatGPT verfügbar sein?
Das jüngste ChatGPT-Update enthält nicht die bereits angekündigten Video- und Bildschirmfreigabefunktionen, die es der KI ermöglichen sollten, visuelle und akustische Daten gleichzeitig zu verarbeiten. Es ist jedoch noch unklar, wann diese Funktionen verfügbar sein werden. - Wo ist der “Advanced Voice Mode” derzeit verfügbar?
Laut OpenAI ist der AVM derzeit in bestimmten Regionen nicht verfügbar, darunter in der EU, Großbritannien, der Schweiz, Island, Norwegen und Liechtenstein.