Last Updated on szeptember 24, 2024 7:32 du. by Laszlo Szabo / NowadAIs | Published on szeptember 24, 2024 by Laszlo Szabo / NowadAIs
OpenAI bemutatja a ChatGPT fejlett hang módját, elkerüli a Scarlett Johansson vitát – kulcsfontosságú megjegyzések
- Az OpenAI elindítja az “Advanced Voice Mode” (AVM) funkciót a fizető ChatGPT felhasználók számára, kezdve a Plus és Teams szintekkel.
- Az AVM 5 új, természet által inspirált hangot és továbbfejlesztett hangfelismerési képességeket vezet be.
- Az OpenAI-nak el kellett távolítania egy korábbi hangopciót, a “Sky”-t, mivel jogi vitába keveredett Scarlett Johanssonnal a hangjához való hasonlóság miatt.
A ChatGPT fejlett hangmódot kap a fizető ügyfelek számára
Az Advanced Voice a hét folyamán a ChatGPT alkalmazásban minden Plus és Team felhasználó számára elérhetővé válik.
Amíg türelmesen vártál, addig hozzáadtuk az Egyéni utasításokat, a memóriát, öt új hangot és a javított ékezeteket.
A “Bocsánat, hogy késtem” több mint 50 nyelven is kimondható. pic.twitter.com/APOqqhXtDg
– OpenAI (@OpenAI) szeptember 24, 2024
Kedden az OpenAI kijelentette, hogy a ChatGPT fizető ügyfeleinek nagyobb csoportja számára elindítja az Advanced Voice Mode-ot (AVM ). Ez az új hangfunkció, amely javítja a ChatGPT-vel való társalgási élményt, először a ChatGPT ügyfeleinek Plus és Teams szintjei számára lesz elérhető. Az Enterprise és az Edu ügyfelek a jövő héttől kapnak hozzáférést ehhez a funkcióhoz.
Az AVM újratervezést kap
Az AVM a kiadás részeként újratervezésen megy keresztül. A funkció megjelenítésében mostantól egy kék animált gömb látható a korábbi animált fekete pontok helyett, amelyeket az OpenAI májusban, a technológia közzététele során mutatott be.
Új hangopciók a ChatGPT számára
A ChatGPT öt további hangot vezet be, amelyekkel a felhasználók kísérletezhetnek: Arbor, Maple, Sol, Spruce és Vale. Ezzel a ChatGPT összes hangjainak száma kilencre emelkedik, ami majdnem megegyezik a Google Gemini Live-ban elérhető hangok számával. Ezek az új hangok, nevezetesen a Breeze, Juniper, Cove és Ember, mind a természetből merítenek ihletet, és illeszkednek az AVM általános céljához, hogy fokozzák a ChatGPT használatának természetességét.
Scarlett Johansson vita és az “Ég” hang eltávolítása
Az egyik olyan hang, amely nem szerepel ebben a felállásban, a Sky, az OpenAI által a tavaszi frissítésben megjelenített hang. Ez jogi problémát okozott, amikor Scarlett Johansson, aki a “Her” című filmben egy AI-rendszert alakított, azt állította, hogy Sky hangja túlságosan hasonlít az ő hangjára. Ennek eredményeképpen az OpenAI gyorsan eltávolította Sky hangját, és kijelentette, hogy nem állt szándékukban, hogy az hasonlítson Johansson hangjára, annak ellenére, hogy a munkatársak több tagja is utalt a filmre a tweetjeiben.
A multimodális képességek még váratnak magukra
A ChatGPT legújabb kiadása nem tartalmazza azt a videó- és képernyőmegosztási funkciót, amelyet az OpenAI a négy hónappal ezelőtti tavaszi frissítésben vezetett be. Ezt a funkciót úgy tervezték, hogy a GPT-4o egyszerre tudja feldolgozni a vizuális és a hallható adatokat. A bemutató során az OpenAI csapatának egyik tagja bemutatta, hogy a ChatGPT-nek valós idejű kérdéseket lehet feltenni a papírra írt matematikával vagy a számítógép képernyőjén megjelenő kóddal kapcsolatban. Jelenleg azonban nincs ütemterv arra vonatkozóan, hogy ezek a multimodális képességek mikor lesznek elérhetőek.
Az AVM fejlesztései és korlátai
Az OpenAI szerint a korlátozott alfa-teszt első kiadása után az AVM-en néhány fejlesztést hajtottak végre. A ChatGPT hangfunkciója állítólag jobban érti az akcentusokat, és a vállalat állítása szerint a beszélgetések mostantól zökkenőmentesebbek és hatékonyabbak. Az AVM használata során a tesztelés során alkalmanként működési zavarokkal találkoztunk, de a vállalat biztosította, hogy ezt már orvosolták.
Kibővített testreszabási lehetőségek az AVM számára
Az OpenAI emellett az AVM testreszabási lehetőségeinek körét is bővíti, mint például az Egyéni utasítások, amely lehetővé teszi a felhasználók számára, hogy személyre szabják a ChatGPT-vel való interakcióikat, valamint a Memória, amely lehetővé teszi a ChatGPT számára, hogy a beszélgetéseket későbbi hivatkozás céljából megőrizze.
Az AVM korlátozott regionális elérhetősége
Az OpenAI képviselője szerint az AVM jelenleg nem érhető el különböző régiókban, például az EU-ban, az Egyesült Királyságban, Svájcban, Izlandon, Norvégiában és Liechtensteinben.
Leírások:
Advanced Voice Mode (AVM): Ez egy új hangfunkció az OpenAI-tól, amely javítja a ChatGPT-vel való társalgási élményt. Lehetővé teszi a felhasználók számára, hogy a szöveges interakciók helyett természetes hangutasításokkal lépjenek kapcsolatba az AI asszisztenssel.
Hangok: A ChatGPT 5 további hangot vezet be, amelyekkel a felhasználók kísérletezhetnek: Arbor, Maple, Sol, Spruce és Vale. Ezek az új hangok a már meglévőkkel (Breeze, Juniper, Cove és Ember) együtt mind a természet ihlette hangok, amelyek célja, hogy a hanginterakciókat még élethűbbé tegyék.
Scarlett Johansson ellentmondás: Az egyik korábbi hangopciót, az “Ég”-et az OpenAI-nak jogi probléma miatt el kellett távolítania. Scarlett Johansson színésznő, aki a “Her” című filmben egy AI-rendszert alakított, azt állította, hogy a hang túlságosan hasonlít a saját hangjára. Az OpenAI kijelentette, hogy nem állt szándékukban, hogy a hang hasonlítson Johanssonéra.
Multimodális képességek: A ChatGPT legújabb frissítése nem tartalmazza a korábban bejelentett videó- és képernyőmegosztási funkciókat. Ezeket úgy tervezték, hogy a mesterséges intelligencia egyszerre tudjon vizuális és hallható adatokat feldolgozni, lehetővé téve a felhasználók számára, hogy kérdéseket tegyenek fel az írott matematikával vagy a megjelenített kóddal kapcsolatban. Az azonban még mindig nem világos, hogy mikor lesznek ezek a képességek elérhetőek.
Testreszabási lehetőségek: Az OpenAI bővíti az AVM testreszabási lehetőségeit, mint például az “Egyéni utasítások” (személyre szabott felhasználói interakciók) és a “Memória” (a beszélgetések előzményeinek megőrzése).
Regionális elérhetőség: Az AVM jelenleg nem érhető el bizonyos régiókban, köztük az EU-ban, az Egyesült Királyságban, Svájcban, Izlandon, Norvégiában és Liechtensteinben.
Gyakran ismételt kérdések:
- Mi az a “Fejlett hangmód” (AVM) a ChatGPT-ben?
Az AVM az OpenAI új hangfunkciója, amely javítja a ChatGPT-vel való társalgási élményt. Lehetővé teszi a felhasználók számára, hogy természetes hangparancsok használatával lépjenek kapcsolatba a mesterséges intelligencia asszisztenssel, nem pedig csak szöveges interakciókkal. - Milyen új hangopciókat vezetett be a ChatGPT?
A ChatGPT 5 új hangot vezet be, amelyekkel a felhasználók kísérletezhetnek: Arbor, Maple, Sol, Spruce és Vale. Ezeket az új hangokat, a már meglévőkkel együtt, mind a természet ihlette, hogy a hanginterakciókat még élethűbbé tegyék. - Miért távolította el az OpenAI az “Ég” hangopciót?
Az “Ég” hangopciót jogi okok miatt kellett eltávolítani. Scarlett Johansson színésznő, aki a “Her” című filmben egy AI rendszert alakított, azt állította, hogy a hang túlságosan hasonlít a saját hangjára. Az OpenAI kijelentette, hogy nem állt szándékukban, hogy a hang hasonlítson Johanssonéra. - Mikor lesznek elérhetőek a ChatGPT multimodális képességei?
A ChatGPT legutóbbi frissítése nem tartalmazza a korábban bejelentett videó- és képernyőmegosztási funkciókat, amelyek célja az volt, hogy a mesterséges intelligencia egyszerre tudjon vizuális és hallható adatokat feldolgozni. Az azonban még mindig nem világos, hogy mikor lesznek ezek a képességek elérhetőek. - Hol érhető el jelenleg a “fejlett hangmód”?
Az OpenAI szerint az AVM jelenleg nem érhető el bizonyos régiókban, köztük az EU-ban, az Egyesült Királyságban, Svájcban, Izlandon, Norvégiában és Liechtensteinben.