Meta Llama 3 júliusban: Zuckerberg új mesterséges intelligenciamodelljéről mindent tudni kell

Meta's Llama 3 in July All You Need to Know About Zuckerberg's New AI Model
Meta's Llama 3 in July All You Need to Know About Zuckerberg's New AI Model

Meta Llama 3 júliusban: Zuckerberg új mesterséges intelligencia modelljéről – Key Notes:

  • A Mark Zuckerberg vezérigazgató által vezetett Meta bejelentette a Llama 3, egy új nagy nyelvi modell (LLM) képzését.
  • A Llama 3 a Llama 1 és a Llama 2 kiadását követi, és a modellek nyílt forráskódúvá tételére összpontosít.
  • Megjelenési dátum még nincs, de a korábbi ütemtervek alapján a Llama 3 2024 júliusa körül debütálhat.

A Meta Llama 3 háttere

2024 januárjában Mark Zuckerberg, a Meta vezérigazgatója egy Instagram-videóban osztotta meg, hogy a vállalat AI-részlege nemrég kezdte meg a Llama 3 kiképzését. A nagy nyelvi modellek (LLaMa) családjának új generációja a 2023 februárjában megjelent Llama 1 (kezdetben stilizáltan “LLaMA”) és a júliusban megjelent Llama 3 modelleket követi – írja a The Information.

Bár olyan részleteket, mint a modellméretek és a multimodális képességek, még nem hoztak nyilvánosságra, Zuckerberg kijelentette, hogy a Meta tervezi a Llama alapmodellek további nyílt forráskódúvá tételét:

View this post on Instagram

A post shared by Mark Zuckerberg (@zuck)

Google News

Stay on Top with AI News!

Follow our Google News page!

Mikor lesz elérhető a Llama 3?

Bár hivatalos megjelenési dátum nincs, érdemes megjegyezni, hogy a Llama 1 kiképzése három hónapig, a Llama 2 kiképzése pedig hat hónapig tartott.

Ha a modellek következő generációja hasonló ütemtervet követ, akkor a Llama 3 potenciálisan 2024 júliusa körül jelenhet meg. A Meta azonban több időt szánhat a finomhangolásra és a modellek megfelelő összehangolására.

A generatív mesterséges intelligencia modellekhez való hozzáférés növelése nem csak a vállalkozások, startupok és hobbisták számára nyújt lehetőséget.

Ahogy a nyílt forráskódú modellek egyre nagyobb teljesítményűvé válnak, kulcsfontosságú, hogy csökkentsük a rosszindulatú szereplők általi rosszindulatú felhasználás kockázatát.

Bejelentő videójában Zuckerberg megismételte a Meta elkötelezettségét a modellek felelősségteljes és biztonságos képzése mellett.

A Llama 3 nyílt forráskódú lesz?

Míg a Meta a Llama 1 modellekhez való hozzáférést kutatóintézetek számára biztosította nem kereskedelmi célú felhasználásra, eseti alapon, a Llama 2 kódját és a modellek súlyait nyílt licenc alatt adta ki, amely lehetővé teszi a kereskedelmi célú felhasználást a 700 millió havi aktív felhasználónál kevesebbel rendelkező szervezetek számára.

Bár vita folyik arról, hogy a Llama 2 licenc megfelel-e a “nyílt forráskód” szigorú technikai definíciójának, általánosságban mégis így hivatkoznak rá.

Semmi nem utal arra, hogy a Llama 3 másképp kerülne kiadásra.

A Llama 3 multimodális lesz?

Llama 3 concept
Llama 3 koncepció

A mesterséges intelligencia egyik feltörekvő trendje a multimodális modellek, amelyek különböző adatformátumokat vagy modalitásokat képesek megérteni és működtetni.

Ahelyett, hogy külön modelleket hoznánk létre szöveghez, kódhoz, hanghoz, képhez vagy videóhoz, az új, legmodernebb modellek, mint például a Google Gemini és az OpenAI GPT-4V, valamint a nyílt forráskódú modellek, mint például a LLaVa vagy a Qwen-VL, zökkenőmentesen tudnak váltani a számítógépes látás és a természetes nyelvi feldolgozási feladatok között.

Bár Zuckerberg megerősítette, hogy a Llama 3, akárcsak a Llama 2, kódgeneráló képességekkel fog rendelkezni, más multimodális képességeket nem említett kifejezetten.

A Llama 3 bejelentő videójában Zuckerberg azonban arról beszélt, hogyan képzeli el a mesterséges intelligencia és a Metaverse kereszteződését, utalva arra, hogy a Meta tervei között szerepel a Llama modellekkel kapcsolatban a vizuális és hangadatok integrálása a szöveges és kódadatok mellett, ami összhangban van az AGI elérésére irányuló céljukkal.

Milyen lesz a Llama 3 a Llama 2-höz képest?

Zuckerberg jelentős beruházásokat jelentett be a képzési infrastruktúrába is. A Meta célja, hogy 2024 végére körülbelül 350 000 NVIDIA H100 GPU-val rendelkezzen, így a teljes rendelkezésre álló számítási erőforrásuk elérheti a következő szintet

“600.000 H100 egyenértékű számítási kapacitás”

beleértve a már meglévő GPU-kat is.

Jelenleg csak a Microsoft rendelkezik hasonló számítási teljesítmény-készlettel. Ezért joggal várható, hogy a Llama 3 jelentős teljesítménynövekedést kínál majd a Llama 2 modellekhez képest, még akkor is, ha a méretek hasonlóak.

Amint azt a Deepmind 2022 márciusában megjelent tanulmánya is sugallja, a kisebb modellek több adaton történő betanítása jobb teljesítményt eredményez, mint a nagyobb modellek kevesebb adaton történő betanítása.

Bár a Llama 2 ugyanolyan méretekben állt rendelkezésre, mint a Llama 1, 40%-kal több adaton lett előtanítva.

Bár a Llama 3 modellek méreteit még nem jelentették be, valószínű, hogy a korábbi generációkhoz hasonlóan a 7-70 milliárd paraméteres modelleken belül tovább növelik majd a teljesítményt.

A Meta közelmúltbeli infrastrukturális beruházásai minden bizonnyal robusztusabb előképzést tesznek majd lehetővé bármilyen méretű modellek számára. Emellett a Llama 2 megduplázta a Llama 1 kontextushosszát, ami azt jelenti, hogy kétszer annyi tokenre “emlékszik” a következtetés során.

Definíciók:

  • LLama 3: A Meta nagyméretű nyelvi modellcsaládjának harmadik iterációja, amely a fejlett mesterséges intelligencia képességekre és a lehetséges multimodális alkalmazásokra összpontosít.
  • Meta: A Facebook, az Instagram és a WhatsApp anyavállalata, amely arra összpontosít, hogy a technológia segítségével összehozza az embereket, és vezető szerepet tölt be az AI területén történő innovációban.
  • GPU (grafikus feldolgozó egység): Speciális elektronikus áramkör, amelyet a memória gyors manipulálására és módosítására terveztek, hogy felgyorsítsa a képek és számítások létrehozását a megjelenítő eszközre történő kimenetre szánt képkockapufferben.

Gyakran ismételt kérdések:

  1. Mi az a Meta’s Llama 3?
    A Llama 3 a Meta által kifejlesztett legújabb nagyméretű nyelvi modell, amely várhatóan fejlett képességeivel a mesterséges intelligencia határait feszegeti.
  2. Mikor jelenik meg a Llama 3?
    Bár nincs meghatározott megjelenési dátum, a Meta időbeosztása szerint 2024 júliusa körül debütálhat.
  3. A Llama 3 nyílt forráskódú lesz?
    A Meta nyílt licencek iránti elkötelezettsége alapján a Llama 3 várhatóan nyílt forráskódú modellt követ majd.
  4. Milyen új funkciókat várhatunk a Llama 3-ban?
    A Llama 3 várhatóan multimodális képességekkel fog rendelkezni, ami fokozza a vizuális és hangadatokkal való integrációt.
  5. Hogyan hasonlít a Llama 3 az elődeihez?
    A jelentős infrastrukturális beruházásoknak köszönhetően a Llama 3 várhatóan jelentős teljesítménynövekedést kínál majd a Llama 2-höz képest.

Juhasz "the Mage" Gabor

As a fervent tech and AI enthusiast, I blend my passion for the latest in technology with a flair for writing, illuminating the fascinating world of Artificial Intelligence and its endless possibilities.

Introducing EMO Emote Portrait Alive - Portraits to Singing Sensations with Alibaba's AI Source
Previous Story

Bemutatkozik az EMO: Emote Portrait Alive – Portrék éneklő szenzációkká válnak az Alibaba AI segítségével

Next Story

Az AI eredete: John McCarthy, a mesterséges intelligencia mögött álló látnok

Latest from Blog

Go toTop