Mi az a Meta's Llama 3?

A Llama 3 a Meta által kifejlesztett legújabb nagyméretű nyelvi modell, amely várhatóan fejlett képességeivel a mesterséges intelligencia határait feszegeti.

Mikor jelenik meg a Llama 3?

Bár nincs meghatározott megjelenési dátum, a Meta időbeosztása szerint 2024 júliusa körül debütálhat.

Milyen új funkciókat várhatunk a Llama 3-ban?

A Llama 3 várhatóan multimodális képességekkel fog rendelkezni, ami fokozza a vizuális és hangadatokkal való integrációt.

Hogyan hasonlít a Llama 3 az elődeihez?

A jelentős infrastrukturális beruházásoknak köszönhetően a Llama 3 várhatóan jelentős teljesítménynövekedést kínál majd a Llama 2-höz képest.

Meta Llama 3 Júliusban: Zuckerberg új MI Modellje

Last Updated on február 29, 2024 9:55 de. by Laszlo Szabo / NowadAIs | Published on február 29, 2024 by Juhasz “the Mage” Gabor

Meta Llama 3 júliusban: Zuckerberg új mesterséges intelligencia modelljéről – Key Notes:

A Mark Zuckerberg vezérigazgató által vezetett Meta bejelentette a Llama 3, egy új nagy nyelvi modell (LLM) képzését.
A Llama 3 a Llama 1 és a Llama 2 kiadását követi, és a modellek nyílt forráskódúvá tételére összpontosít.
Megjelenési dátum még nincs, de a korábbi ütemtervek alapján a Llama 3 2024 júliusa körül debütálhat.

A Meta Llama 3 háttere

2024 januárjában Mark Zuckerberg, a Meta vezérigazgatója egy Instagram-videóban osztotta meg, hogy a vállalat AI-részlege nemrég kezdte meg a Llama 3 kiképzését. A nagy nyelvi modellek (LLaMa) családjának új generációja a 2023 februárjában megjelent Llama 1 (kezdetben stilizáltan “LLaMA”) és a júliusban megjelent Llama 3 modelleket követi – írja a The Information.

Bár olyan részleteket, mint a modellméretek és a multimodális képességek, még nem hoztak nyilvánosságra, Zuckerberg kijelentette, hogy a Meta tervezi a Llama alapmodellek további nyílt forráskódúvá tételét:

View this post on Instagram
A post shared by Mark Zuckerberg (@zuck)

Stay on Top with AI News!

Follow our Google News page!

Mikor lesz elérhető a Llama 3?

Bár hivatalos megjelenési dátum nincs, érdemes megjegyezni, hogy a Llama 1 kiképzése három hónapig, a Llama 2 kiképzése pedig hat hónapig tartott.

Ha a modellek következő generációja hasonló ütemtervet követ, akkor a Llama 3 potenciálisan 2024 júliusa körül jelenhet meg. A Meta azonban több időt szánhat a finomhangolásra és a modellek megfelelő összehangolására.

A generatív mesterséges intelligencia modellekhez való hozzáférés növelése nem csak a vállalkozások, startupok és hobbisták számára nyújt lehetőséget.

Need ROI on Social Media? Create content with AI!
Join 100,000+ businesses in 180+ countries using Ocoya!

Ahogy a nyílt forráskódú modellek egyre nagyobb teljesítményűvé válnak, kulcsfontosságú, hogy csökkentsük a rosszindulatú szereplők általi rosszindulatú felhasználás kockázatát.

Bejelentő videójában Zuckerberg megismételte a Meta elkötelezettségét a modellek felelősségteljes és biztonságos képzése mellett.

A Llama 3 nyílt forráskódú lesz?

Míg a Meta a Llama 1 modellekhez való hozzáférést kutatóintézetek számára biztosította nem kereskedelmi célú felhasználásra, eseti alapon, a Llama 2 kódját és a modellek súlyait nyílt licenc alatt adta ki, amely lehetővé teszi a kereskedelmi célú felhasználást a 700 millió havi aktív felhasználónál kevesebbel rendelkező szervezetek számára.

Bár vita folyik arról, hogy a Llama 2 licenc megfelel-e a “nyílt forráskód” szigorú technikai definíciójának, általánosságban mégis így hivatkoznak rá.

Semmi nem utal arra, hogy a Llama 3 másképp kerülne kiadásra.

A Llama 3 multimodális lesz?

A mesterséges intelligencia egyik feltörekvő trendje a multimodális modellek, amelyek különböző adatformátumokat vagy modalitásokat képesek megérteni és működtetni.

Ahelyett, hogy külön modelleket hoznánk létre szöveghez, kódhoz, hanghoz, képhez vagy videóhoz, az új, legmodernebb modellek, mint például a Google Gemini és az OpenAI GPT-4V, valamint a nyílt forráskódú modellek, mint például a LLaVa vagy a Qwen-VL, zökkenőmentesen tudnak váltani a számítógépes látás és a természetes nyelvi feldolgozási feladatok között.

Bár Zuckerberg megerősítette, hogy a Llama 3, akárcsak a Llama 2, kódgeneráló képességekkel fog rendelkezni, más multimodális képességeket nem említett kifejezetten.

Need ROI on Social Media? Create content with AI!
Join 100,000+ businesses in 180+ countries using Ocoya!

A Llama 3 bejelentő videójában Zuckerberg azonban arról beszélt, hogyan képzeli el a mesterséges intelligencia és a Metaverse kereszteződését, utalva arra, hogy a Meta tervei között szerepel a Llama modellekkel kapcsolatban a vizuális és hangadatok integrálása a szöveges és kódadatok mellett, ami összhangban van az AGI elérésére irányuló céljukkal.

Milyen lesz a Llama 3 a Llama 2-höz képest?

Zuckerberg jelentős beruházásokat jelentett be a képzési infrastruktúrába is. A Meta célja, hogy 2024 végére körülbelül 350 000 NVIDIA H100 GPU-val rendelkezzen, így a teljes rendelkezésre álló számítási erőforrásuk elérheti a következő szintet

“600.000 H100 egyenértékű számítási kapacitás”

beleértve a már meglévő GPU-kat is.

Jelenleg csak a Microsoft rendelkezik hasonló számítási teljesítmény-készlettel. Ezért joggal várható, hogy a Llama 3 jelentős teljesítménynövekedést kínál majd a Llama 2 modellekhez képest, még akkor is, ha a méretek hasonlóak.

Amint azt a Deepmind 2022 márciusában megjelent tanulmánya is sugallja, a kisebb modellek több adaton történő betanítása jobb teljesítményt eredményez, mint a nagyobb modellek kevesebb adaton történő betanítása.

Bár a Llama 2 ugyanolyan méretekben állt rendelkezésre, mint a Llama 1, 40%-kal több adaton lett előtanítva.

Bár a Llama 3 modellek méreteit még nem jelentették be, valószínű, hogy a korábbi generációkhoz hasonlóan a 7-70 milliárd paraméteres modelleken belül tovább növelik majd a teljesítményt.

A Meta közelmúltbeli infrastrukturális beruházásai minden bizonnyal robusztusabb előképzést tesznek majd lehetővé bármilyen méretű modellek számára. Emellett a Llama 2 megduplázta a Llama 1 kontextushosszát, ami azt jelenti, hogy kétszer annyi tokenre “emlékszik” a következtetés során.

Definíciók:

LLama 3: A Meta nagyméretű nyelvi modellcsaládjának harmadik iterációja, amely a fejlett mesterséges intelligencia képességekre és a lehetséges multimodális alkalmazásokra összpontosít.
Meta: A Facebook, az Instagram és a WhatsApp anyavállalata, amely arra összpontosít, hogy a technológia segítségével összehozza az embereket, és vezető szerepet tölt be az AI területén történő innovációban.
GPU (grafikus feldolgozó egység): Speciális elektronikus áramkör, amelyet a memória gyors manipulálására és módosítására terveztek, hogy felgyorsítsa a képek és számítások létrehozását a megjelenítő eszközre történő kimenetre szánt képkockapufferben.

Gyakran ismételt kérdések:

Mi az a Meta’s Llama 3?
A Llama 3 a Meta által kifejlesztett legújabb nagyméretű nyelvi modell, amely várhatóan fejlett képességeivel a mesterséges intelligencia határait feszegeti.
Mikor jelenik meg a Llama 3?
Bár nincs meghatározott megjelenési dátum, a Meta időbeosztása szerint 2024 júliusa körül debütálhat.
A Llama 3 nyílt forráskódú lesz?
A Meta nyílt licencek iránti elkötelezettsége alapján a Llama 3 várhatóan nyílt forráskódú modellt követ majd.
Milyen új funkciókat várhatunk a Llama 3-ban?
A Llama 3 várhatóan multimodális képességekkel fog rendelkezni, ami fokozza a vizuális és hangadatokkal való integrációt.
Hogyan hasonlít a Llama 3 az elődeihez?
A jelentős infrastrukturális beruházásoknak köszönhetően a Llama 3 várhatóan jelentős teljesítménynövekedést kínál majd a Llama 2-höz képest.