Tegnap, január 15-én lett 25 éves a Wikipédia, ennek kapcsán kiadott közleményében pedig az internetes lexikont és testvérprojektjeit működtető Wikimédia Alapítvány arról is megemlékezett, hogy az online enciklopédia több mint 300 nyelven írt 65 millió oldalával az egyik legmagasabb minőségű adathalmaz, amelyet a nagy nyelvi modellek (LLM-ek betanítására használnak. A cikk szerint a techcégekkel kötött újabb és újabb megállapodások hozzájárulnak a Wikipédia fenntarthatóságához is a Wikimedia Enterprise platformon keresztül, ami egy kereskedelmi megoldás a Wikimédia-projektekből származó tartalmak nagyarányú újrafelhasználására és terjesztésére vállalati szintű API-okon keresztül.
Ahogy az alapítvány írja, az elmúlt évben számos újabb vállalat (így a Microsoft, a Perplexity vagy a Mistral AI) is csatlakozott az olyan meglévő partnereikhez, mint amilyenek korábbról az Amazon, a Meta és a Google is voltak. Utóbbival már 2022-ben licencszerződést kötöttek, és kisebb mesterségesintelligencia-fejlesztőkkel, például az Ecosia keresőmotorral is megállapodásokat írtak alá. A legújabb partnerségekkel mára elmondható, hogy a Wikipédia licencszerződéseket kötött a legnagyobb nyugati MI-cégek jelentős részével, és a kereskedelmi együttműködéseket saját fennmaradásának garanciájaként kezeli, mérsékelve azokat a költségeket is, amelyek amúgy a fenti partnerek tevékenysége gerjeszt.
Érdekeltté tennék őket a Wiki fenntartásában
Bár a megállapodások pénzügyi részleteibe most sem ment bele, a Wikimedia Enterprise elnöke a Reutersnek elmondta: a Wikipédiának kritikus szerepe van a fenti techvállalatok munkájában, az alapítványnál pedig mostanra sikerült átlátni és kidolgozni azokat a funkciókat és lehetőségeket, amelyek révén az ehhez kapcsolódó adatgyűjtést áthelyezhetik az ingyenesről a kereskedelmi platformra. A Wikipédia és tartalmának használata természetesen a Wikimedia Enterprise programban is ingyenes, de ezen keresztül a partnerek az MI-chatbotoknak megfelelő mennyiségben és sebességgel férhetnek hozzá a tartalomhoz, ami súlyos terhelést jelent a Wikipédia egyre drágábban fenntartott szervereinek.
Ezzel Jimmy Wales, a Wikipédia alapítója szerint lényegében ők fizetik a mesterségesintelligencia-iparág kielégíthetetlen adatéhségét az új MI-modellek képzésére, az alapítvány támogatói pedig nem éppen erre adományozzák a pénzüket. Azt is érdemes megjegyezni, hogy a keresőként használt MI-chatbotok felfutása a Wikipédia rendes látogatottságának sem tett jót, az enciklopédia önkénteseinek pedig extra feladatot jelent a mesterséges intelligenciával termelt, rossz minőségű információ szűrése is. Wales az Associated Pressnek nyilatkozva arról beszélt, hogy ebben a helyzetben megoldást kellett találniuk, hogy "ne verjék szét a weboldalukat", és az is pozitívum, ha az MI-t emberek által gondozott tartalommal etetik.
"Nem igazán szeretnék olyan mesterséges intelligenciát használni, amelyet csak X-en képeztek ki, az egy nagyon dühös mesterséges intelligencia lenne" – szúrt oda Elon Musknak, aki kevéske értékes szabadidejében a Wikipédia ellen is bosszúhadjáratot indított, miután a róla szóló szócikkben megjelent a Donald Trump beiktatása alkalmából előadott karlengetős mutatványa. Összességében persze csak ezután derül majd ki, hogy a megállapodásokat miként fogadják a Wikipédia szerkesztői és írói, akik nemcsak az MI-vel generált tartalom felhasználása ellen lépnek fel, hanem akkor is fellázadtak, amikor a Wikimédia Alapítvány megpróbálta bevezetni a cikkekben az MI-vel gyártott tartalmi összefoglalókat.
Az ötlettől az értékteremtésig – az üzleti réteg szerepe az adattudományi működésben
Az adattudomány valódi értéke ott válik láthatóvá, ahol az előrejelzések döntésekké, a döntések pedig mérhető üzleti eredményekké alakulnak. Ehhez azonban tudatos üzleti beágyazásra, mérési keretrendszerekre és következetes visszacsatolásra is szükség van.
EGY NAPBA SŰRÍTÜNK MINDENT, AMIT MA EGY PROJEKTMENEDZSERNEK TUDNIA KELL!
Ütős esettanulmányok AI-ról, agilitásról, csapattopológiáról. Folyamatos programok három teremben és egy közösségi térben: exkluzív információk, előadások, interaktív workshopok, networking, tapasztalatcsere.
2026.03.10. UP Rendezvénytér
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak