Szimulált elefántok leplezik le az önvezető rendszerek ügyetlenségét

Bitport2026.04.27.Piaci hírek

Egy új benchmark azokat a megbízhatósági értékeléseket feszegeti, amelyekből nem igazán derül ki, hogy az önvezető modellek hogyan és milyen gyakran mondanak csődöt a váratlan helyzetekben.

Bármilyen sokat fejlődtek is az önvezető rendszerek, az rendszeresen kiderül, hogy a szoftverekkel vezérelt robotok kiszámíthatatlanul reagálnak az emberi környezetekben való üzemeltetés összetett kihívásaira. Nemrég a Waymo járműveiről derült ki, hogy milyen nehézségeket okoz egy látszólag egyszerű feladat, a gyerekeket fel- és leszállító iskolabuszok szabályos előzése, és mennyire ellentmondásos az önvezető technológia állítólagos alkalmazkodóképessége. A szakértők szerint a 99 százalékos megbízhatóság elérését követően az utolsó 1 százalék – vagyis a kivételek – betanítása a kemény dió a gépi tanulásban, mivel azokat lehetetlen egyesével meghatározni.

A megbízhatóság értékelését egyébként nem segíti sem az átláthatóság hiánya, sem a teszteléshez használt szimulációk konzervatív kialakítása. Egy kutatócsoport a múlt héten éppen ennek kapcsán mutatott be egy új benchmarkot az önvezető járművek tesztelésére, ami különféle előre nem látható forgatókönyvekkel teszi próbára a rendszereket: például megjelenik egy elefánt egy városi utcán, az út közepén ott áll egy játszótéri csúszda, vagy esetleg a Gyalogkakukk-rajzfilmeket idéző festett fal jön szembe, ami szemből nézve pont olyan, mint az előtte lévő út folytatása. Ez utóbbival egyébként már a valóságban is sikerült átverni a Tesla Autopilot vezetéstámogató funkcióit.

Ha nem érted, akkor legalább fékezz!

A németországi Tübingeni Egyetem tudósa, Andreas Geiger egy új tanulmány társszerzőjeként arról ír a Fail2Drive nevű teljesítmény-összehasonlító eljárásról szólva, hogy az önvezető modellek kutatásában milyen problémát jelent az azonos forgatókönyvek alapján végzett képzés és értékelés. Szerinte ami erős benchmark teljesítménynek tűnik, az lehet, hogy csak "erős memorizálás", így a Fail2Drive újítása, hogy erre a célra készült, adateloszláson kívüli (a betanításra használt adathalmaztól eltérő) szcenáriókat vezet be a nyílt forrású CARLA szimulátorba. Ezek közül némelyik elég furcsa (elefánt, Gyalogkakukk), mások azonban életszerűek, mint egy úton parkoló tűzoltóautó.

Abban a tekintetben nincs köztük különbség, hogy a fent idézett bejegyzésbe ágyazott videón az önvezető rendszerek az elefántba és a tűzoltóautóba is gond nélkül belerongyolnak. A Fail2Drive tesztjein átlagosan 22,8 százalékkal csökkent a modellek hatékonysága, ami a tudósok szerint alapvető kétségeket támaszt a jelenlegi megközelítések masszivitásával kapcsolatban. Van, aki szerint nincs sok értelme irreális vagy valószínűtlen forgatókönyvekkel kudarcra kényszeríteni a gépi tanuló modelleket, Geiger azonban úgy látja, hogy az áruházi parkolóban pálmafákat cipelő emberek jogosan várják el, hogy az önvezető autók ne gázolják el őket gyakrabban, mint az emberi sofőrök.

Piaci hírek

Rárúgta az ajtót a tőzsdére a kínai CXMT memóriagyártó

Piaci kapitalizációja alapján már a CXMT a legnagyobb kínai tőzsdén jegyzett vállalat, ami saját várakozásai szerint több mint hétszeresére növelte az első félévben termelt bevételét.

Hirdetés

Öt kérdés, amelyet érdemes feltenni felhőplatform-választás előtt

Egy felhőplatform értékét nemcsak a szolgáltatásai határozzák meg, hanem az is, hogy egy kritikus helyzetben mennyire képes támogatni a vállalat működését.

A hónap témája

Mit kell tenni, amikor beüt a krach?

Előrelátó tervezés és meghatározott menetrend segíti az incidensek minél gyorsabb elhárítását. Ehhez azonban sok feladatot és felelősséget kell tisztázni – még jóval azelőtt, hogy bekövetkezik a baj.

a melléklet támogatója a ONE Solutions

CIO Podcast

CIO Podcast #70: A mobiltelefónia csendes robotosai

CIO Podcast #69: A digitális kultúra hiánya a védelmi technológiákat is gyengíti

MÉG TÖBB CIO PODCAST »

Vendég cikk

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Egy kormányrendelet alapjaiban formálják át 2026-tól az állami intézmények és vállalatok szoftvergazdálkodási gyakorlatát.

Projektek O-gyűrűje. Mit tanulhat egy projektvezető a Challenger tragédiájából?

CIO Klub

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

A Corvinus Egyetem és a Complexity Science Hub kutatói megmérték: a Python kódok közel harmadát ma már mesterséges intelligencia írja, és ebből a szenior fejlesztők profitálnak.

Rengeteg ország áll át helyi MI-platformra

Rárúgta az ajtót a tőzsdére a kínai CXMT memóriagyártó

Mit kell tenni, amikor beüt a krach?

CIO Podcast #70: A mobiltelefónia csendes robotosai

Radikális fordulat várható a kormányzati IT-gazdálkodásban

Akadémiai megerősítést kapott: szenior fejlesztő nem vén fejlesztő

PM JAM 2026: a projektmenedzsment elmélete gyakorlattá válik!