Talán senkinek sem kell elmagyarázni, milyen hálátlan feladat egy halomnyi legódarabkát azok típusa szerint szétválogatni. A káosz viszont az alkotási folyamatot teszi taccsra, így az ember kénytelen nagy levegőt venni, és nekikezdeni a munkának. Kivéve persze azt az esetet, ha rendelkezésünkre áll egy mesterséges intelligenciával támogatott célszerkezet.
Gépi tanulás, gépi pakolás
Az Ausztráiában szoftvermérnökként dolgozó Daniel Westnek speciel van egy ilyenje. Igaz, elég sok munkaórája (és több mint két éve) van benne, ráadásul maga a gép sem tűnik filléres mulatságnak, hiszen több mint 10 ezer különböző legóalkatrészből áll össze. A szortírozó mozgó alkatrészeit 15 beépített motor működteti, a számítógépes feldolgozást pedig egy Raspberry Pi segíti.
A rendszer lényege, hogy az ömlesztve érkező darabokat szállítószalag speciális rázó szakaszokhoz tereli, ahol megtörténik a sorrendbe rendezés. A már egyesével továbbhaladó alkatrészekről aztán gyors egymásutánban készül egy sor felvétel. Ezeket a Raspberry továbbpasszolja egy normál számítógépre, ahol megvan a megfelelő háttér arra, hogy a képekből kiindulva az algoritmus eldöntse, pontosan milyen típusú darabkáról van szó. Ezt az információt visszalőve a Raspberrynek, utóbbi már el tudja dönteni, melyik kapukat kell kinyitnia, hogy a kérdéses tárgy végül a 18 készenlétben álló tárolóból melyikben landoljon.
Az univerzális masina a készítő szerint nagy pontossággal képes gyorsan rendet vágni a legóhegy között. Az akatrészenkénti 2 másodperces szintidőt ráadásul úgy tartja a szortírozó, hogy olyan elemeket is megfelelő helyre tesz, amelyeket korábban még nem "látott", azaz a tanuláshoz szükséges adatbázisában nem szerepel.
Rögös út
Ehhez természetesen egy sor nehézséget le kellett küzdenie az ötetgazdának, aki pontosan valami ilyesmi miatt, képességei fejlesztésének szándékával vágott neki a projektnek. Miközben az embernek természetes könnyedséggel megy a különböző elemek szétválogatása, a gépnek nem egyszerű megtanítani, hogy képek alapján helyesen azonosítson egy tárgyat. A megvilágítás és a pozíció miatt ugyanaz a legóelem számtalan formát és árnyalatot felvehet egy-egy fotón.
West a kezdeti rossz eredmények láttán majdnem fel is adta az egészet, de végül győzött benne a mérnöki akarat és nem fogadta el a kudarcot. Egy sor ötletes "rövidítéssel" és sok probálkozással végül kialakított egy olyan hibrid tanuló adatbázist, amely kellően robosztus és változatos volt ahhoz, hogy annak alapján a gépi látásra támaszkodó öntanuló algoritmus megfelelő neurális hálózatot tudjon kiépíteni. A leküzdendő problémákat és a sikerhez szükséges lépéseket az alábbi rövid, jól érthető videóban is bemutatja az alkotó.
Nem ez azonban a világ első legóválogató automatája, hiszen West munkáját két korábbi "kolléga" ténykedése is inspirálta. A legelső próbálkozás egy japán mérnökhöz köthető még 2011-ből, két évvel ezelőtt pedig már feltűnt egy olyan megoldás, ahol a mesterséges intelligenciára támaszkodott az alkotó. Az ausztrál mérnök megoldása viszont mind sebességében, mind univerzális jellegében fölébe nő az elődöknek.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak