A Google DeepMind mesterségesintelligencia-kutatói bejelentették, hogy olyan új MI-modellt hozott létre, ami segíthet megfejteni a delfinek által kibocsátott hangokat, ezen keresztül pedig támogathatja a delfinek kommunikációjának jobb megértését célzó erőfeszítéseket. A társaság hivatalos blogján közölt bejegyzés szerint a DolphinGemma nevű modellt a Wild Dolphin Project (WDP) nevű nonprofit szervezet adatai alapján képezték ki, amelyek az atlanti (vagy foltos) delfinekről és azok viselkedéséről szólnak.
A nyílt Gemma modellekre épülő, 400 millió paraméterrel dolgozó DolphinGemma a delfinekre emlékeztető hangszekvenciákat is képes generálni, és elég karcsú hozzá, hogy okostelefonokon is futtatni lehessen. A gyakorlatban egy Google Pixel 6 készüléken kezdték a delfinhangok valós idejű, nagy pontosságú elemzését, de a Pixel 9-re szabott következő generáció már hangszóró- és mikrofonos funkciók integrálását, illetve a mélytanuló modellek és a mintafelismerő algoritmusok egyidejű futtatását is lehetővé teszi.
Mesterséges nyelvet is építenek a delfinekkel
A WDP már idén nyárra tervezi, hogy a Pixel 9 okostelefont használja majd egy olyan platform működtetésére, ami delfinhangokat szintetizál, és az állatok jelzéseit is feldolgozza a megfelelő "válaszok" után kutatva. A szervezet végső célja, hogy feltárja a természetes hangsorokban rejlő szerkezetet és potenciális jelentést, meghatározva olyan szabályokat és mintákat, amelyek a nyelv egy formájára utalhatnak. Az adatok puszta mennyisége és összetettsége miatt ehhez az MI-t tartják ideális eszköznek.
A Google közleményéből az is kiderül, hogy egy párhuzamos projektben az aktív, kétirányú interakciót vizsgálják: a CHAT (Cetacean Hearing Augmentation Telemetry) rendszer, amit a WDP a Georgia Tech-kel együttműködve fejlesztett ki, az összetett delfinnyelv feltérképezése helyett egy egyszerűbb "közös szótár" létrehozását célozza. Ebben hangokat társítanak olyan tárgyakhoz társítják, amelyekkel a delfinek szívesen kerülnek kapcsolatba, és a kíváncsiságukat kihasználva ráveszik őket a hangok utánzására.
Nyílt forráskód: valóban ingyenes, de használatának szigorú szabályai vannak