Google dezvoltă modelul AI DolphinGemma pentru a descifra comunicarea delfinilor

Dezvoltarea DolphinGemma de către Google
Google a dezvoltat un model AI numit DolphinGemma pentru a descifra modul în care delfinii comunică și, într-o zi, pentru a facilita comunicarea interspecii. Sunetele complexe ale delfinilor, cum ar fi clicurile, fluierăturile și pulsațiile, au fascinat oamenii de știință de mult timp. Visul a fost să înțeleagă și să descifreze modelele din aceste vocalizări complexe.
Colaborare cu Institutul Tehnologic din Georgia
Colaborând cu inginerii de la Institutul Tehnologic din Georgia și valorificând cercetarea de teren a Proiectului Delfinilor Sălbatici (WDP), Google a prezentat DolphinGemma pentru a ajuta la realizarea acestui obiectiv.
Modelul AI fundamental
Anunțat în jurul Zilei Naționale a Delfinilor, modelul AI fundamental reprezintă un nou instrument în efortul de a înțelege comunicarea cetaceelor.
Învățare a structurii sunetelor delfinilor
Antrenat special pentru a învăța structura sunetelor delfinilor, DolphinGemma poate chiar să genereze secvențe audio noi, asemănătoare cu cele ale delfinilor.
Anvergura Proiectului Delfinilor Sălbatici
Proiectul Delfinilor Sălbatici, operațional din 1985, a realizat cea mai lungă studiu subacvatic continuu din lume al delfinilor pentru a dezvolta o înțelegere profundă a sunetelor specifice contextului, cum ar fi:
- Fluierăturile de semnătură: Funcționează ca identificatori unici, esențiali pentru interacțiuni precum reunirea mamelor cu vițeii.
- Squawkurile cu impulsuri rapide: De obicei asociate cu conflictul sau întâlnirile agresive.
- Buzzurile de clic: Adesea detectate în timpul activităților de curtare sau când delfinii urmăresc rechini.
Obiectivul Ultimate al WDP
Oferind datele esențiale și etichetate cruciale pentru antrenarea modelelor AI sofisticate ca DolphinGemma, obiectivul final al WDP este de a descoperi structura inerentă și semnificația potențială în aceste secvențe de sunete naturale.
DolphinGemma: Urechea AI pentru sunetele cetaceelor
Analyzing the sheer volume and complexity of dolphin communication is a formidable task ideally suited for AI. DolphinGemma, developed by Google, employs specialised audio technologies to tackle this. It uses the SoundStream tokeniser to efficiently represent dolphin sounds, feeding this data into a model architecture adept at processing complex sequences. Based on insights from Google’s Gemma family of lightweight, open models (which share technology with the powerful Gemini models), DolphinGemma functions as an audio-in, audio-out system. Fed with sequences of natural dolphin sounds from WDP’s extensive database, DolphinGemma learns to identify recurring patterns and structures. Crucially, it can predict the likely subsequent sounds in a sequence—much like human language models predict the next word.
CHAT system și interacțiunea bidirecțională
În timp ce DolphinGemma se concentrează pe înțelegerea comunicației naturale, un proiect paralel explorează o altă cale: interacțiunea activă, bidirecțională. Sistemul CHAT (Cetacean Hearing Augmentation Telemetry) – dezvoltat de WDP în parteneriat cu Georgia Tech – își propune să stabilească un vocabular comun mai simplu, în loc să traducă direct limba complexă a delfinilor.
Google Pixel permite cercetarea oceanică
Stând la baza analizei sunetelor naturale și a sistemului interactiv CHAT, tehnologia mobilă esențială. Telefoanele Google Pixel servesc ca creier pentru procesarea datelor audio de înaltă fidelitate în timp real, direct în mediul provocator al oceanului.
Recunoscând că progresele adesea provin din colaborare, Google intenționează să lanseze DolphinGemma ca un model deschis mai târziu în această vară. Deși antrenat pe delfinii peteți din Atlantic, arhitectura sa promite pentru cercetătorii care studiază alte cetacee, putând necesita ajustări fine pentru repertoriile vocale ale diferitelor specii.