Nous pouvons apprendre beaucoup de la nature si nous l’écoutons davantage – et les scientifiques du monde entier essaient de le faire. Des sommets des montagnes aux profondeurs de l’océan, les biologistes plantent de plus en plus d’enregistreurs audio pour écouter discrètement les gémissements, les cris, les sifflets et les chants des baleines, des éléphants, des chauves-souris et surtout des oiseaux. Cet été, par exemple, plus de 2 000 oreilles électroniques enregistreront le paysage sonore de la chaîne de montagnes de la Sierra Nevada en Californie, générant près d’un million d’heures d’audio. Pour éviter de passer plusieurs vies humaines à le décoder, les chercheurs s’appuient sur l’intelligence artificielle.
Ces enregistrements peuvent créer des instantanés précieux des communautés animales et aider les défenseurs de l’environnement à comprendre, en détail, comment les politiques et les pratiques de gestion affectent une population entière. Glaner des données sur le nombre d’espèces et d’individus dans une région n’est qu’un début. Le paysage sonore de la Sierra Nevada contient des informations cruciales sur la façon dont les incendies de forêt historiques de l’année dernière ont affecté les oiseaux vivant dans différents habitats et conditions écologiques dans la région. Les enregistrements pourraient révéler comment diverses populations animales ont résisté à la catastrophe et quelles mesures de conservation aident les espèces à rebondir plus efficacement.
Ces enregistrements peuvent également capturer des détails sur les interactions entre les individus dans des groupes plus importants. Par exemple, comment les partenaires se retrouvent-ils au milieu d’une cacophonie d’épouses? Les scientifiques peuvent également utiliser le son pour suivre les changements dans le moment de la migration ou les fourchettes de population. Des quantités massives de données audio affluent également de la recherche ailleurs: des projets sonores sont en cours pour compter les insectes, étudier les effets de la pollution lumineuse et sonore sur les communautés aviaires, suivre les espèces en voie de disparition et déclencher des alertes lorsque les enregistreurs détectent le bruit du braconnage illégal. ou des activités de journalisation.
«Les données audio sont un véritable trésor car elles contiennent de grandes quantités d’informations», déclare l’écologiste Connor Wood, chercheur postdoctoral à l’Université Cornell, qui dirige le projet Sierra Nevada. «Nous devons juste réfléchir de manière créative sur la façon de partager et d’accéder [that information]. » C’est un problème imminent car il faut beaucoup de temps aux humains pour extraire des informations utiles des enregistrements. Heureusement, la dernière génération de systèmes d’IA d’apprentissage automatique, qui peuvent identifier les espèces animales à partir de leurs appels, peut traiter des milliers d’heures de données en moins d’une journée.
«L’apprentissage automatique a changé la donne pour nous», déclare Laurel Symes, directrice adjointe du Centre pour la bioacoustique de conservation du Cornell Lab of Ornithology. Elle étudie la communication acoustique chez les animaux, y compris les grillons, les grenouilles, les chauves-souris et les oiseaux, et a accumulé de nombreux mois d’enregistrements de katydids (fameuses sauterelles à longues cornes vocales qui sont une partie essentielle de la chaîne alimentaire) dans les forêts tropicales du centre du Panama. Les modèles d’activité de reproduction et les variations saisonnières de la population sont cachés dans cet audio, mais son analyse prend énormément de temps: il a fallu à Symes et à trois de ses collègues 600 heures de travail pour classer diverses espèces de katydidés à partir de seulement 10 heures de son enregistrées. Mais un algorithme d’apprentissage automatique que son équipe est en train de développer, appelé KatydID, a effectué la même tâche pendant que ses créateurs humains «sortaient pour une bière», dit Symes.
Les configurations d’apprentissage automatique telles que KatydID sont des systèmes d’auto-apprentissage qui utilisent un réseau de neurones – «une approximation vraiment très approximative du cerveau humain», explique Stefan Kahl, expert en apprentissage automatique au Centre de conservation bioacoustique de Cornell et à l’Université de technologie de Chemnitz. en Allemagne. Il a construit BirdNET, l’un des systèmes de reconnaissance des sons aviaires les plus populaires utilisés aujourd’hui. L’équipe de Wood s’appuiera sur BirdNET pour analyser les enregistrements de la Sierra Nevada, et d’autres chercheurs l’utilisent pour documenter les effets de la pollution lumineuse et sonore sur le chœur de l’aube dans le parc naturel régional de Brière en France.
Ces systèmes commencent par analyser de nombreux intrants – par exemple, des centaines d’appels d’oiseaux enregistrés, chacun «étiqueté» avec son espèce correspondante. Le réseau neuronal apprend alors lui-même quelles fonctionnalités peuvent être utilisées pour associer une entrée (dans ce cas, un appel d’oiseau) à une étiquette (l’identité de l’oiseau). Avec des millions de caractéristiques extrêmement subtiles souvent impliquées, les humains ne peuvent même pas savoir ce que sont la plupart d’entre eux.
Les anciennes versions du logiciel de détection étaient semi-automatiques. Ils ont scanné des spectrogrammes – des représentations visuelles d’un signal audio – à la recherche de caractéristiques établies telles que la gamme de fréquences et la durée pour identifier un oiseau par son chant. Cela fonctionne bien pour certaines espèces. Le chant du cardinal nordique, par exemple, commence systématiquement par quelques longues notes qui montent en hauteur, suivies de notes rapides et courtes avec un creux distinct dans la hauteur. Il peut facilement être identifié à partir d’un spectrogramme, tout comme une chanson composée peut être reconnue à partir d’une partition. Mais d’autres cris aviaires sont plus complexes et variés et peuvent confondre les systèmes plus anciens. «Il faut bien plus que de simples signatures pour identifier l’espèce», dit Kahl. De nombreux oiseaux ont plus d’un chant et, comme les autres animaux, ils ont souvent des «dialectes» régionaux. Un moineau à couronne blanche de l’État de Washington a un son très différent de ses cousins californiens. Les systèmes d’apprentissage automatique peuvent reconnaître ces nuances. «Disons qu’il y a une chanson des Beatles encore inédite qui sort aujourd’hui. Vous n’avez jamais entendu la mélodie ou les paroles auparavant, mais vous savez que c’est une chanson des Beatles parce que c’est ce à quoi elles ressemblent », explique Kahl. «C’est aussi ce que ces programmes apprennent à faire.»
Ces systèmes ont en fait bénéficié des progrès récents de la technologie de reconnaissance de la parole humaine et de la musique. En collaboration avec Andrew Farnsworth du Cornell Lab of Ornithology, des experts du Music and Audio Research Laboratory de l’Université de New York se sont appuyés sur leur expérience musicale pour construire un système d’identification des cris d’oiseaux appelé BirdVox. Il détecte et identifie les oiseaux qui migrent la nuit et distingue le chant des oiseaux des bruits de fond, y compris les cris de grenouilles et d’insectes, le transport terrestre et aérien humain, et les sources telles que le vent et la pluie, qui peuvent tous être étonnamment forts et variables.
La qualité de l’apprentissage de chaque système dépend en grande partie de la quantité d’enregistrements pré-étiquetés disponibles. Une mine de données de ce type existe déjà pour les oiseaux communs. Kahl estime qu’environ 4,2 millions d’enregistrements sont disponibles en ligne pour 10 000 espèces. Mais la plupart des quelque 3000 espèces que BirdNET peut identifier se trouvent en Europe et en Amérique du Nord, et BirdVox se concentre davantage sur les chants d’oiseaux basés aux États-Unis.
«Dans d’autres endroits, pour les espèces plus rares ou pour celles qui ne disposent pas de données bien classées, [BirdNET] ne fonctionne pas aussi bien », déclare l’écologiste indien VV Robin. Il est chaud sur la piste du coursier de Jerdon, un oiseau nocturne en danger critique d’extinction qui n’a pas été officiellement repéré depuis environ une décennie. Robin et ses collaborateurs ont placé des enregistreurs dans une réserve faunique du sud de l’Inde pour tenter de capter son appel. Il enregistre également des oiseaux dans les collines des Ghâts occidentaux, un point chaud de la biodiversité mondiale également dans le sud de l’Inde, depuis 2009. Ces enregistrements sont minutieusement annotés pour former des algorithmes d’apprentissage automatique développés localement.
Les scientifiques citoyens peuvent également aider à combler les lacunes du référentiel de chants d’oiseaux. BirdNET alimente une application pour smartphone qui a été un grand succès auprès des ornithologues amateurs. Ils enregistrent des extraits audio et les soumettent à l’application, qui leur indique l’espèce du chanteur et ajoute l’enregistrement à la base de données des chercheurs. Plus de 300 000 enregistrements arrivent chaque jour, dit Kahl.
Ces algorithmes d’apprentissage automatique peuvent encore être améliorés. Bien qu’ils analysent l’audio beaucoup plus rapidement que les humains, ils sont encore à la traîne pour passer au crible les sons qui se chevauchent pour se concentrer sur un signal d’intérêt. Certains chercheurs y voient le prochain problème à résoudre par l’IA. Cependant, même les versions imparfaites actuelles permettent des projets de grande envergure qui prendraient beaucoup trop de temps pour que les humains les abordent seuls. «En tant qu’écologistes», dit Wood, «des outils comme BirdNET nous permettent de rêver en grand.»