Une entreprise torontoise invente un détecteur audio AI

Une entreprise torontoise invente un détecteur audio AI

Les yeux sont peut-être les fenêtres de l’âme, mais chez Klick Labs, tout tourne autour de la voix.

La branche de recherche torontoise de la société de technologie des sciences de la vie Klick Health a trouvé un moyen d’analyser les voix d’une manière si granulaire qu’elle peut déterminer s’il s’agit d’une personne ou d’une machine alimentée par l’intelligence artificielle.

Cette capacité intervient alors que le nombre de deepfakes – des vidéos, des clips audio ou des photos produits par l’IA qui semblent réels – a explosé avec la récente sortie de plusieurs chatbots IA. De la pop star Taylor Swift au président américain Joe Biden en passant par le pape, tout le monde a été victime de ce phénomène.

Et cela ne devrait pas s’atténuer de si tôt. L’agence d’application de la loi de l’Union européenne, Europol, a récemment prédit que jusqu’à 90 pour cent du contenu en ligne pourrait être généré de manière synthétique d’ici 2026 et le Service canadien du renseignement de sécurité a qualifié la situation de « menace réelle pour l’avenir du Canada ».

Mais Yan Fossat, vice-président principal de la recherche et du développement en santé numérique chez Klick Labs, espère que son entreprise pourra contribuer à rendre le monde de l’IA un peu plus sûr.

“Toute technologie qui n’est pas réglementée est dangereuse et cela évolue un peu plus vite que beaucoup de choses”, a-t-il déclaré alors qu’il se tenait dans le laboratoire de Klick au centre-ville de Toronto.

C’est dans cet espace – encombré de fils, de morceaux d’appareils électroniques domestiques et d’imprimantes 3D vrombissantes – que Fossat et une équipe de trois personnes ont commencé à réfléchir à la façon dont leurs films de science-fiction préférés pourraient les aider à lutter contre les deepfakes.

Lire aussi  La recherche montre que l'écoblanchiment peut encore satisfaire les parties prenantes

“Dans “Terminator”, ils utilisent des chiens pour sentir si les gens ressemblent à des humains et dans “Blade Runner”, il y a la machine Voight-Kampff et j’ai toujours voulu créer une machine Voight-Kampff”, a déclaré Fossat, faisant référence à un test fictif utilisé dans le film pour mesurer les réponses physiologiques, telles que le mouvement des yeux et le temps de réaction, afin de déterminer si un personnage était un humain ou un réplicant.

Pour leur propre projet, l’équipe Klick a rassemblé 49 humains d’origines et d’accents divers, dont ils ont transmis l’audio à un générateur deepfake pour créer des clips synthétiques.

Les clips ont été analysés sur la base de leurs biomarqueurs vocaux – des caractéristiques intégrées dans les voix qui nous renseignent sur la santé ou la physiologie de l’orateur.

Par exemple, si quelqu’un vient de monter un escalier en courant, il respire plus vite, ce qui peut être entendu dans sa voix. La voix peut également indiquer quand quelqu’un se réveille ou se sent fatigué.

Klick Labs a identifié 12 000 de ces biomarqueurs, mais pour distinguer l’homme de la machine, Jaycee Kaufman, scientifique principal de Klick, a déclaré que jusqu’à présent, il s’appuie sur cinq : la longueur et la variation de la parole, les taux de micropauses et de macropauses et la proportion globale de temps. passé à parler plutôt qu’à faire une pause.

Les micropauses durent moins d’une demi-seconde et les macropauses durent plus longtemps, a-t-elle déclaré. Ils se produisent souvent naturellement lorsque quelqu’un parle et prend simplement sa respiration ou cherche ses mots.

Lire aussi  Un panel de la FDA recommande un vaccin Covid destiné uniquement à la variante XBB

“Nous n’y prêtons pas vraiment attention, mais cela se produit”, a ajouté Fossat.

« Nous avons un cerveau et il doit penser et nous avons des poumons et nous devons respirer. Les machines n’ont pas cela, alors elles ne le font pas.

Jusqu’à présent, la méthode d’identification des deepfakes utilisée par Klick Labs a un taux de réussite de 80 %, mais cela pourrait ne pas durer longtemps.

Il est de plus en plus difficile de savoir si un clip est un deepfake ou non, car l’IA évolue constamment et « devient de mieux en mieux capable de ressembler à des voix humaines », a déclaré Fossat.

“Par exemple, OpenAI, la société qui crée ChatGPT (chatbot IA génératif) vient de sortir il y a quelques semaines une nouvelle voix profonde et si bonne qu’elle respire”, a-t-il déclaré.

“Cela simule ces micro-respirations, ce qui est assez étonnant.”

Il insiste sur le fait que le développement n’a pas rendu les recherches de Klick Labs inutiles, car il existe des milliers d’autres biomarqueurs, comme la fréquence cardiaque, qui peuvent tester la détection des deepfakes.

Seize autres études sur les biomarqueurs vocaux et les maladies menées par Klick Labs pourraient également contribuer à ses recherches.

L’une de ces études a utilisé des biomarqueurs vocaux pour diagnostiquer le diabète avec une précision de 89 pour cent pour les femmes et de 86 pour cent pour les hommes.

Cette recherche se poursuivra bientôt avec une étude que Klick devrait mener avec l’hôpital Humber River de Toronto et Fossat a déclaré qu’elle pourrait éventuellement constituer la base d’outils téléphoniques que chacun peut utiliser pour découvrir son risque de contracter la maladie.

Lire aussi  L'Inde cherche l'énergie propre, mais les objectifs économiques font passer le charbon en premier

Chaque avancée dans la recherche de Klick signifie plus de chances d’en apprendre davantage sur les biomarqueurs et de les réappliquer à la détection de maladies et de deepfakes, qui s’avèrent difficiles à suivre.

“Ça va si vite à chaque fois que vous faites quelque chose, une fois que vous avez terminé… tout a changé et nous devons recommencer”, a déclaré Fossat.

Ce rapport de La Presse Canadienne a été publié pour la première fois le 26 mai 2024.

#Une #entreprise #torontoise #invente #détecteur #audio
2024-05-26 11:17:40

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick