À l’aide de l’apprentissage automatique, les chercheurs trouvent des modèles dans les données des dossiers de santé électroniques pour mieux identifier les personnes susceptibles d’être atteintes de la maladie

À l’aide de l’apprentissage automatique, les chercheurs trouvent des modèles dans les données des dossiers de santé électroniques pour mieux identifier les personnes susceptibles d’être atteintes de la maladie

Une équipe de recherche soutenue par les National Institutes of Health a identifié les caractéristiques des personnes atteintes de long COVID et celles susceptibles de l’avoir. Les scientifiques, à l’aide de techniques d’apprentissage automatique, ont analysé une collection sans précédent de dossiers de santé électroniques (DSE) disponibles pour la recherche sur le COVID-19 afin de mieux identifier qui a un long COVID. En explorant les données dépersonnalisées du DSE dans le National COVID Cohort Collaborative (N3C), une base de données publique nationale centralisée dirigée par le National Center for Advancing Translational Sciences (NCATS) des NIH, l’équipe a utilisé les données pour trouver plus de 100 000 cas de COVID probablement longs comme d’octobre 2021 (en mai 2022, le nombre est supérieur à 200 000). Les conclusions sont parues le 16 mai dans La santé numérique The Lancet.

Le long COVID est marqué par de nombreux symptômes, notamment l’essoufflement, la fatigue, la fièvre, les maux de tête, le “brouillard cérébral” et d’autres problèmes neurologiques. Ces symptômes peuvent durer plusieurs mois ou plus après un diagnostic initial de COVID-19. L’une des raisons pour lesquelles le COVID est difficile à identifier depuis longtemps est que bon nombre de ses symptômes sont similaires à ceux d’autres maladies et affections. Une meilleure caractérisation des COVID longs pourrait conduire à de meilleurs diagnostics et à de nouvelles approches thérapeutiques.

“Il était logique de tirer parti des outils modernes d’analyse de données et d’une ressource de mégadonnées unique comme N3C, où de nombreuses caractéristiques du long COVID peuvent être représentées”, a déclaré la co-auteure Emily Pfaff, Ph.D., informaticienne clinique à l’Université. de Caroline du Nord à Chapel Hill.

Lire aussi  Le film Pac-Man en direct serait en préparation – Destructoid

L’enclave de données N3C comprend actuellement des informations représentant plus de 13 millions de personnes dans tout le pays, dont près de 5 millions de cas positifs au COVID-19. La ressource permet une recherche rapide sur les questions émergentes concernant les vaccins, les thérapies, les facteurs de risque et les résultats pour la santé contre la COVID-19.

La nouvelle recherche fait partie d’une initiative trans-NIH connexe plus vaste, Researching COVID to Enhance Recovery (RECOVER), qui vise à améliorer la compréhension des effets à long terme du COVID-19, appelés séquelles post-aiguës du SRAS-CoV -2 infections (PASC). RECOVER identifiera avec précision les personnes atteintes du PASC et développera des approches pour sa prévention et son traitement. Le programme répondra également à des questions de recherche critiques sur les effets à long terme du COVID par le biais d’essais cliniques, d’études d’observation longitudinales, etc.

Dans le Lancette étude, Pfaff, Melissa Haendel, Ph.D., du campus médical d’Anschutz de l’Université du Colorado, et leurs collègues ont examiné la démographie des patients, l’utilisation des soins de santé, les diagnostics et les médicaments dans les dossiers de santé de 97 995 patients adultes COVID-19 du N3C. Ils ont utilisé ces informations, ainsi que des données sur près de 600 patients COVID longs de trois cliniques COVID longues, pour créer trois modèles d’apprentissage automatique pour identifier les patients COVID longs.

Dans l’apprentissage automatique, les scientifiques “entraînent” des méthodes de calcul pour passer rapidement au crible de grandes quantités de données afin de révéler de nouvelles informations – dans ce cas, sur le long COVID. Les modèles ont recherché des modèles dans les données qui pourraient aider les chercheurs à la fois à comprendre les caractéristiques des patients et à mieux identifier les personnes atteintes de la maladie.

Lire aussi  Le jeu 'Pokémon with guns' montre toutes les autres façons d'utiliser (abuser) vos copains

Les modèles se sont concentrés sur l’identification de patients COVID longs potentiels parmi trois groupes de la base de données N3C : tous les patients COVID-19, les patients hospitalisés avec COVID-19 et les patients qui avaient COVID-19 mais n’ont pas été hospitalisés. Les modèles se sont avérés exacts, car les personnes identifiées comme à risque de COVID long étaient similaires aux patients vus dans les cliniques COVID longues. Les systèmes d’apprentissage automatique ont classé environ 100 000 patients dans la base de données N3C dont les profils correspondaient étroitement à ceux avec un long COVID.

“Une fois que vous êtes en mesure de déterminer qui a un long COVID dans une grande base de données de personnes, vous pouvez commencer à poser des questions sur ces personnes”, a déclaré Josh Fessel, MD, Ph.D., conseiller clinique principal au NCATS et un programme scientifique. mener dans RECOVER. « Y avait-il quelque chose de différent chez ces personnes avant qu’elles ne développent un long COVID ? Avaient-elles certains facteurs de risque ? Y avait-il quelque chose dans la façon dont ils étaient traités pendant un COVID aigu qui aurait pu augmenter ou diminuer leur risque de long COVID ?

Les modèles ont recherché des caractéristiques communes, y compris de nouveaux médicaments, des visites chez le médecin et de nouveaux symptômes, chez les patients avec un diagnostic COVID positif qui étaient à au moins 90 jours de leur infection aiguë. Les modèles ont identifié les patients comme ayant un COVID long s’ils se rendaient dans une longue clinique COVID ou présentaient de longs symptômes COVID et souffraient probablement de la maladie mais n’avaient pas été diagnostiqués.

Lire aussi  Que rechercher dans un nouveau moniteur

“Nous voulons incorporer les nouveaux modèles que nous voyons avec le code de diagnostic pour COVID et les inclure dans nos modèles pour essayer d’améliorer leurs performances”, a déclaré Haendel de l’Université du Colorado. « Les modèles peuvent apprendre d’une plus grande variété de patients et devenir plus précis. Nous espérons que nous pourrons utiliser notre long classificateur de patients COVID pour le recrutement d’essais cliniques.

Cette étude a été financée par le NCATS, qui a contribué à la conception, à la maintenance et à la sécurité de l’enclave N3C, et la NIH RECOVER Initiative, soutenue par le NIH OT2HL161847. RECOVER coordonne, entre autres, le protocole de recrutement des participants auquel ce travail contribue. Les analyses ont été menées avec des données et des outils accessibles via l’enclave de données NCATS N3C et pris en charge par NCATS U24TR002306.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick