Une étude suggère qu’une nouvelle méthode est aussi efficace que l’étalon-or manuel pour classer un diagnostic – –

Dans un article publié dans la revue Motifs, des scientifiques de l’école de médecine Icahn du mont Sinaï ont décrit la création d’un nouvel algorithme automatisé basé sur l’intelligence artificielle qui peut apprendre à lire les données des patients à partir des dossiers de santé électroniques. Dans une comparaison côte à côte, ils ont montré que leur méthode, appelée Phe2vec (FEE-to-vek), identifiait avec précision les patients atteints de certaines maladies ainsi que la méthode traditionnelle “gold standard”, qui nécessite beaucoup plus de travail manuel. développer et performer.

“Il continue d’y avoir une explosion de la quantité et des types de données stockées électroniquement dans le dossier médical d’un patient. Démêler ce réseau complexe de données peut être très fastidieux, ralentissant ainsi les progrès de la recherche clinique”, a déclaré Benjamin S. Glicksberg, PhD, assistant Professeur de génétique et de sciences génomiques, membre de l’Institut Hasso Plattner pour la santé numérique du Mont Sinaï (HPIMS) et auteur principal de l’étude. “Dans cette étude, nous avons créé une nouvelle méthode d’extraction de données à partir de dossiers de santé électroniques avec un apprentissage automatique qui est plus rapide et moins exigeant en main-d’œuvre que la norme de l’industrie. Nous espérons que ce sera un outil précieux qui facilitera davantage et moins de biais, recherche en informatique clinique.

L’étude a été dirigée par Jessica K. De Freitas, une étudiante diplômée du laboratoire du Dr Glicksberg.

Actuellement, les scientifiques s’appuient sur un ensemble de programmes informatiques établis, ou algorithmes, pour extraire des dossiers médicaux à la recherche de nouvelles informations. Le développement et le stockage de ces algorithmes sont gérés par un système appelé Phenotype Knowledgebase (PheKB). Bien que le système soit très efficace pour identifier correctement un diagnostic de patient, le processus de développement d’un algorithme peut être très long et rigide. Pour étudier une maladie, les chercheurs doivent d’abord parcourir des tonnes de dossiers médicaux à la recherche d’éléments de données, tels que certains tests de laboratoire ou prescriptions, qui sont uniquement associés à la maladie. Ils programment ensuite l’algorithme qui guide l’ordinateur pour rechercher les patients qui ont ces données spécifiques à la maladie, qui constituent un “phénotype”. À son tour, la liste des patients identifiés par l’ordinateur doit être vérifiée manuellement par les chercheurs. Chaque fois que les chercheurs veulent étudier une nouvelle maladie, ils doivent recommencer le processus à partir de zéro.

Lire aussi  « Tootsie Roll » introduit pour les valves cardiaques transcathéter qui fuient

Dans cette étude, les chercheurs ont essayé une approche différente – une approche dans laquelle l’ordinateur apprend, par lui-même, comment repérer les phénotypes de la maladie et ainsi économiser du temps et des efforts aux chercheurs. Cette nouvelle méthode Phe2vec était basée sur des études que l’équipe avait déjà menées.

“Auparavant, nous avons montré que l’apprentissage automatique non supervisé pouvait être une stratégie très efficace et efficiente pour extraire les dossiers de santé électroniques”, a déclaré Riccardo Miotto, PhD, ancien professeur adjoint à l’HPIMS et auteur principal de l’étude. « L’avantage potentiel de notre approche est qu’elle apprend les représentations des maladies à partir des données elles-mêmes. Par conséquent, la machine effectue une grande partie du travail que les experts feraient normalement pour définir la combinaison d’éléments de données des dossiers de santé qui décrit le mieux une maladie particulière. »

Essentiellement, un ordinateur a été programmé pour parcourir des millions de dossiers de santé électroniques et apprendre à trouver des liens entre les données et les maladies. Cette programmation s’appuyait sur des algorithmes « d’intégration » qui avaient été précédemment développés par d’autres chercheurs, tels que des linguistes, pour étudier les réseaux de mots dans diverses langues. L’un des algorithmes, appelé word2vec, a été particulièrement efficace. Ensuite, l’ordinateur a été programmé pour utiliser ce qu’il a appris pour identifier les diagnostics de près de 2 millions de patients dont les données étaient stockées dans le système de santé du mont Sinaï.

Enfin, les chercheurs ont comparé l’efficacité entre les nouveaux et les anciens systèmes. Pour neuf maladies sur dix testées, ils ont constaté que le nouveau système Phe2vec était aussi efficace ou légèrement supérieur au processus de phénotypage de référence pour identifier correctement un diagnostic à partir des dossiers de santé électroniques. Quelques exemples de maladies comprenaient la démence, la sclérose en plaques et l’anémie falciforme.

Lire aussi  La forme sinusale ressemble à une empreinte digitale utilisée par les anthropologues médico-légaux pour identifier les restes humains

« Dans l’ensemble, nos résultats sont encourageants et suggèrent que Phe2vec est une technique prometteuse pour le phénotypage à grande échelle des maladies dans les données des dossiers de santé électroniques », a déclaré le Dr Glicksberg. “Avec des tests et des améliorations supplémentaires, nous espérons qu’il pourra être utilisé pour automatiser de nombreuses étapes initiales de la recherche en informatique clinique, permettant ainsi aux scientifiques de concentrer leurs efforts sur des analyses en aval telles que la modélisation prédictive.”

Cette étude a été soutenue par la Fondation Hasso Plattner, la Fondation pour la découverte de médicaments contre l’Alzheimer et un don d’unité de traitement graphique de la part de NVIDIA Corporation.

.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick