
Big Brother pour certains, réponse miraculeuse à tous les problèmes pour d'autres, le Big Data est un sujet à la mode. Dans la santé, cette avancée technologique porte de nombreux espoirs.
Le Big Data définit un ensemble énorme de données informatiques répondant à trois critères. C'est la règle des trois V :
De nous, principalement. Chacune de nos actions sur le web ou sur nos téléphones génère une trace : historique de navigation, photos, historique des commandes en ligne, etc. Des milliers de données existent pour chacun d'entre nous. À ces informations s'ajoutent les données recueillies par l'État, par l'Assurance Maladie, les études scientifiques, démographiques, etc.
Chaque jour, l'humanité crée 2.5 milliards de gigas octets de données. Et ces données sont collectées par différents acteurs. Les géants du web, Facebook, Google, Amazon et Apple (les fameux GAFA) sont les plus connus. Mais les éditeurs d'applications et de sites internet aspirent également nos données, ainsi que des sociétés spécialisées ou même des organismes publics.
Les applications du Big Data sont très nombreuses.
Par des systèmes informatiques complexes développés spécialement pour traiter de grandes quantités de données. Le Big Data a entraîné la création de nouveaux métiers, spécialisés dans l'extraction et la vérification de données numériques.
Le Big Data est intimement lié au développement de l'Intelligence Artificielle. En effet, les grandes quantités de données collectées permettent "d'entraîner" les algorithmes qui sont à la base des IA. Et seules des IA sont en mesure de traiter de manière pertinente le gigantesque désordre du Big Data.
Pas encore. Disposer d'un très grand nombre de données ne garantit pas que ces données soient fiables. Et plus on dispose de données, plus leur traitement est complexe. Des erreurs et des imprécisions sont encore possibles. C'est l'un des défis pour le Big Data.
Les progrès informatiques ont des conséquences concrètes dans le secteur de la santé. Exemple :
Que ce soit à l'hôpital, dans les cabinets médicaux, dans les administrations ou les mutuelles, les ordinateurs sont partout. Ils pilotent les outils médicaux, stockent les résultats, les dossiers, etc. Ils génèrent chaque jour des milliards de données, auxquelles s'ajoutent les informations produites par les objets connectés ou par nos applications. Finement analysées, ces informations peuvent permettre de nombreux progrès :
Les informations récoltées à long terme sur de très larges populations vont permettre d'obtenir des statistiques très précises. De là, il sera possible de repérer les facteurs de risques pour certaines maladies comme le cancer, le diabète, l'asthme.
De même, l'intelligence artificielle permet déjà de personnaliser le traitement pour certains malades du cancer. Le super-ordinateur Watson, développé par IBM, analyse en quelques minutes le résultat d'une analyse génétique du patient, compare ses paramètres à la masse des données existantes, et propose des pistes de stratégie thérapeutique. Ce travail pouvait auparavant prendre plusieurs semaines.
Les données recueillies dans toutes les régions du monde permettent d'anticiper les problèmes de santé auxquels vont faire face les populations qui y vivent. Les données sur le comportement alimentaire ou la consommation d'alcool, par exemple, peuvent permettre d'anticiper les risques de cancers et de maladie cardiovasculaires. Et d'orienter les politiques de prévention.
À partir des informations partagées par les autorités sanitaires du monde entier, la carte Health Map permet par ailleurs de visualiser les risques épidémiques partout dans le monde. D'autres systèmes prennent en compte le trafic aérien pour anticiper le déplacement d'une épidémie d'un pays à un autre.
Le Big Data pourrait permettre de vérifier beaucoup plus rapidement l'efficacité ou la dangerosité des médicaments, notamment des vaccins, dès l'étape cruciale des essais cliniques.
L'analyse des données croisant la vente de médicaments et la survenue d'événements sanitaires peut également permettre de faire des rapprochements entre l'usage de certains traitements et la survenue de certains problèmes de santé.
Les données recueillies dans le cadre d'essais cliniques ou par des chercheurs font l'objet d'un consentement explicite du patient, et d'une déclaration à la CNIL. Mais dans le cadre du Big Data, d'autres données peuvent être utilisées : historiques de navigation internet, recherches en ligne, informations produites par les objets connectés, etc.
Le respect de l'anonymat et la prise en compte de la volonté des citoyens qui ne souhaitent pas partager leurs informations sont alors des enjeux réels. L'entrée en vigueur du Règlement Général pour la Protection des Données en mai 2018 a permis de renforcer les droits des citoyens sur leurs données personnelles.
→ À lire : 9 choses à savoir sur mes données de santé
Mais de nombreuses autres questions se posent : comment éviter que les GAFA monopolisent ces données ? Comment garantir la transparence du traitement de ces données, et permettre au citoyen d'exercer ses droits ? Faut-il conserver toutes les données ?
Il existe en France plus de 200 bases de données publiques relatives à la santé. La plus riche est le SNIIRAM, le Système national d'information interrégimes de l'Assurance maladie. Y sont enregistrés tous les remboursements effectués pour chaque cotisant tout au long de sa vie : médicaments, consultations, trajets en ambulance, etc.
À terme, ce fichier sera réuni au sein d'une base plus large : le Système National des Données de Santé. Géré par l'Assurance maladie, ce système permettra de chaîner des données aujourd'hui disparates :
Ces données sont accessibles sur autorisation à toute personne ou organisme à des fins de recherche, d'étude ou d'évaluation d'intérêt public. Plusieurs conditions sont posées :
Les travaux ne peuvent aboutir à :
La CNIL et l'institut National des Données de Santé sont chargés d'évaluer les demandes, et d'autoriser ou non les accès en fonction des critères prévus par la loi.
Article publié le 09/05/19