Recherche d’équivalences de médicaments en rupture
Défi iDoc Santé centré autour de l’amélioration de l’accès, de la diffusion et de l’usage des connaissances en santé. Organisé par la Haute autorité de santé (HAS), ainsi que ses partenaires l’Institut national du cancer (INCa) et l’Agence numérique en santé.

Contexte
La Haute autorité de santé (HAS), ainsi que ses partenaires l’Institut national du cancer (INCa) et l’Agence numérique en santé ont organisé le Défi iDoc Santé centré autour de l’amélioration de l’accès, de la diffusion et de l’usage des connaissances en santé. Ce défi visait à prototyper de nouveaux usages sur les textes de l’ensemble des productions de la HAS et de ses partenaires.
Le collectif adalab s’est positionné sur une des problématiques parmi les nombreuses adressées par le défi: la recherche d’équivalents de médicaments en situation de rupture de stock.
Problématique
Certaines situations nécessitent de pouvoir remplacer un médicament par un autre : rupture d’approvisionnement, constitution d’un livret thérapeutique, conciliation, prescription transfrontalière, etc.
Les informations nécessaires, qu’elles soient relatives aux indications thérapeutiques, aux contre-indications, aux modalités d’utilisation ou encore aux effets indésirables, ne sont pas structurées et donc difficilement mobilisables par les professionnels de santé.
Cas d’usage
“Je suis un pharmacien d’officine. Notre pharmacie est en rupture d’approvisionnement pour un médicament, et un patient vient avec une prescription pour celui-ci. Je dois trouver un médicament équivalent qui tienne compte de la situation clinique de ce patient et des médicaments qu’il prend déjà.”
Données
- Base de données publique des médicaments (BDPM) (en particulier Résumés des caractéristiques des produits)
- Avis de la commission de la transparence
Réalisation
Solution proposée
Rassembler et structurer les données pertinentes. Regrouper les médicaments similaires via l’estimation d’un degré de substituabilité. Intégrer les informations patient afin de prendre en compte le contexte clinique dans le choix du meilleur substitut.
Équipe adalab
Notre équipe était constituée d’un PhD, d’une ingénieure et de trois data scientists juniors. Voici les étapes de réalisation :
- Webscrapping pour la récupération des résumés des caractéristiques des produits (formats html et pdf)
- Extraction (via expressions régulières) des informations pertinentes pour l’analyse du texte (code ATM, indications thérapeutiques, contre indications, etc.)
- Développement d’algorithmes de NLP pour la structuration du texte et l’extraction de features (Nettoyage du texte, bag of words, word count)
- Développement d’algorithmes de Machine learning pour la classification des médicaments (annotation et modèles d’apprentissage)
Durée : 4 mois
Expertises engagées : web scrapping, NLP, machine learning