Résumé:
Les maladies respiratoires constituent un défi sanitaire mondial majeur, nécessitant
des outils diagnostiques rapides, fiables et accessibles. L’analyse audio des sons de toux
offre une alternative non invasive prometteuse. Ce projet vise à développer un système
basé sur l’intelligence artificielle pour la classification automatisée des maladies respira-
toires à partir de l’audio de la toux, en utilisant le jeu de données COUGHVID annoté
par des experts.
Face aux défis tels que la variabilité acoustique et le bruit, nous avons exploré diverses
techniques de prétraitement et d’extraction de caractéristiques, en nous concentrant sur
la combinaison des coefficients MFCC et des spectrogrammes Mel. Plusieurs modèles de
classification ont été entraînés et évalués sur ces caractéristiques.
Notre approche méthodologique a abouti à la sélection d’un modèle XGBoost opti-
misé comme étant le plus performant. Les expériences menées ont rigoureusement validé
son efficacité : le modèle XGBoost final a atteint une précision remarquable de 98.01%
sur l’ensemble de test (et 97.51% en validation) pour la classification des conditions res-
piratoires basées sur les diagnostics experts. Ces résultats surpassent significativement
ceux d’autres modèles testés, tels que Random Forest (96.20% test) et les approches
d’Apprentissage Profond standard (94.12% test).
Ce travail contribue une méthodologie optimisée combinant des caractéristiques acous-
tiques pertinentes (MFCC + Mel-spectrogramme) avec un classificateur XGBoost per-
formant, démontrant une haute précision sur des données validées cliniquement. Ces
résultats soulignent le potentiel de l’analyse audio de la toux pour développer des outils
de dépistage évolutifs et économiques, renforçant ainsi la télémédecine et les stratégies
de santé publique.