Régression multibloc sur classes latentes. Application à l’usage d’antibiotiques en élevages de lapins - Cnam - Conservatoire national des arts et métiers Accéder directement au contenu
Article Dans Une Revue Epidémiologie et Santé Animale Année : 2019

Régression multibloc sur classes latentes. Application à l’usage d’antibiotiques en élevages de lapins

Résumé

The statistical processing of analytical epidemiological data aims to determine the risk factors for a disease or veterinary public health problem. To meet this objective, generalized linear models are used. For observations from different sub-populations, these models exist as latent class models, also known as mixture models. However, in veterinary epidemiology in particular, these methods have three main limitations: (i) the number of observations in a sub-population must be greater than the number of variables, (ii) the variables must have a multi-normal distribution, and (iii) the variables must not have strong multi-collinearity, these hypotheses being rarely satisfied in practice. We propose an extension of the mixture models for a large number of variables that do not satisfy distributional hypothesis. These variables may also have the particularity of being organized into thematic blocks. The proposed method is called multiblock regression on latent classes. It combines the simultaneous search for sub-populations within the observations, as well as local (multiblock) regression models associated with each of these sub-populations. This new method is applied, for example, to the search for risk indicators for antibiotic consumption in French rabbit farms.
Le traitement statistique des données d'épidémiologie analytique vétérinaire vise à déterminer les facteurs de risque d'une maladie ou d'un problème de santé publique vétérinaire. Pour répondre à cet objectif, les modèles linéaires généralisés sont utilisés. Pour le cas où les observations proviennent de différentes sous-populations, ces modèles existent sous forme de modèles sur classes latentes, aussi connus sous le nom de modèles de mélange. Cependant, en épidémiologie vétérinaire notamment, ces méthodes présentent trois principales limites : (i) le nombre d'observations dans une sous-population doit être plus grand que nombre de variables, (ii) les variables doivent présenter une distribution multinormale, et (iii) les variables ne doivent pas présenter de multi-colinéarité marquées, ces hypothèses étant rarement vérifiées en pratique. Nous proposons une extension des modèles sur classes latentes pour le cas d'un grand nombre de variables ne vérifiant pas d'hypothèse distributionnelle. Ces variables peuvent présenter, de plus, la particularité d'être organisées en blocs thématiques. La méthode proposée est appelée régression multibloc sur classes latentes. Elle combine la recherche simultanée de sous-populations au sein des observations, ainsi que de modèles de régression (multibloc) locaux associés à chacune de ces sous-populations. Cette nouvelle méthode est appliquée, à titre d'exemple, à la recherche de marqueurs de risque de l'utilisation des antibiotiques dans des élevages français de lapins. Mots-clés : Epidémiologie analytique, facteurs de risque, modèles de mélange, régression sur classes latentes, utilisation d'antibiotiques, lapin.
Fichier principal
Vignette du fichier
AAEMA2019.pdf (961.21 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02919886 , version 1 (24-08-2020)

Identifiants

  • HAL Id : hal-02919886 , version 1

Citer

Stéphanie Bougeard, Claire Chauvin, Gilbert Saporta, Ndèye Niang. Régression multibloc sur classes latentes. Application à l’usage d’antibiotiques en élevages de lapins. Epidémiologie et Santé Animale, 2019, 76, pp.43-53. ⟨hal-02919886⟩
128 Consultations
147 Téléchargements

Partager

Gmail Facebook X LinkedIn More