Prédiction en régression clusterwise PLS - Archive ouverte HAL Access content directly
Conference Papers Year :

Prédiction en régression clusterwise PLS

(1) , (2) , (1)
1
2

Abstract

Clusterwise linear regression aims at partitioning data sets into clusters characterized by their specific coefficients in a linear regression model. High dimensional data and/or the case of multicollinearity can be handled using clusterwise PLS regression based on components which are linear combinations of the initial predictors. The corresponding local PLS models can be used for prediction purpose once the cluster membership of a future observation is determined. The PLS components are related to the clusters and then may differ from one cluster to another. Therefore they cannot be directly used for the cluster membership determination. We propose to use a discriminant analysis on a selected set of principal components from the PCA of the predictors. The method is illustrated on synthetic data.
En régression, lorsque les individus présentent une structure en groupes inconnus a priori, les méthodes de régression typologique ou clusterwise permettent d'ap-porter une réponseà travers la recherche simultanée d'une partition des données en un nombre fixé de classes et le modèle de régression local associéà ces classes. La régression clusterwise PLS permet une extension au cas de données de grande dimension et/ou forte-ment corréléesà travers la détermination de combinaisons linéaires des variables initiales. Se pose alors le problème de la prédictionà partir des modèles locaux en particulier en cas de grande dimension. En effet les composantes PLS sont différentes d'une classeà l'autre et ne peuvent doncêtre utilisées directement pour déterminer la classe d'appartenance d'un nouvel individu. Nous proposons pour cela d'effectuer une analyse discriminante sur une sélection de composantes principales issues d'une ACP sur les prédicteurs. La méthode proposée est illustrée sur des données simulées.
Fichier principal
Vignette du fichier
NiangBougeardSaportaJdS2016.pdf (175.71 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-02500605 , version 1 (06-03-2020)

Identifiers

  • HAL Id : hal-02500605 , version 1

Cite

Ndèye Niang, Stéphanie Bougeard, Gilbert Saporta. Prédiction en régression clusterwise PLS. 48 èmes Journées de Statistique, May 2016, Montpellier, France. ⟨hal-02500605⟩
50 View
115 Download

Share

Gmail Facebook Twitter LinkedIn More