Méthodes de régression linéaires

Modèles de Régression Linéaire13 octobre 2025
Practicar con esta ficha
Crea tus flashcards, tus cuestionarios, tu examen de prueba

Funciones avanzadas disponibles en la aplicación

  • Imágenes
  • Fórmulas matemáticas
  • Diagramas con renderizado profesional y académico en la app
Comenzar gratis

Fiche de Révision : Méthodes de Régression Linéaire Multiple


1. Introduction à la régression linéaire multiple

La régression linéaire multiple est un modèle statistique permettant de prédire une variable quantitative [Formule] à partir de plusieurs variables explicatives [Formule]. C’est une extension de la régression linéaire simple.

Modèle général
[Formule mathématique]
où :

  • [Formule] est la variable à expliquer,
  • [Formule] sont les coefficients inconnus à estimer,
  • [Formule] est un terme d’erreur aléatoire.

Hypothèses du modèle linéaire gaussien multiple

  • Les erreurs [Formule] sont indépendantes, identiquement distribuées selon une loi normale centrée [Formule].
  • Les erreurs sont indépendantes des variables explicatives.
  • Il y a [Formule] observations [Formule] avec [Formule].

Formulation matricielle

[Formule mathématique]

avec

  • [Formule] : vecteur des observations,
  • [Formule] matrice de dimensions [Formule] incluant la colonne de 1,
  • [Formule] vecteur des coefficients.

2. Estimation par les moindres carrés ordinaires (OLS)

L’objectif est de trouver [Formule] qui minimise la somme des carrés des écarts entre observations et prédictions :

[Formule mathématique]

où [Formule],
et [Formule] est le résidu.

Solution analytique :
[Formule mathématique]

Estimation des valeurs prédites :
[Formule mathématique]

Le hat matrix [Formule] permet de relier les observations aux prédictions.


3. Intervalles de confiance et tests de significativité

Tests globaux vs tests individuels

  • Test de Fisher (global) :
    Vérifie si au moins une variable explicative a un effet significatif.

    Hypothèses :
    [Formule mathématique]
    [Formule mathématique]

  • Test de Student (individuel) :
    Pour chaque variable [Formule], teste si son coefficient est nul.

    Hypothèses :
    [Formule mathématique]

Les tests reposent sur les hypothèses classiques du modèle (normalité, indépendance, homogénéité des variances).


4. Exemple d’application pratique

Jeu de données fictif

Variables :

  • [Formule] variables explicatives,
  • [Formule] variable réponse.

Observations extraites (extrait des 10 premiers individus) :

Indicex1x2x3y
1110.4111.24
212-0.1112.18
1025-1.9027.05

Analyse des corrélations

x1x2x3y
x11.00.0-0.0830.69
x20.01.0-0.130.64
x3-0.083-0.131.0-0.16
y0.690.64-0.161.0
  • [Formule] et [Formule] ont une corrélation positive notable avec [Formule].
  • [Formule] présente une faible corrélation négative.

Modèle estimé

Après ajustement par lm(y ~ x1 + x2 + x3) :

CoefficientEstimateStd. Errort valuep-value
(Intercept)1.382.100.6560.519
x14.430.479.46< 0.001 ***
x24.110.478.73< 0.001 ***
x3-0.040.14-0.260.794
  • [Formule] et [Formule] sont significatifs (***).
  • [Formule] n'est pas significatif.

Qualité du modèle

  • [Formule] ajusté : 0.8735 → 87,35% de la variance expliquée.
  • Test global très significatif (F-statistic p-value ≈ 0).

5. Validation du modèle

Avant d’interpréter les résultats, on vérifie les hypothèses :

  1. Indépendance des résidus : via graphiques des résidus.
  2. Normalité des résidus : test de Shapiro-Wilk (valeurs proches de 1 et p-value > 0.05 indiquent normalité).
  3. Homoscedasticité : dispersion constante des résidus selon les valeurs ajustées.

Exemple d’outil R :

  • plot(mlr, 1) : Résidus vs valeurs ajustées (pour homogénéité).
  • plot(mlr, 2) : QQ-plot pour normalité.
  • `shapiro.test(mlr[Formule]Y = X\beta + \varepsilon[Formule]\hat{\beta} = (X^T X)^{-1} X^T Y[Formule]\hat{Y} = X \hat{\beta}[Formule]R^2$ ajusté.

Cette fiche vous offre une base solide pour comprendre, calculer, tester et valider un modèle de régression linéaire multiple. Utilisez les outils statistiques et graphiques pour une analyse complète et outil d’aide à la décision.

Agent CTA Background

Transforma tu forma de aprender

Comenzar ahoraÚnete a miles de estudiantes que ya han transformado su aprendizaje