Regression Logistique Python

Introduction: La régression logistique est un algorithme d'apprentissage supervisé qui est utilisé lorsque la variable cible est catégorique. La fonction hypothétique h (x) de la régression linéaire prédit des valeurs illimitées. Mais dans le cas de la régression logistique, où la variable cible est catégorique, nous devons restreindre la plage des valeurs prédites. Prenons un problème de classification, où nous devons classer si un e-mail est un spam ou non. Ainsi, la fonction hypothétique de la régression linéaire ne peut pas être utilisée ici pour prédire car elle prédit des valeurs non liées, mais nous devons prédire 0 ou 1. Pour ce faire, nous appliquons la fonction d'activation sigmoïde sur la fonction hypothétique de régression linéaire. La fonction hypothétique résultante pour la régression logistique est donc donnée ci-dessous: h (x) = sigmoïde (wx + b) Ici, w est le vecteur de poids. x est le vecteur de caractéristiques. Regression logistique python program. b est le biais. sigmoïde (z) = 1 / (1 + e (- z)) Intuition mathématique: La fonction de coût de la régression linéaire (ou erreur quadratique moyenne) ne peut pas être utilisée dans la régression logistique car il s'agit d'une fonction non convexe des poids.
  1. Regression logistique python program

Regression Logistique Python Program

Pour mettre en place cet algorithme de scoring des clients, on va donc utiliser un système d'apprentissage en utilisant la base client existante de l'opérateur dans laquelle les anciens clients qui se sont déjà désabonnés ont été conservés. Afin de scorer de nouveaux clients, on va donc construire un modèle de régression logistique permettant d'expliquer et de prédire le désabonnement. Notre objectif est ici d'extraire les caractéristiques les plus importantes de nos clients. Les outils en python pour appliquer la régression logistique Il existe de nombreux packages pour calculer ce type de modèles en python mais les deux principaux sont scikit-learn et statsmodels. Scikit-learn, le package de machine learning Scikit-learn est le principal package de machine learning en python, il possède des dizaines de modèles dont la régression logistique. Implémentation de la régression logistique à partir de zéro en utilisant Python – Acervo Lima. En tant que package de machine learning, il se concentre avant tout sur l'aspect prédictif du modèle de régression logistique, il permettra de prédire très facilement mais sera pauvre sur l'explication et l'interprétation du modèle.

Introduction à la régression logistique La régression logistique est un algorithme de classification d'apprentissage supervisé utilisé pour prédire la probabilité d'une variable cible. La nature de la variable cible ou dépendante est dichotomique, ce qui signifie qu'il n'y aurait que deux classes possibles. En termes simples, la variable dépendante est de nature binaire ayant des données codées soit 1 (signifie succès / oui) ou 0 (signifie échec / non). Mathématiquement, un modèle de régression logistique prédit P (Y = 1) en fonction de X. La régression logistique, qu’est-ce que c’est ?. C'est l'un des algorithmes ML les plus simples qui peut être utilisé pour divers problèmes de classification tels que la détection de spam, la prédiction du diabète, la détection du cancer, etc. Types de régression logistique Généralement, la régression logistique signifie la régression logistique binaire ayant des variables cibles binaires, mais il peut y avoir deux autres catégories de variables cibles qui peuvent être prédites par elle. Sur la base de ce nombre de catégories, la régression logistique peut être divisée en types suivants - Binaire ou binomial Dans un tel type de classification, une variable dépendante n'aura que deux types possibles, soit 1 et 0.

July 5, 2024