Gradient Boosting, comment ça marche?

gradient-boosting

Après le Bagging et l’algorithme Random Forest j’avais envie de creuser un peu plus le boosting avec le cas particulier de l’algorithme Gradient Boosting Machine (GBM).

Il s’agit là encore d’une méthode d’agrégation de modèles et je vous propose de découvrir le principe de fonctionnement de cet algorithme.

Lire la suite de « Gradient Boosting, comment ça marche? »

k-means, comment ça marche?

k-means


Le k-means est un algorithme de clustering, en d’autres termes il permet de réaliser des analyses non supervisées, d’identifier un pattern au sein des données et de regrouper les individus ayant des caractéristiques similaires. C’est une méthode simple et rapide.

Le cas d’usage le plus classique pour les méthodes de clustering c’est la segmentation client. On peut aussi les utiliser de manière plus descriptive pour comprendre et synthétiser une population. En revanche, pour construire une segmentation client robuste, avec plusieurs axes je vous recommande plutôt d’utiliser la classifiation ascendante hiérarchique ou la méthode mixte. Lire la suite de « k-means, comment ça marche? »

Random Forest, comment ça marche?

Random Forest

Dans cet article je vous explique simplement comment fonctionne un algorithme de Random Forest (forêt aléatoire) pour faire de la prédiction. Quand et comment l’utiliser, c’est par ici …

Lire la suite de « Random Forest, comment ça marche? »

Qu’est ce que le Process Mining?

Le process Mining est une combinaison des méthodes de BPM et de datamining

process-mining

Le Process Mining est une discipline qui se positionne entre l’analyse de processus (BPM) et l’analyse de données (machine learning, big data,…)

Pour faire simple c’est le fait d’utiliser des méthodes d’analyse de données sur des problématiques liées à un processus pour l’optimiser. Lire la suite de « Qu’est ce que le Process Mining? »