Classification ascendante hiérarchique (CAH)

Apprenez à utiliser simplement une CAH en comprenant le fonctionnement de l’algorithme.

Image d'un dendrogramme

Le tout premier article qui expliquait la CAH sur lovelyanalytics.com date de 2017… il était temps pour moi de faire quelques modifications et d’enrichir un peu tout ça. Je vous propose donc une nouvelle version pour ceux qui avaient déjà lue la précédente.

La classification ascendante hiérarchique est un algorithme de machine learning de la catégorie non supervisée. Comme les k-means, elle permet d’identifier des groupes homogènes dans une population, on parle aussi de clustering. C’est une de mes méthodes préférées. Nous allons voir quels sont ses avantages et inconvénients, quand l’utiliser avec des explications simples sur son fonctionnement.

Lire la suite de « Classification ascendante hiérarchique (CAH) »