Algorithmes distribués avec la librairie H2O

H2o
Librairie H2O machine learning

Algorithmes distribués avec la librairie H2O

En participant à un challenge sur Datascience.net, j’ai découvert le package H2O. Je voulais développer un réseau de neurones sous R et j’ai vite été limitée par le package Neralnet.

H2O c’est une librairie open source qui regroupe des algorithmes qui peuvent être appliqués sur des données massives et distribuées sur un environnement Hadoop. La librairie peut être utilisée directement à partir de Spark, R ou Python ce qui rend son utilisation vraiment simple pour les Data Scientists qui connaissent déjà ces langages.

H2O propose pas mal d’algorithmes supervisés et non supervisés : régression linéaire, logistique, ACP, k-means, random forest, gradient boosting … et l’algorithme que j’ai testé le Deep Learning.

h2o deep learning

L’utilisation de H2O est vraiment très simple et les tutoriels et explications disponibles sur leur site http://www.h2o.ai/#/ sont vraiment top. L’algorithme de Deep Learning peu vraiment être optimisé et personnalisé avec plusieurs paramètres. On peut par exemple choisir la fonction d’activation, le nombre de couches cachées et de neurones, des critères d’arrêt, le type de validation croisée,…

Finalement tous ces paramètres peuvent vite rendre l’utilisation du modèle plus complexe. L’algorithme peut être très performant mais il faut y passer du temps pour tuner cet algorithme.

En termes de performance rien à redire. Je l’ai utilisé sur un  petit volume de données en local c’est assez impressionnant par rapport au package neuralnet.

Perso je suis convaincue par ce package, je vais continuer de le tester pour les autres méthodes et sur d’autres problématiques.

 

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s