Préparer ses données avec Talend : 6 composants indispensables

lovelyanalytics_Talend.pngOn dit souvent que la préparation des données représente 75% du temps de travail d’un Data Scientist. Cela comprend le Data engineering qui consiste à transformer les données pour la création du modèle mais également une partie de data management plus classique. Pour préparer un dataset, souvent à partir de plusieurs sources de données, on peut utiliser un ETL (Extract Transform Load) qui s’avère plus pratique que les outils réservés à l’analyse. Parmi les ETL, je vous propose de tester Talend qui a l’avantage d’inclure une partie complètement gratuite, bien suffisante pour nos besoins de Data management.

Lire la suite de « Préparer ses données avec Talend : 6 composants indispensables »

Peut-on devenir Data scientist en suivant des MOOC?

lovelyanalytics-data-scientist

Aujourd’hui tout le monde veut devenir Data scientist et pourquoi? Parce que c’est le métier le plus sexy du XXIe siècle mais surtout, avouons le, parce que le salaire moyen d’un Data scientist est bien supérieur à celui des autres métiers de la Data. Sur internet on trouve plein de conseils pour devenir Data scientist, mais qu’en est-il vraiment, et comment devenir Data scientist?

Lire la suite de « Peut-on devenir Data scientist en suivant des MOOC? »