Comment utiliser Spark-NLP depuis une EMR ? Spark NLP est une excellente collection d’algorithmes de transformation et d’analyse de texte. Cependant, utiliser des librairies tierces dans un cluster Hadoop+Spark requiert un peu de technicité. Nous vous...
Nous vous présentons un sujet que nous avons mené au Lab Novagen pour le compte d’un de nos clients: L’utilisation d’un modèle de régression multiple pour prédire un phénomène de type ‘série temporelle’. Cette démarche a été élaborée pour...
Aujourd’hui les équipes Novagen vous présentent une infographie sur l’outil de prédilection des data scientists : le Notebook, plus particulièrement sur Jupyter et Apache Zeppelin qui sont les notebooks les plus répandus au sein des data labs (où...