Développer une pipeline de traitement avec Delta Lake et Airflow déployée sur OVHCloud Résumé : Rendre ses Data Lake plus vivants, alignés avec les cycles de vie des données et les exigences de réactivité des équipes métier. Ce défi est à portée de main avec...
Automatiser l’extraction d’informations d’un PDF Rapports internes, documents administratifs, bilans, plaquettes informationnelles, etc. Une société a souvent à sa disposition de nombreux documents PDFs riches en données. Pourtant ces documents sont souvent...
Une nouvelle ère émerge dans le domaine de l’Aide à la décision. La BI a déployé ses lettres de noblesse au cours des 2 dernières décennies mais de nouveaux acteurs poussent et vont révolutionner les usages de la BI traditionnelle. Apache Kylin est probablement une...
Aujourd’hui les équipes Novagen vous présentent une infographie sur l’outil de prédilection des data scientists : le Notebook, plus particulièrement sur Jupyter et Apache Zeppelin qui sont les notebooks les plus répandus au sein des data labs (où...