Logo Novagen

Actuellement en dernière année d’école d’ingénieur ou en université avec une spécialisation en informatique, data science ou big data, vous êtes à la recherche de votre stage de fin d’étude ?
Vous justifiez d’une première expérience (stage) en entreprise ou au sein d’un laboratoire de recherche sur des sujets liés au BigData où vous avez développé des compétences en développement informatique associé à des traitements ML (langages Scala, Python ou Java, SQL, No SQL, Hadoop, Hive, Spark D3.JS …).
Vous êtes rigoureux, curieux et proactif avec une réelle appétence pour les nouvelles technologies, les outils informatiques des bases de données.

Stage : Data Science  – Scraping & Text Mining

Objectif : 

Au sein de notre DataFactory, réaliser un process innovant d’extraction d’informations sur des données hétérogènes (OpenData, Web scrapping, Bases de données) et leur valorisation.

Activités :

  • Acquisition de données : Scrapper et extraire l’information des sources de données brutes,
  • Text mining : Sélectionner et mettre en œuvre les algorithmes de valorisation,
  • Création d’indicateurs : A partir des données collectées, extraire les informations pertinentes, détecter des topics, identifier des communautés d’intérêt, créer des recommandations.

Compétences mises en œuvre :

Machine Learning : Spacy, Gensim, Stanford NLP, et autres librairies de MachineLearning

BigData : Spark, Apache Zeppelin, ElasticSearch : pour passer les traitements à grande échelle.