[Interview] De l’astronomie à l’e-reputation, entre simulation de l’Univers et traitements de données massives

3 questions à Francesca,
Nouvelle Responsable R&D de Data-Observer

francesca_iannuzziFrancesca a rejoint récemment Data-Observer. Ne vous y trompez pas, issue du monde universitaire, ses connaissances en matière d’astronomie et de gestion des données s’inscrivent intrinsèquement dans l’univers du Big Data, et donc de la veille du web.

En quelques mots, quel est ton parcours ?

Je viens d’achever 6 années de recherche fondamentale en astronomie. Plus spécifiquement, mon travail portait sur la simulation de la structure de l’Univers à grande échelle et avait donc une forte connotation computationnelle. Intriguée par la frénésie croissante autour du buzz word “Data Science”, j’ai profité de nombreux MOOC pour plonger davantage dans ce domaine. Le croisement entre statistiques, gestion de données massives, programmation et visualisation des résultats m’a captivée et m’a ouvert un nouvel horizon professionnel.

En quoi tes compétences s’inscrivent-elles dans l’univers de la veille ?

Principalement en termes de traitement de données. Je m’occupe de développer les méthodes d’analyse de textes collectés sur le Web, de façon à en extraire automatiquement les informations souhaitées. Ce travail nécessite des compétences en traitement automatique du langage, TAL dans le jargon, et un intérêt prononcé pour les innovations dans ce domaine. J’ai pour cela un contact privilégié avec la communauté scientifique et les institutions de recherche. Cet aspect et la méthodologie qui règle toute démarche scientifique sont à la base de ma formation, comme, également, la programmation et l’analyse statistique de données massives. Finalement, mon expérience dans la vulgarisation scientifique est un atout pour ce qui concerne la restitution intelligente de données.

Quels sont les premiers projets sur lesquels tu évolues en rejoignant Data-Observer ?

Plusieurs, de la gestion des relations avec le monde de la recherche à des taches plus techniques de développement. L’essentiel de mon travail reste par contre la recherche et développement dans le TAL, pour permettre l’intégration dans les offres Data Observer de nouvelles fonctionnalités et pour que la qualité de l’analyse des données collectées soit perpétuellement améliorée. Actuellement je m’intéresse particulièrement  aux problématiques de détection de mots clés en très grand nombre et à l’analyse des sentiments contenus dans un texte.

Merci pour ces réponses Francesca et de la part de toute l’équipe Data-Observer : Bienvenue !