×
Hakim Cheikh

Hakim Cheikh

Data Scientist

Nantes, FR
06 27 29 46 91
fr, Anglais, Français

Background


About

About

Ingénieur en informatique et sciences des données, je suis passionné par la programmation et l'intelligence artificielle.
J'accompagne les entreprise dans leurs projets de machine learning, en intervenant dans toutes les étapes du cycle de vie des produits : de la conception au déploiement en production des modèles.

Au cours de mes 7 années d'expérience en tant que Data Scientist, j'ai eu la chance d'intervenir sur des projets aux thématiques variés : traitement du langage naturel, détection de fraudes, modélisation d'affluence ou encore médecine prédictive.

Si vous cherchez un partenaire pour votre prochain projet d'intelligence artificiel, je serais ravi de discuter de la façon dont je peux vous aider.

Work Experience

Work Experience

  • Data ScientistVALEURIAD - l'Expertise IT 100% Nantaise

    Jul, 2022 - Present

    • Consultant Data Scientist en mission chez France Travail en tant que Lead Data Scientist.
    • Réalisation de suivi de collaborateurs.
    • Rédaction de réponses à des appels d'offres.
    • Conférencier (Meetup, Printemps de la Tech, West Data Festival).
  • Lead Data ScientistFrance Travail

    Jul, 2022 - Present

    Depuis 2016, France Travail a développé son département IA (Agence Dataservices) dans le but de concevoir des services valorisant les données du marché de l'emploi, au service des usagers. Lead Data Scientist au sein de ce département, j’ai pu intervenir sur de nombreux sujets IA (NLP, Recommandation, etc…) de la conception à la mise en production, ainsi que sur la mise à disposition de plusieurs enablers data (templates, active learning, brique d’explicabilité, …).

    Calcul d'embeddings pour les compétences et les métiers du référentiel de France Travail.
    Technologies utilisées :

    • Python
    • Fasttext
    • Hive

    Entrainement de modèles d'embedding de phrase pour la recherche de compétences et de métiers.
    Technologies utilisées :

    • Python
    • Sentence-Transformers
    • HuggingFace
    • LLM

    Extraction de compétences dans des textes de formation et d'offres d'emploi.
    Technologies utilisées :

    • Python
    • HuggingFace
    • Spacy
    • Mlflow

    Réalisation d'agents conversationnels.
    Technologies utilisées :

    • Python
    • LLM
    • Streamlit

    Réalisation d'un service de recommandation d'évènements.

    • Python
    • Solr
    • Sentence-Transformer
    • LLM

    Réalisations d'API d'exposition des modèles.
    Technologies utilisées :

    • FastAPI
  • Data ScientistLINCOLN

    Nov, 2018 - Mar, 20223 years 4 months

  • Ingénieur MLOpsSNCF

    Mar, 2021 - Feb, 202211 months

    Avec plus de 10 millions de données récoltées quotidiennement, la data et l’IA sont au cœur des priorités du groupe SNCF. Ingénieur MLOps au sein du pôle Data & Innovation, j'ai pu accompagner la refonte des cas d'usage d'intelligence artificiel dans un contexte de migration sur le cloud azure.

    • Ordonnancement des traitements
    • Versioning des modèles et des données
    • Monitoring des traitements
    • Maintien en condition opérationnelle des traitements quotidiens
    • Structuration des projets de data science

    Technologies : Python / SQL / Azure / Rundeck / Datadog

  • Data ScientistRATPgroup

    Sep, 2019 - Apr, 20211 year 7 months

    Réalisation d'un outil de cartospondance permettant de calculer les trajets historiques des bus à partir de leurs positions GPS :

    • Réalisation d'un algorithme de cartospondance en langage Python.
    • Optimisation du temps de calcul pour permettre le traitement quotidien de toutes les données GPS des bus.
    • Déploiement de l'outil dans un environnement de production.

    Modélisation de l'affluence dans les stations de métro et de RER :

    • Conception d'un modèle prédictif de fréquentation en langage R.
    • Déploiement du modèle dans un environnement de production.

    Langages et outils :

    • Python
    • R
    • Amazon AWS (lambda, Athena, ...)
    • redis
    • Mongo DB
    • Elasticsearch
    • Kibana
  • Data ScientistAutorité des marchés financiers (AMF) – France

    Jan, 2019 - Sep, 20198 months

    l'Autorité des Marchés Financiers explore le potentiel de l'intelligence artificielle pour renforcer la surveillance des marchés et la protection des investisseurs. Data Scientist au sein de cette institution, j’ai contribué à la réalisation de plusieurs preuves de concept autour du traitement du langage naturel (NLP) et de la détection de fraudes, de la phase de conception à l'évaluation des performances.

  • Stage de développement webSmile Open Source Solutions

    Apr, 2018 - Sep, 20185 months

    Développement, suivi et maintenance de deux projets web pour le compte de Nantes Métropole :

    • Le projet de création d'un portail dédié à la responsabilité sociétale des entreprises
    • Le projet de fusion des sites nantes.fr et nantesmetropole.fr

    Langages et outils :

    • Java EE
    • CMS Jahia
    • Play framework
    • Framework Scrum
  • Étude : Machine learning pour la détection de doublons dans des bases de données, Centrale Nantes Études

    Nov, 2017 - Jan, 20182 months

    Réalisation d'une étude visant à définir et implémenter une méthode de dédoublonnage de bases de données à l'aide d'algorithmes de Machine Learning.

    Langages et outils :
    Python / Bash / XGBoost

  • Stage de recherche et développement en médecine prédictivePhilips

    Nov, 2016 - Apr, 20175 months

    Stage de recherche visant à créer un outil d'estimation des risques de chutes chez les personnes âgées.

    Travail effectué :
    ♦ Traitement de données accélérométriques
    ♦ Extraction de routines
    ♦ Développement d'un estimateur du risque de chute

    Outils :
    Topic Modeling / Machine Learning (Classification)

    Langages :
    Matlab / Shell / Python

  • Stage de recherche en vision par ordinateur, Institut de Recherche en Sciences et Techniques de la Ville

    Apr, 2016 - Aug, 20164 months

    Développement d’algorithmes de reconnaissance automatique d’objets 3D par méthodes d’apprentissage.

    Travail effectué :
    ♦ Constitution d'une banque d'images labellisés
    ♦ Développement d'un outil de reconnaissance d'objet
    ♦ Extraction d'informations caractéristiques des objets recherchés depuis un flux vidéo

    Outils :
    Image Processing / Machine Learning / Computer Vision

    Langage :
    Matlab

  • Professeur de mathématiques particulierAcadomia

    Sep, 2014 - Apr, 20161 year 7 months

    Soutient et suivi scolaire d'un élève, pendant son année de Terminale Scientifique et de première année de classe préparatoire mathématiques-physique.

Projects Experience

Projects Experience

  • Analyse d'images hyperspectrales couplées avec des données LIDAR pour la surveillance de l'environnement litoral

    Nov, 2015 - Apr, 20165 months

  • Travail d’Initiative Personnel Encadré : Réseaux de neurones informatique et théorie des jeux

    Dec, 2013 - Dec, 20141 year

Skills

Skills

  • Traitement du langage
  • Intelligence artificielle (IA)
  • Vision par ordinateur
  • Modélisation prédictive
  • Langage HiveQL
  • Big Data
  • SQL
  • Ensemble de compétences techniques
  • ElasticSearch
  • Machine learning
  • Analyse de données
  • Google App Engine
  • Dataiku DSS
  • Matlab
  • Hadoop
  • IA générative
  • Java
  • GitHub
  • Python (langage de programmation)
  • Traitement de l'image
  • Modélisation des données
  • Travail d’équipe
  • Machine Learning Operations (MLOps)
  • Ateliers d’équipe
  • Elastic Stack (ELK)
  • Git
  • Informatique
  • MySQL
  • JavaScript
  • PostgreSQL
  • Optimisation
  • Visualisation de données
  • Résolution de problèmes
  • Conception de modèles
  • Bonnes pratiques (GxP)
  • Algorithmes
  • R
  • Neo4j
  • Apprentissage automatique
  • Développement web back-end
  • Python
  • Linux
  • Programmation
  • SQLite
  • Hive
  • HTML5
  • Traitement automatique du langage naturel
  • Recherche et développement (R et D)
  • Datasets
  • Anglais
Education

Education

  • « Sciences des données », « Informatique », « Ville Durable », Diplôme d'ingénieur, Ecole centrale de Nantes

    Dec, 2014 - Dec, 2018

    Analyse et représentation des signaux

    Analyse et traitement de l'image

    Bases de données

    Fouille de données

    Génie Logiciel

    Mathématiques discrètes (Théorie du codage, de la compression / Théorie des graphes)

    Méthodologie du développement (Gestion de projets informatiques)

    Contrôle non destructif

    Identification de Systèmes et Filtrage de Signaux

    Machine Learning

  • (Maths/Physique), MPSI - MP*, Lycée Malherbe

    Dec, 2011 - Dec, 2014

  • Spécialité Mathématiques, Baccalauréat Scientifique, spécialité Mathématiques, Lycée Malherbe

    Dec, 2008 - Dec, 2011

Certificates

Certificates

Volunteer Work

Volunteer Work

  • Animateur, La Fresque du Climat

    Jun, 2019 - Jun, 2021

  • Bénévole, Les Shifters

    Sep, 2018 - Sep, 2020

  • Tuteur, BRIO

    Nov, 2014 - Apr, 2016

    Programme d’ouverture sociale et d’égalité des chances, mis en place afin d’apporter, au niveau local, une réponse aux questions de diversité et d’accès au savoir pour tous.

  • Acoompagnateur, La main à la Pâte

    Oct, 2014 - Oct, 2015

    Association visant à assister les enseignants dans la mise en oeuvre d’une pédagogie d’investigation stimulant chez les élèves : esprit scientifique, compréhension du monde et capacités d’expression.