Consultant Freelance en Data spécialisé en IA, Machine Learning et Data Engineering. Je propose des solutions innovantes, optimise les flux de données et développe des outils d'IA impactants adaptés aux besoins métiers.
Développement et mise en production de modèles d'IA à grande échelle pour les collaborateurs et clients
Ingénieur ML
Ingénieur ML dans l'équipe Document AI
- Utilisation de Python, Azure Functions et FastAPI pour créer un framework RAG évolutif visant à fournir un point d'entrée facile pour le RAG dans toute l'entreprise
- cf. section Projets pour plus de détail sur les projets en cours
Développement de nouveaux POCs en IA, Management d'une équipe de 15 formateurs pour livrer 45 POCs aux collectivités françaises
Lead Tech
Lead Tech pour un programme de formation en IA
- Gestion d'une équipe formateurs et du développement de leurs projets dans les territoires
- Développement des templates de POC et ingénierie pédagogique
- 45 POCs pour les collectivités françaises
- Techniques d'IA état de l'art (Vision par ordinateur, NLP, Machine Learning, LLMs)
Enseignement de l'IA aux étudiants
Formateur IA
Enseignement à un groupe de 15 étudiants (L2 -> M2) les bases du développement en IA
- Une semaine de bootcamp pour aider les étudiants à construire leurs compétences
- 10 semaines de développement de POC
- 3 POCs livrés aux collectivités (Vision par ordinateur, Machine Learning et NLP)
Développement d'une application web utilisant chatGPT pour rédiger un pitch
Développeur IA
Formation sur l'état de l'art du Machine Learning
Formateur
Formation sur l'état de l'art de l'IA
Formateur
Professeur en informatique
Enseignant
Enseignement en collège et lycée
- Rédaction d'un programme annuel pour les élèves
- Suivi de leur progression
- Animation d'un club de codage
Développement d'un framework de RAG à destination des métiers pour leur permettre le déploiement rapide et facile d'une solution RAG clé en main
FastAPI
Azure
RAG
IA Générative
- Déploiement d'une Azure Function sur Azure
- Receuil du besoin métier et rédaction des spécifications
- Développement d'un framework complet à l'aide de FastAPI
Développement d'un projet de RAG à destination de Juristes. Cet outil permet en partant d'un question juridique de fournir une réponse basée sur des textes de lois pertinents, améliorant ainsi les capacités des juristes lors de temps d'échange avec les clients
RAG
Azure AI Search
HyDE
- Création d'une interface complète en Streamlit
- Récupération et prétraitement de l'ensemble des textes de lois/jurisprudences françaises
- Ingestion dans azure AISearch
- Orchestration de la mécanique de génération
- Optimisation du retrieval pour maximiser le taux de bonnes réponses
Génération de résumés de sinistres pour des juristes afin d'améliorer leur temps de prise de connaissance d'un dossier
IA Générative
Langchain
MapReduce
- Résumé des longues déclaration (> 8000 mots)
- Mise en place d'une mécanique de MapReduce (résumés de résumés) dans un pipeline existant
Modélisation et implémentation d'une base de données immobilière : POC pour une agence immobilière pour extraire des statistiques en analysant le marché immobilier
PostgreSQL
Docker
SQL
Excel (PowerQuery)
- Installation et configuration d'un serveur de base de données
- Modélisation d'une base de données
- Chargement des données dans une base de données
- Réalisation de requêtes SQL pour répondre à des problématiques métier
Optimisation de la gestion des données pour une boutique : Analyse des ventes pour un site de vente de vin
Python
Pandas
Plotly
- Recherche d'outliers dans les données
- Analyse multivariée
- Génération de graphiques
Analyser les ventes pour une librairie : Rapport d'activité pour une entreprise de vente en ligne
R
tidyverse
kable
- Analyse du chiffre d'affaires (basé sur le temps)
- Analyse des ventes
- Recherche de corrélations (âge client / catégories, etc.)
Réaliser une étude sur l'eau potable : Création d'un tableau de bord pour une ONG basé sur des données ouvertes
Tableau
- Analyse des besoins clients
- Mise en place d'un tableau de bord répondant aux attentes
- Génération de graphiques appropriés
Production d'une étude de marché pour une entreprise souhaitant s'exporter à l'international
Plotly
ScikitLearn
Kmeans
PCA
- Récupération d'open-data
- Exploration des données
- Clustering
- Rapport d'analyse
Détection de faux billets : Création d'un modèle de machine learning pour distinguer les faux billets
Numpy
ScikitLearn
Seaborn
- Modélisation des données numériques (dimensions des billets)
- Entraînement d'un modèle de régression logistique
Compétition Smart City : Analyser les arbres de la ville de Paris
Python
Seaborn
Plotly
- Analyse des données (corrélations, analyse descriptive)
- Traitement des données géographiques (création de cartes, heatmaps)
Préparer les données pour une organisation de santé publique : Nettoyage d'une base de données et entraînement d'un modèle de machine learning
Python
Pandas
ScikitLearn
Flask
- Nettoyage des données
- Imputation des données manquantes
- Analyse des valeurs aberrantes
- Analyse de la pertinence des variables
- ACP / ANOVA
- Visualisation des données
- Création d'un modèle de prédiction du nutriscore basé sur les données nutritionnelles
- Création d'une application web de présentation du modèle déployé
Construction d'un modèle de scoring pour une organisation bancaire afin de déterminer si un client peut obtenir un crédit
Python
ScikitLearn
- Analyse descriptive et nettoyage du jeu de données
- Feature engineering
- Tri des variables par importance
- Entraînement de plusieurs modèles avec comparaison
- GridSearch pour optimiser les hyperparamètres du meilleur modèle
- Validation croisée des modèles
Segmentation des clients d'un site e-commerce brésilien et calcul de la fréquence de mise à jour de cette segmentation
Python
ScikitLearn
- Analyse descriptive et nettoyage des données
- Feature engineering
- Utilisation d'algorithmes de clustering
- Simulation du vieillissement des données pour le calcul de la fréquence des mises à jour du modèle
Amélioration du produit IA d'une startup : Réalisation de topic modeling sur les avis restaurants et création d'un modèle de classification des photos basé sur les photos clients
Python
LDA
BERT
TensorFlow
Keras
- Scraping de données
- Traitement des avis avec LDA
- Traitement des avis avec BERTopic
- Classification d'images utilisant l'extraction de descripteurs avec ORB
- Classification d'images utilisant un CNN
Détection de Bad Buzz en utilisant le Deep Learning dans un ensemble de tweets. Entraînement d'un modèle pour l'analyse de sentiment sur un tweet
Python
GenSim
Transformers
BERT
TensorFlow
Keras
Flask
- Vectorisation du texte
- Lemmatisation / Stemming
- Embedding de texte avec Word2Vec, FastText, BERT
- Création d'un modèle LSTM avec Keras
- Entraînement du modèle et vérification des métriques
- Création d'une application web de présentation
Contribution à la conception d'une voiture autonome par la modélisation d'un système de segmentation d'images
Python
Segmentation-models
TensorFlow
PyTorch
Flask
- Création de TensorFlow Datasets
- Modélisation de 3 modèles (Linknet, PSPNet, Unet)
- Entraînement et comparaison des modèles
- Création d'une API pour appeler le modèle
- Création d'une application web de démonstration
Développement d'une application de recommandation de contenu pour un site de presse qui vise à fournir des recommandations pertinentes à ses utilisateurs
Python
ScikitLearn
Surprise
Implicit
Flask
Azure Functions
- Modélisation de deux moteurs de recommandation (Content-Based et Collaborative Filtering)
- Déploiement du modèle via Azure Functions
- Création d'une application web de démonstration
Développement d'un chatbot pour la réservation de vacances avec reconnaissance de différentes variables et stratégie de monitoring en production
Python
LUIS
Azure WebApp
Azure AppInsights
- Création, Entraînement et Déploiement d'une ressource Azure LUIS
- Développement du bot en utilisant le framework Microsoft
- Déploiement du bot sur une web app Azure
- Monitoring en production du bot avec Azure AppInsights
Préparation d'un dossier de présentation pour un projet de développement d'application mobile intégrant une fonctionnalité d'IA
Excel
Power Point
Simulation de dimensionnement Azure
- Présentation du projet
- Financement, gestion du budget prévisionnel
- Méthodologie Agile/SCRUM
- Évaluation des risques du projet
- Éthique de l'IA