RENARD Vincent

Consultant Freelance en Data

Summary

Consultant Freelance en Data spécialisé en IA, Machine Learning et Data Engineering. Je propose des solutions innovantes, optimise les flux de données et développe des outils d'IA impactants adaptés aux besoins métiers.

Experience

May 2024 - Present

Développement et mise en production de modèles d'IA à grande échelle pour les collaborateurs et clients

Ingénieur ML

Ingénieur ML dans l'équipe Document AI

  • Utilisation de Python, Azure Functions et FastAPI pour créer un framework RAG évolutif visant à fournir un point d'entrée facile pour le RAG dans toute l'entreprise
  • cf. section Projets pour plus de détail sur les projets en cours
September 2023 - June 2024

Développement de nouveaux POCs en IA, Management d'une équipe de 15 formateurs pour livrer 45 POCs aux collectivités françaises

Lead Tech

Lead Tech pour un programme de formation en IA

  • Gestion d'une équipe formateurs et du développement de leurs projets dans les territoires
  • Développement des templates de POC et ingénierie pédagogique
  • 45 POCs pour les collectivités françaises
  • Techniques d'IA état de l'art (Vision par ordinateur, NLP, Machine Learning, LLMs)
February 2023 - June 2023

Enseignement de l'IA aux étudiants

Formateur IA

Enseignement à un groupe de 15 étudiants (L2 -> M2) les bases du développement en IA

  • Une semaine de bootcamp pour aider les étudiants à construire leurs compétences
  • 10 semaines de développement de POC
  • 3 POCs livrés aux collectivités (Vision par ordinateur, Machine Learning et NLP)
August 2023 - September 2023

Développement d'une application web utilisant chatGPT pour rédiger un pitch

Développeur IA

October 2023 - October 2023

Formation sur l'état de l'art du Machine Learning

Formateur

June 2023 - June 2023

Formation sur l'état de l'art de l'IA

Formateur

September 2019 - August 2021

Professeur en informatique

Enseignant

Enseignement en collège et lycée

  • Rédaction d'un programme annuel pour les élèves
  • Suivi de leur progression
  • Animation d'un club de codage

Open Source Projects

COVEA - Accélérateur RAG

November 2024 - Present

Développement d'un framework de RAG à destination des métiers pour leur permettre le déploiement rapide et facile d'une solution RAG clé en main

FastAPI
Azure
RAG
IA Générative
  • Déploiement d'une Azure Function sur Azure
  • Receuil du besoin métier et rédaction des spécifications
  • Développement d'un framework complet à l'aide de FastAPI

COVEA - JudiGPT

May 2024 - Present

Développement d'un projet de RAG à destination de Juristes. Cet outil permet en partant d'un question juridique de fournir une réponse basée sur des textes de lois pertinents, améliorant ainsi les capacités des juristes lors de temps d'échange avec les clients

RAG
Azure AI Search
HyDE
  • Création d'une interface complète en Streamlit
  • Récupération et prétraitement de l'ensemble des textes de lois/jurisprudences françaises
  • Ingestion dans azure AISearch
  • Orchestration de la mécanique de génération
  • Optimisation du retrieval pour maximiser le taux de bonnes réponses

COVEA - Judicible

May 2024 - Present

Génération de résumés de sinistres pour des juristes afin d'améliorer leur temps de prise de connaissance d'un dossier

IA Générative
Langchain
MapReduce
  • Résumé des longues déclaration (> 8000 mots)
  • Mise en place d'une mécanique de MapReduce (résumés de résumés) dans un pipeline existant

Laplace Immo

October 2021 - April 2022

Modélisation et implémentation d'une base de données immobilière : POC pour une agence immobilière pour extraire des statistiques en analysant le marché immobilier

PostgreSQL
Docker
SQL
Excel (PowerQuery)
  • Installation et configuration d'un serveur de base de données
  • Modélisation d'une base de données
  • Chargement des données dans une base de données
  • Réalisation de requêtes SQL pour répondre à des problématiques métier

Bottleneck

October 2021 - April 2022

Optimisation de la gestion des données pour une boutique : Analyse des ventes pour un site de vente de vin

Python
Pandas
Plotly
  • Recherche d'outliers dans les données
  • Analyse multivariée
  • Génération de graphiques

Lapage

October 2021 - April 2022

Analyser les ventes pour une librairie : Rapport d'activité pour une entreprise de vente en ligne

R
tidyverse
kable
  • Analyse du chiffre d'affaires (basé sur le temps)
  • Analyse des ventes
  • Recherche de corrélations (âge client / catégories, etc.)

Réaliser une étude sur l'eau potable : Création d'un tableau de bord pour une ONG basé sur des données ouvertes

Tableau
  • Analyse des besoins clients
  • Mise en place d'un tableau de bord répondant aux attentes
  • Génération de graphiques appropriés

The Singing Chicken

October 2021 - April 2022

Production d'une étude de marché pour une entreprise souhaitant s'exporter à l'international

Plotly
ScikitLearn
Kmeans
PCA
  • Récupération d'open-data
  • Exploration des données
  • Clustering
  • Rapport d'analyse

ONCFM

October 2021 - April 2022

Détection de faux billets : Création d'un modèle de machine learning pour distinguer les faux billets

Numpy
ScikitLearn
Seaborn
  • Modélisation des données numériques (dimensions des billets)
  • Entraînement d'un modèle de régression logistique

Data is for Good

May 2022 - November 2022

Compétition Smart City : Analyser les arbres de la ville de Paris

Python
Seaborn
Plotly
  • Analyse des données (corrélations, analyse descriptive)
  • Traitement des données géographiques (création de cartes, heatmaps)

Santé Publique France

May 2022 - November 2022

Préparer les données pour une organisation de santé publique : Nettoyage d'une base de données et entraînement d'un modèle de machine learning

Python
Pandas
ScikitLearn
Flask
  • Nettoyage des données
  • Imputation des données manquantes
  • Analyse des valeurs aberrantes
  • Analyse de la pertinence des variables
  • ACP / ANOVA
  • Visualisation des données
  • Création d'un modèle de prédiction du nutriscore basé sur les données nutritionnelles
  • Création d'une application web de présentation du modèle déployé

Ready to Spend

May 2022 - November 2022

Construction d'un modèle de scoring pour une organisation bancaire afin de déterminer si un client peut obtenir un crédit

Python
ScikitLearn
  • Analyse descriptive et nettoyage du jeu de données
  • Feature engineering
  • Tri des variables par importance
  • Entraînement de plusieurs modèles avec comparaison
  • GridSearch pour optimiser les hyperparamètres du meilleur modèle
  • Validation croisée des modèles

Olist

May 2022 - November 2022

Segmentation des clients d'un site e-commerce brésilien et calcul de la fréquence de mise à jour de cette segmentation

Python
ScikitLearn
  • Analyse descriptive et nettoyage des données
  • Feature engineering
  • Utilisation d'algorithmes de clustering
  • Simulation du vieillissement des données pour le calcul de la fréquence des mises à jour du modèle

Avis Restau

May 2022 - November 2022

Amélioration du produit IA d'une startup : Réalisation de topic modeling sur les avis restaurants et création d'un modèle de classification des photos basé sur les photos clients

Python
LDA
BERT
TensorFlow
Keras
  • Scraping de données
  • Traitement des avis avec LDA
  • Traitement des avis avec BERTopic
  • Classification d'images utilisant l'extraction de descripteurs avec ORB
  • Classification d'images utilisant un CNN

Air Paradis

May 2022 - November 2022

Détection de Bad Buzz en utilisant le Deep Learning dans un ensemble de tweets. Entraînement d'un modèle pour l'analyse de sentiment sur un tweet

Python
GenSim
Transformers
BERT
TensorFlow
Keras
Flask
  • Vectorisation du texte
  • Lemmatisation / Stemming
  • Embedding de texte avec Word2Vec, FastText, BERT
  • Création d'un modèle LSTM avec Keras
  • Entraînement du modèle et vérification des métriques
  • Création d'une application web de présentation

Future Vision Transport

May 2022 - November 2022

Contribution à la conception d'une voiture autonome par la modélisation d'un système de segmentation d'images

Python
Segmentation-models
TensorFlow
PyTorch
Flask
  • Création de TensorFlow Datasets
  • Modélisation de 3 modèles (Linknet, PSPNet, Unet)
  • Entraînement et comparaison des modèles
  • Création d'une API pour appeler le modèle
  • Création d'une application web de démonstration

My Content

May 2022 - November 2022

Développement d'une application de recommandation de contenu pour un site de presse qui vise à fournir des recommandations pertinentes à ses utilisateurs

Python
ScikitLearn
Surprise
Implicit
Flask
Azure Functions
  • Modélisation de deux moteurs de recommandation (Content-Based et Collaborative Filtering)
  • Déploiement du modèle via Azure Functions
  • Création d'une application web de démonstration

Fly Me

May 2022 - November 2022

Développement d'un chatbot pour la réservation de vacances avec reconnaissance de différentes variables et stratégie de monitoring en production

Python
LUIS
Azure WebApp
Azure AppInsights
  • Création, Entraînement et Déploiement d'une ressource Azure LUIS
  • Développement du bot en utilisant le framework Microsoft
  • Déploiement du bot sur une web app Azure
  • Monitoring en production du bot avec Azure AppInsights

Fashion-Insta

May 2022 - November 2022

Préparation d'un dossier de présentation pour un projet de développement d'application mobile intégrant une fonctionnalité d'IA

Excel
Power Point
Simulation de dimensionnement Azure
  • Présentation du projet
  • Financement, gestion du budget prévisionnel
  • Méthodologie Agile/SCRUM
  • Évaluation des risques du projet
  • Éthique de l'IA

Education

DataTalks.Club

January 2023 - April 2023

Certification Data Engineer

OpenClassrooms

May 2022 - November 2022

Bac +5 Ingénieur IA

OpenClassrooms

October 2021 - April 2022

Bac +3 Data Analyst

Université Lyon 2

September 2018 - July 2019

Bac +3 Licence Sciences de l'éducation

CNED

September 2016 - July 2018

Bac +2 BTS Systèmes Numériques option Informatique et Réseaux

Lycée Molière

Bac Baccalauréat Professionnel Photographie

Volunteer

Data For Good

January 2023 - January 2023
Consultant Data

Topic modeling pour Quota Climat

  • Génération de statistiques à partir des titres d'articles de presse

Data For Good

January 2023 - January 2023
Consultant Data

Data Engineering pour CarbonFight

  • Analyse du code existant
  • Transition vers un système plus robuste pour les pipelines de données et le stockage

Awards

3ème Place pour Kesk'IA saison 1 avec l'équipe de Nantes

Evolukid / Vivatech

3ème sur 21 POCs d'IA dans la compétition Kesk'IA organisée par Evolukid