RENARD Vincent

Consultant Freelance en Data

Summary

Consultant Freelance en Data spécialisé en IA, Machine Learning et Data Engineering. Je propose des solutions innovantes, optimise les flux de données et développe des outils d'IA impactants adaptés aux besoins métiers.

Experience

[+0000bjeca Objeca] - Present

Développement et mise en production de modèles d'IA à grande échelle pour les collaborateurs et clients

Ingénieur ML

Ingénieur ML dans l'équipe Document AI

  • Utilisation de Python, Azure Functions et FastAPI pour créer un framework RAG évolutif visant à fournir un point d'entrée facile pour le RAG dans toute l'entreprise
  • cf. section Projets pour plus de détail sur les projets en cours
[+0000bjeca Objeca] - [+0000bjeca Objeca]

Développement de nouveaux POCs en IA, Management d'une équipe de 15 formateurs pour livrer 45 POCs aux collectivités françaises

Lead Tech

Lead Tech pour un programme de formation en IA

  • Gestion d'une équipe formateurs et du développement de leurs projets dans les territoires
  • Développement des templates de POC et ingénierie pédagogique
  • 45 POCs pour les collectivités françaises
  • Techniques d'IA état de l'art (Vision par ordinateur, NLP, Machine Learning, LLMs)
[+0000bjeca Objeca] - [+0000bjeca Objeca]

Enseignement de l'IA aux étudiants

Formateur IA

Enseignement à un groupe de 15 étudiants (L2 -> M2) les bases du développement en IA

  • Une semaine de bootcamp pour aider les étudiants à construire leurs compétences
  • 10 semaines de développement de POC
  • 3 POCs livrés aux collectivités (Vision par ordinateur, Machine Learning et NLP)
[+0000bjeca Objeca] - [+0000bjeca Objeca]

Développement d'une application web utilisant chatGPT pour rédiger un pitch

Développeur IA

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Formation sur l'état de l'art du Machine Learning

Formateur

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Formation sur l'état de l'art de l'IA

Formateur

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Professeur en informatique

Enseignant

Enseignement en collège et lycée

  • Rédaction d'un programme annuel pour les élèves
  • Suivi de leur progression
  • Animation d'un club de codage

Open Source Projects

COVEA - Accélérateur RAG

[+0000bjeca Objeca] - Present

Développement d'un framework de RAG à destination des métiers pour leur permettre le déploiement rapide et facile d'une solution RAG clé en main

FastAPI
Azure
RAG
IA Générative
  • Déploiement d'une Azure Function sur Azure
  • Receuil du besoin métier et rédaction des spécifications
  • Développement d'un framework complet à l'aide de FastAPI

COVEA - JudiGPT

[+0000bjeca Objeca] - Present

Développement d'un projet de RAG à destination de Juristes. Cet outil permet en partant d'un question juridique de fournir une réponse basée sur des textes de lois pertinents, améliorant ainsi les capacités des juristes lors de temps d'échange avec les clients

RAG
Azure AI Search
HyDE
  • Création d'une interface complète en Streamlit
  • Récupération et prétraitement de l'ensemble des textes de lois/jurisprudences françaises
  • Ingestion dans azure AISearch
  • Orchestration de la mécanique de génération
  • Optimisation du retrieval pour maximiser le taux de bonnes réponses

COVEA - Judicible

[+0000bjeca Objeca] - Present

Génération de résumés de sinistres pour des juristes afin d'améliorer leur temps de prise de connaissance d'un dossier

IA Générative
Langchain
MapReduce
  • Résumé des longues déclaration (> 8000 mots)
  • Mise en place d'une mécanique de MapReduce (résumés de résumés) dans un pipeline existant

Laplace Immo

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Modélisation et implémentation d'une base de données immobilière : POC pour une agence immobilière pour extraire des statistiques en analysant le marché immobilier

PostgreSQL
Docker
SQL
Excel (PowerQuery)
  • Installation et configuration d'un serveur de base de données
  • Modélisation d'une base de données
  • Chargement des données dans une base de données
  • Réalisation de requêtes SQL pour répondre à des problématiques métier

Bottleneck

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Optimisation de la gestion des données pour une boutique : Analyse des ventes pour un site de vente de vin

Python
Pandas
Plotly
  • Recherche d'outliers dans les données
  • Analyse multivariée
  • Génération de graphiques

Lapage

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Analyser les ventes pour une librairie : Rapport d'activité pour une entreprise de vente en ligne

R
tidyverse
kable
  • Analyse du chiffre d'affaires (basé sur le temps)
  • Analyse des ventes
  • Recherche de corrélations (âge client / catégories, etc.)

Réaliser une étude sur l'eau potable : Création d'un tableau de bord pour une ONG basé sur des données ouvertes

Tableau
  • Analyse des besoins clients
  • Mise en place d'un tableau de bord répondant aux attentes
  • Génération de graphiques appropriés

The Singing Chicken

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Production d'une étude de marché pour une entreprise souhaitant s'exporter à l'international

Plotly
ScikitLearn
Kmeans
PCA
  • Récupération d'open-data
  • Exploration des données
  • Clustering
  • Rapport d'analyse

ONCFM

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Détection de faux billets : Création d'un modèle de machine learning pour distinguer les faux billets

Numpy
ScikitLearn
Seaborn
  • Modélisation des données numériques (dimensions des billets)
  • Entraînement d'un modèle de régression logistique

Data is for Good

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Compétition Smart City : Analyser les arbres de la ville de Paris

Python
Seaborn
Plotly
  • Analyse des données (corrélations, analyse descriptive)
  • Traitement des données géographiques (création de cartes, heatmaps)

Santé Publique France

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Préparer les données pour une organisation de santé publique : Nettoyage d'une base de données et entraînement d'un modèle de machine learning

Python
Pandas
ScikitLearn
Flask
  • Nettoyage des données
  • Imputation des données manquantes
  • Analyse des valeurs aberrantes
  • Analyse de la pertinence des variables
  • ACP / ANOVA
  • Visualisation des données
  • Création d'un modèle de prédiction du nutriscore basé sur les données nutritionnelles
  • Création d'une application web de présentation du modèle déployé

Ready to Spend

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Construction d'un modèle de scoring pour une organisation bancaire afin de déterminer si un client peut obtenir un crédit

Python
ScikitLearn
  • Analyse descriptive et nettoyage du jeu de données
  • Feature engineering
  • Tri des variables par importance
  • Entraînement de plusieurs modèles avec comparaison
  • GridSearch pour optimiser les hyperparamètres du meilleur modèle
  • Validation croisée des modèles

Olist

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Segmentation des clients d'un site e-commerce brésilien et calcul de la fréquence de mise à jour de cette segmentation

Python
ScikitLearn
  • Analyse descriptive et nettoyage des données
  • Feature engineering
  • Utilisation d'algorithmes de clustering
  • Simulation du vieillissement des données pour le calcul de la fréquence des mises à jour du modèle

Avis Restau

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Amélioration du produit IA d'une startup : Réalisation de topic modeling sur les avis restaurants et création d'un modèle de classification des photos basé sur les photos clients

Python
LDA
BERT
TensorFlow
Keras
  • Scraping de données
  • Traitement des avis avec LDA
  • Traitement des avis avec BERTopic
  • Classification d'images utilisant l'extraction de descripteurs avec ORB
  • Classification d'images utilisant un CNN

Air Paradis

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Détection de Bad Buzz en utilisant le Deep Learning dans un ensemble de tweets. Entraînement d'un modèle pour l'analyse de sentiment sur un tweet

Python
GenSim
Transformers
BERT
TensorFlow
Keras
Flask
  • Vectorisation du texte
  • Lemmatisation / Stemming
  • Embedding de texte avec Word2Vec, FastText, BERT
  • Création d'un modèle LSTM avec Keras
  • Entraînement du modèle et vérification des métriques
  • Création d'une application web de présentation

Future Vision Transport

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Contribution à la conception d'une voiture autonome par la modélisation d'un système de segmentation d'images

Python
Segmentation-models
TensorFlow
PyTorch
Flask
  • Création de TensorFlow Datasets
  • Modélisation de 3 modèles (Linknet, PSPNet, Unet)
  • Entraînement et comparaison des modèles
  • Création d'une API pour appeler le modèle
  • Création d'une application web de démonstration

My Content

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Développement d'une application de recommandation de contenu pour un site de presse qui vise à fournir des recommandations pertinentes à ses utilisateurs

Python
ScikitLearn
Surprise
Implicit
Flask
Azure Functions
  • Modélisation de deux moteurs de recommandation (Content-Based et Collaborative Filtering)
  • Déploiement du modèle via Azure Functions
  • Création d'une application web de démonstration

Fly Me

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Développement d'un chatbot pour la réservation de vacances avec reconnaissance de différentes variables et stratégie de monitoring en production

Python
LUIS
Azure WebApp
Azure AppInsights
  • Création, Entraînement et Déploiement d'une ressource Azure LUIS
  • Développement du bot en utilisant le framework Microsoft
  • Déploiement du bot sur une web app Azure
  • Monitoring en production du bot avec Azure AppInsights

Fashion-Insta

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Préparation d'un dossier de présentation pour un projet de développement d'application mobile intégrant une fonctionnalité d'IA

Excel
Power Point
Simulation de dimensionnement Azure
  • Présentation du projet
  • Financement, gestion du budget prévisionnel
  • Méthodologie Agile/SCRUM
  • Évaluation des risques du projet
  • Éthique de l'IA

Education

DataTalks.Club

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Certification Data Engineer

OpenClassrooms

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Bac +5 Ingénieur IA

OpenClassrooms

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Bac +3 Data Analyst

Université Lyon 2

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Bac +3 Licence Sciences de l'éducation

CNED

[+0000bjeca Objeca] - [+0000bjeca Objeca]

Bac +2 BTS Systèmes Numériques option Informatique et Réseaux

Lycée Molière

Bac Baccalauréat Professionnel Photographie

Volunteer

Data For Good

[+0000bjeca Objeca] - [+0000bjeca Objeca]
Consultant Data

Topic modeling pour Quota Climat

  • Génération de statistiques à partir des titres d'articles de presse

Data For Good

[+0000bjeca Objeca] - [+0000bjeca Objeca]
Consultant Data

Data Engineering pour CarbonFight

  • Analyse du code existant
  • Transition vers un système plus robuste pour les pipelines de données et le stockage

Awards

3ème Place pour Kesk'IA saison 1 avec l'équipe de Nantes

Evolukid / Vivatech

3ème sur 21 POCs d'IA dans la compétition Kesk'IA organisée par Evolukid