Modéliser et implémenter une base de données immobilières : POC Pour une agence immobilière afin de tirer des statistiques en analysant le marché immobilier
PostgreSQL
Docker
SQL
Excel (PowerQuery)
- Installer et configurer un serveur de BDD
- Modéliser une base de données
- Charger des données dans une base de données
- Effectuer des requêtes SQL pour répondre à une problématique métier
Optimiser la gestion des données d'une boutique : Analyse des ventes d'un site de vente de vins
Python
Pandas
Plotly
- Recherche d'outliers dans les données
- Analyse multivariée
- Génération de graphiques
Analyser les ventes d'une librairie : Rapport d'activité d'une entreprise de vente en ligne
R
tidyverse
kable
- Analyse du chiffre d'affaire ( en fonction du temps )
- Analyse des ventes
- Recherche de corrélation (âge des clients / catégories etc…)
Faites une étude sur l'eau potable : Création d'un dashboard pour une ONG en se basant sur de l'openData
Tableau
- Analyse du besoin client
- Mise en place d'un tableau de bord répondant aux attentes
- Génération de graphiques adaptés
Production d'une étude de marché pour une entreprise souhaitant d'exporter à l'international
Plotly
ScikitLearn
Kmeans
PCA
- Récupération de données en open-data
- Exploration des données
- Clustering
- Rapport d'analyse
Détecter des faux billets : Création d'un modèle de machine learning pour distinguer les faux billets
Numpy
ScikitLearn
Seaborn
- Modélisation de données numériques (dimensions des billets)
- Entrainement d'un modèle de régression logistique
concours sur la Smart City : Réaliser une analyse des arbres de la ville de Paris
Python
Seaborn
Plotly
- Analyse de données ( Corrélations, analyse descriptive )
- Traitement de données géographiques ( Tracer des cartes, des heatmaps)
Préparer des données pour un organisme de santé publique : Nettoyage d'une base de données puis entraînement d'un modèle de machine learning
Python
Pandas
ScikitLearn
Flask
- Nettoyage de données
- Imputation de données manquantes
- Analyse des outliers
- Analyse de la pertinence des variables
- ACP / ANOVA
- Visualisation des données
- Création d'un modèle de prédiction du nutriscore en fonction des données nutritionnelles
- Création d'une webapp de présentation du modèle déployé
Construction d'un modèle de scoring pour un organisme bancaire afin de savoir si on peut accorder un crédit à un client
Python
ScikitLearn
- Analyse descriptive et nettoyage du jeu de données
- Feature engineering
- Tri des variables par feature importance
- Entrainement de plusieurs modèles avec comparaison
- GridSearch afin d'optimiser les hyperparamètres du modèle le plus performant
- CrossValidation des modèles
Segmenter des clients d'un site e-commerce brésilien et calcul de la fréquence de mise à jour de cette segmentation
Python
ScikitLearn
- Analyse descriptive et nettoyage des données
- Feature Engineering
- Utilisation d'algorithmes de clustering
- Simulation de vieillissement des données pour un calcul de la fréquence de MAJ du modèle
Améliorer le produit IA d'une start-up : effectuer du topic modeling sur des avis de restaurants ainsi que créer un modèle de classification de photos réalisées par les clients
Python
LDA
BERT
TensorFlow
Keras
- Scraping de données
- Traitement des avis en utilisant la LDA
- Traitement des avis en utilisant BERTopic
- Classification d'images en utilisant une extraction des descripteurs avec ORB
- Classification des images en utilisant un CNN
Détecter les Bad Buzz grâce au Deep Learning dans un jeu de tweets. Entraînement d'un modèle permettant de l'analyse de sentiments sur un tweet
Python
GenSim
Transformers
BERT
TensorFlow
Keras
Flask
- Vectorisation de texte
- Lemmatisation / Stemming
- Embedding du texte avec Word2Vec, FastText, BERT
- Création d'un modèle LSTM avec Keras
- Entraînement du modèle et vérification des métriques
- Création d'une webapp de présentation
Participer à la conception d'une voiture autonome en modélisant un système de segmentation d'images
Python
Segmentation-models
TensorFlow
PyTorch
Flask
- Création de tensorflow Datasets
- Modélisations de 3 modèles (Linknet, PSPNet, Unet)
- Entraînement et comparaison des modèles
- Création d'une API pour appeler le modèle
- Création d'une Webapp de démonstration
Réaliser une application de recommandation de contenu pour un site de presse qui souhaite fournir des recommandations pertinentes à ses utilisateurs
Python
ScikitLearn
Surprise
Implicit
Flask
Azure Functions
- Modélisation de deux moteurs de recommandations ( Content-Based et Collaborative Filtering)
- Déploiement du modèle via Azure Functions
- Création d'une webapp de démonstration
Développer un chatbot pour réserver des vacances en ayant une reconnaissances des différentes variables et une stratégie de monitoring en production
Python
LUIS
Azure WebApp
Azure AppInsights
- Création, Entrainement et Déploiement d'une ressource LUIS Azure
- Développement du Bot en utilisant le framework Microsoft
- Déploiement du bot sur une webapp Azure
- Suivi du bot en production en utilisant Azure AppInsights
Réaliser un dossier de présentation pour un projet de développement d'application Mobile contenant une fonctionnalité IA
Excel
Power Point
Simulation dimensionnement Azure
- Présentation du projet
- Financement, gestion du budget prévisionnel
- Méthode Agile / SCRUM
- Evaluation des risques du projet
- Ethique de l'IA