Projet personnel
Ce projet illustre la construction complète d'un Data Warehouse à partir de données fictives d'e-commerce, avec modélisation sous SQL Server et création d'un dashboard Power BI pour l'analyse des ventes, paiements et produits.
- Vue d'ensemble
- Objectifs du projet
- Architecture du Data Warehouse
- Structure du projet
- Technologies utilisées
- Installation et utilisation
- Compétences démontrées
- Auteur
Ce projet démontre toutes les étapes d'un pipeline décisionnel complet :
- Extraction : Importation de données CSV
- Transformation : Nettoyage et structuration des données
- Modélisation : Schéma en étoile (Star Schema) sous SQL Server
- Visualisation : Dashboard Power BI avec mesures DAX avancées
- Modéliser un Data Warehouse avec un schéma en étoile
- Gérer les relations entre tables de dimensions et table de faits
- Créer des vues SQL optimisées pour l'analyse
- Développer un dashboard Power BI interactif
- Implémenter des mesures DAX (CA, MTD, YTD, croissance, panier moyen)
Le Data Warehouse suit une architecture en étoile avec :
dim_customers: Informations sur les clients (nom, email, région)dim_products: Catalogue produits (nom, catégorie, prix)dim_regions: Géolocalisation des clientsdim_payments: Méthodes et statuts de paiementdim_date: Dimension temporelle pour analyses temporelles
fact_orders: Commandes avec quantité, montant, dates et relations aux dimensions
Le projet inclut plusieurs vues optimisées pour l'analyse :
vw_sales_overview: Vue globale des ventes avec informations client, produit, région et paiementvw_sales_by_product: Agrégation des ventes par produitvw_orders_by_region: Analyse des commandes par régionvw_payment_success_rate: Taux de réussite des paiements
Projet_data_warehouse_ecommerce/
├── data/ # Données sources (CSV)
│ ├── customers_100.csv
│ ├── orders_200.csv
│ ├── payments_200.csv
│ ├── products_100.csv
│ └── regions_100.csv
├── requêtes_sql/ # Scripts SQL pour création du DWH
│ ├── 01_creation_schema_et_tables_dimensions.sql
│ ├── 02_creation_table_tait.sql
│ ├── 03_vérification_chargement_tables.sql
│ ├── 04_creation_vues_pour_pbix.sql
│ └── 05_verifier_la_liaison_des_tables.sql
├── powerbi/ # Fichiers Power BI
│ └── Dashborad_E_commerce.pbix
├── images/ # Captures d'écran du processus
├── docs/ # Documentation
├── reports/ # Rapports générés
├── doc.py # Script Python pour génération PDF
└── README.md # Ce fichier
- Base de données : Microsoft SQL Server
- ETL : Power Query (dans Power BI)
- Visualisation : Power BI Desktop
- Langages : SQL (T-SQL), Python (FPDF pour documentation)
- Modélisation : Schéma en étoile (Star Schema)
- Microsoft SQL Server (2019 ou supérieur)
- SQL Server Management Studio (SSMS)
- Power BI Desktop
- Python 3.x (optionnel, pour génération PDF)
-
Création du Data Warehouse
-- Exécuter les scripts dans l'ordre : -- 1. 01_creation_schema_et_tables_dimensions.sql -- 2. 02_creation_table_fait.sql
-
Importation des données
- Importer les fichiers CSV depuis le dossier
data/dans les tables correspondantes - Utiliser SQL Server Import/Export Wizard ou BULK INSERT
- Importer les fichiers CSV depuis le dossier
-
Vérification
-- Exécuter : -- 3. 03_vérification_chargement_tables.sql -- 5. 04_verifier_la_liaison_des_tables.sql
-
Création des vues
-- Exécuter : -- 4. 05_creation_vues_pour_pbix.sql
-
Connexion Power BI
- Ouvrir
powerbi/Dashborad_E_commerce.pbix - Configurer la connexion à votre instance SQL Server
- Rafraîchir les données
- Ouvrir
python doc.py- ✅ Conception d'un schéma en étoile (Star Schema)
- ✅ Gestion des clés primaires et étrangères
- ✅ Normalisation et optimisation des tables
- ✅ Création de schémas et tables sous SQL Server
- ✅ Gestion des contraintes d'intégrité référentielle
- ✅ Création de vues SQL optimisées
- ✅ Requêtes complexes avec JOINs multiples
- ✅ Importation et transformation des données avec Power Query
- ✅ Création de mesures DAX avancées (CA, MTD, YTD, croissance, panier moyen)
- ✅ Visualisation et storytelling de données
- ✅ Design de dashboard interactif et professionnel
- ✅ Extraction, Transformation, Chargement (ETL)
- ✅ Architecture Data Warehouse
- ✅ Documentation technique
Le dashboard inclut des analyses sur :
-
Vue globale : Aperçu des ventes et KPIs principaux
-
Analyse régionale : Performance des ventes par région
-
Analyse produits : Top produits et catégories
-
Succès des paiements : Taux de réussite et méthodes de paiement
-
Calendrier : Analyses temporelles (MTD, YTD)
Cédric BOIMIN
Étudiant en MBA Big Data & IA à MBA ESG Paris
Ce projet fait partie de mon portfolio professionnel et démontre mes compétences en Data Engineering, Business Intelligence et Data Analytics.







