Skip to content

bylaye/TopLeague

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

#️⃣ Apercu du projet

1️⃣ Objectifs 🎯 💡 ✅

  1. Collecter les statistiques des resultats matchs des 5 grands championnats d'Europe.
    • Premier League 🇬🇧
    • Seria A Italienne 🇮🇹
    • la Liga Espagnole 🇪🇸
    • Bundesliga Allemande 🇩🇪
    • La Ligue 1 Francaise 🇫🇷

Note

On retrouvera dans les statistiques: le score, le nombre de tirs(cadres/non cadres), le total corners, le nombre de faute, les cartons distribues, le score a la mi-temps. La Source actuelle ne fournit pas le nom des joueurs buteurs, ni la composition des equipes.

  1. Nettoyer, traiter et exporter les donnees au niveau du warehouse.

  2. Analyser la data avec la requetage SQL. L'analyse se fera des interrogations les plus simples

    • Basic
      • Le score final, score a la mi-temps
      • Le nombre de fautes commises par equipe, ...
    • Medium
      • Ressortir le championnat le plus prolifique(plus de buts inscrits)
      • Les pires humiliations (defaite a domicile sur score fleuve < 5 buts)
      • Les ratios tirs/buts
    • Hard
      • Surprenant mais ressortir le classement par saison. Tout simplement par ce que le jeu de donnees ne traite que le resultat score. On doit refaire le parcours pour determiner l'equipe champion et le classement general
      • Les statistiques approfondies par ligue, par equipe, par saison.

Important

Le choix de faire appel le moins possible a des bibliotheques externes est volontaire. Cela ne dit pas qu'on doute de la confiance à des ressources reputées de la communaute. Ce choix est guidé dans un but d'apprentissage et de mise en pratique des compétences en CS et problems solving.

2️⃣ Stack Technologique 🖥️

  • Python 3.x : Extraction Traitement et chargement des donnees sur la Base
  • MySQL / MariaDB : Base de donnees relationnelle pour le stockage des donnees
  • SQL : Pour requeter sur les donnees.

3️⃣ Structuration du projet 📁

 TopLeague/ (Repertoire principal du projet)
   |
   |---- run.py
   |---- requirements.txt
   |---- config/
   |       |---- config.ini
   |
   |---- scripts/ 
   |       |---- extraction.py
   |       |---- loads.py
   |       |---- treatement.py
   |
   |---- data/ (regroupe l'ensemble des fichier par ligue organiser par saison)
           |
           |---- 0708/ (Saison 2007-2008)
           |       |---- 0708_D1.csv (bundesliga allemande)
           |       |---- 0708_E0.csv (Premier League)
           |       |---- 0708_F1.csv (Ligue 1 francaise)
           |       |---- 0708_I1.csv (Serie A talienne)
           |       |---- 0708_SP1.csv (Liga Espagnole)
           |
           |---- 0809/
           |       | ....
           |---- ..../
           |
           |---- 2324/
                   |....

4️⃣ Utilisation :accessibility:

  1. Cloner le projet
git clone https://github.com/bylaye/TopLeague.git
cd TopLeague
  1. Installer les dependances
pip install -r requirements.txt

Warning

Configurer les parametres de la base de donnees (Mysql / mariadb)
Editer le fichier config.ini dans le repertoire config.

  1. Lancer le programme avec le run.py
python3 run.py

5️⃣ Contribution 🔛 ❓

Les contributions sont les bienvenues ! Si vous souhaitez contribuer à ce projet en ajoutant de nouvelles fonctionnalités, en améliorant l'analyse des données ou en corrigeant des erreurs, n'hésitez pas à ouvrir une Pull Request.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages