Skip to content
This repository was archived by the owner on Mar 15, 2018. It is now read-only.

Commit 5a7dabe

Browse files
Merge remote-tracking branch 'origin/master'
2 parents 9709b56 + 02c6b94 commit 5a7dabe

File tree

1 file changed

+7
-4
lines changed

1 file changed

+7
-4
lines changed

rapport.tex

+7-4
Original file line numberDiff line numberDiff line change
@@ -200,12 +200,15 @@ \section{Deuxième Partie}\label{deuxieme partie}
200200

201201
\subsection{Méthode d'extraction des données}
202202

203-
Pour l'extraction des données qui seront insérées dans notre base de données, nous avons tout d'abord réalisé un script bash permettant le téléchargement des fichiers qui nous étaient nécessaires. En ce qui concerne le traitement des fichiers téléchargés, nous avons réalisé un autre script bash qui lui fait appel à différents parsers écrit en Python. Ces scripts servent à formater les fichiers selon un standard que nous nous sommes fixés et ainsi permettre l'insertion des données dans la base de données. Lors du Parsing, nous avons choisi de garder uniquement les oeuvres tournées entre 2000 et 2017.
203+
Pour l'extraction des données qui seront insérées dans notre base de données, nous avons tout d'abord réalisé un script bash permettant le téléchargement des fichiers qui nous étaient nécessaires. En ce qui concerne le traitement des fichiers téléchargés, nous avons réalisé un autre script bash qui lui fait appel à différents parsers écrit en Python. Ces scripts servent à formater les fichiers selon un standard que nous nous sommes fixés et ainsi permettre l'insertion des données dans la base de données. Lors du Parsing, nous avons choisi de garder uniquement les oeuvres tournées entre 2000 et 2017. Quand la date de sortie d'un film ou d'une série était inconnue, nous ne l'avons pas retenue. Lorsqu'une série commençait avant 2017, nous avons pris tous ses épisodes.
204204

205205
\subsection{Méthode d'insertion dans la base de données}
206206

207-
Pour insérer toutes nos données le plus rapidement possible, nous avons choisi d'utiliser la commande SQL "LOAD DATA INTO", utilisant les fichiers résultant de notre parsing.
208-
207+
Pour insérer toutes nos données le plus rapidement possible, nous avons choisi d'utiliser la commande SQL "LOAD DATA INTO", utilisant les fichiers résultant de notre parsing. Si des épisodes avaient une date inconnue, nous leur avons attribué la valeur 0. Pour les notes nous avons choisit -1 car 0 n'était pas une valeur aberrante.
208+
\vskip 10pt
209+
Pour garantir l'intégrité des données, nous avons utilisé un trigger lors de la mofication des dates. Ce trigger permet de s'assurer que la date de fin d'une série est inférieure ou égale à la date de début.
210+
\vskip 10pt
211+
Pour accélérer, certaines reqêtes, nous avons également créer des index à des endroits clés.
209212

210213
\subsection{Requêtes demandées}
211214
Les requêtes demandées étaient les suivantes:
@@ -281,7 +284,7 @@ \subsubsection{SQL}
281284
group by AnneeSortie, Nom, Prenom, Numero
282285
having count(*) >=2 )t;
283286
\end{lstlisting}
284-
\newpage
287+
285288
\begin{lstlisting}[
286289
language=SQL,
287290
backgroundcolor=\color{backcolour},

0 commit comments

Comments
 (0)