Auteur: Laurence Liang, étudiant en 4e secondaire au Collège Jean-de-Brébeuf
Ensemble de programmes conçus par Laurence Liang le jeudi 7 juin 2018 pour reproduire une publication de la conférence ICLR.
J'étudie l'évolution en temps polynomial d'un réseau neuronal convolutif (CNN) à reconnaître les images des données MNIST.
Mes programmes sont basés sur la recherche de la publication lors de la conférence ICLR, qui est disponible à https://openreview.net/forum?id=SkA-IE06W.
Le but de cette publication par Du, Lee et Tian et de savoir si l'apprentissage d'un CNN se fait en temps polynomial. Pour vérifier cette idée, ils ont observé l'apprentissage d'un CNN avec des filtres initialisés différemment.
J'ai réussi à reproduire pour 2 des 3 CNN une courbe avec une forme semblable aux observations publiées. Cela soutient leur idée qu'un CNN apprend en temps polynomial.
ICLR Demo.ipynb: une démonstration visuelle de mes reproductions avec une analyse plus approfondie
iclr_conv.py: une classe avec un CNN Keras que j'ai conçu pour reproduire les travaux de Du, Lee et Tian.