Présentation du projet :
Création d’un moteur de recherche permettant de suivre, de 1803 à 1947, les traces laissées par les élèves du lycée Pierre Corneille, dans les archives du Journal de Rouen, afin d’accroitre et structurer une base de données retraçant leur parcours de vie.
Objectifs :
- Algorithmique sur les tableaux indexés et les dictionnaires (clés et valeurs)
- Traitement de données en table (indexation, recherche, élimination de doublons)
- Interaction avec l’utilisateur dans une page Web.
- Utilisation de documentation de librairies externes.
Les archives du Journal de Rouen ont été au préalable OCRisées, afin d’obtenir le texte contenu dans chaque page et le formatter. Cette opération a pris 6 mois non stop sur une machine pour traiter 300k pages de la revue.
Activité pédagogique
>> Activité pédagogique à télécharger PDF
Ressources numériques liées
Activité 1 :
>> Télécharger et dézipper dans un répertoire local de votre machine (C:\Temp\Corneille) les années 1803-1807
>> Script de l’acticité act1.py
Activité 8 :
Activité 9 :
Ecrit par Picassciences
Poster un commentaire