🛠️Travaux

Les travaux à remettre ont été mentionnés brièvement dans les pages précédentes. Je vous donne, ci-dessous, un peu plus de détails sur chacun de ces éléments d'évaluation.

Liens directs vers les devoirs:

Devoir 1 - Triptyque (10 points)

Rendez-vous dans ce carnet que j'ai créé pour vous. Assurez-vous d'abord d'en créer une copie dans votre Drive.

Répondez ensuite à toutes les questions que je vous y pose.

Le carnet de mes notes du cours python 1 peut vous aider.

Quand vous avez terminé, téléchargez votre carnet en format .ipynb sur votre ordinateur.

Remettez votre carnet (devoir1.ipynb) dans Moodle.

Tombée : 23h59, le lundi 23 janvier 2023.

Devoir 2 - CSV et API (10 points)

Comme avec le devoir 1, rendez-vous dans ce carnet que j'ai créé pour vous.

Assurez-vous d'abord d'en créer une copie dans votre Drive, puis répondez à toutes les questions que je vous y pose.

Les trois premiers carnets de mes notes du cours (que vous trouverez dans la section Tutoriels) peuvent vous être utiles.

Quand vous avez terminé, téléchargez votre carnet en format .ipynb sur votre ordinateur.

Remettez votre carnet (devoir2.ipynb) dans Moodle

Tombée : 23h59, le lundi 6 février 2023 (tel que convenu au cours du 26 janvier).

Devoir 3 (15 points) - Moissonnage

Vous devrez rédiger un carnet qui moissonne les textes d'un•e journaliste ou chroniquer•euse de votre choix. On se servira plus tard de ces textes pour entraîner un modèle de langue. Votre carnet devra :

  • contenir suffisamment de commentaires pour que je comprenne ce qu'il fait.

  • afficher suffisamment d'information dans votre carnet pour qu'on puisse en suivre le déroulement.

  • produire un fichier CSV contenant les textes de cette personne :

    • pour l'année 2022 (à condition qu'elle ait publié 100 textes ou plus en 2022), ou

    • 100 textes (ou idéalement plus) publiés sur un nombre entier d'années (2 années ou plus).

Vous me le remettez par Moodle, comme d'habitude (devoir3.ipynb)

Si vous avez des difficultés, n'hésitez pas à me demander de l'aide. 🚨

Tombée : 23h59, le lundi 20 février 2023.

Devoir 4 (10 points) - TAL

Rédigez un carnet dans lequel vous générez la liste des 100 bigrammes de lemmes les plus couramment utilisés dans les textes que vous avez moissonnés dans votre Devoir 3. Tâchez de nettoyer le texte pour que les bigrammes aient du sens (enlevez des tokens peu significatifs).

Utilisez les fichiers CSV que j'ai générés pour vous dans ma correction de votre devoir 3.

Si vous n'en avez pas, utilisez le fichier ameli_pineda.csv que vous trouverez dans le répertoire Google Drive que je partage avec vous. Il contient tous les textes que la chroniqueuse judiciaire du Devoir, lauréate d'un Judith-Jasmin et diplômée du programme, a publiés en 2020 et 2021.

Vous me remettez votre carnet (devoir4.ipynb) dans Moodle.

Tombée : 23h59, le lundi 6 mars 2023.

Devoir 5 (10 points) - Pandas

Rédigez un carnet dans lequel vous lisez, avec Pandas, le fichier fbQC22.csv. Il contient des données sur les plus d'un demi-million de publications Facebook mises en ligne par l'ensemble des médias du Québec.

Après avoir lu le fichier [1 point], rédigez du code à l'aide de pandas pour répondre aux trois questions suivantes:

  • Quels sont les 25 médias qui ont mis en ligne le plus grand nombre de publications Facebook en 2022 [1 point]?

  • Quels sont les 25 médias dont les publications ont généré le plus d'interactions dans Facebook en 2022 (il vous faut auparavant créer une colonne interactions qui est la somme des partages, des commentaires, des likes, des love, des wow, des haha, des triste, des colère et des solidarité) [4 points].

  • Trouvez la vidéo qui a cumulé le plus grand nombre de vues (videoVuesTotales). Assurez-vous:

    • qu'il s'agit d'une vidéo dont le statut (videoStatut) est owned et

    • que le média qui l'a mise en ligne en est propriétaire (la valeur de la colonne videoProprio est Yes). [4 points].

Vous me remettez votre carnet (devoir5.ipynb) dans Moodle.

Tombée : 23h59, le lundi 27 mars 2023.

Projet final (30 points)

Pour votre projet final, qui est un travail individuel, vous avez deux options. Vous pouvez faire :

  • un reportage ou

  • un outil

Si vous choisissez l'option reportage, vous pouvez le faire sur un sujet de votre choix (conditionnel à mon approbation). Vous avez aussi le choix de la forme de ce reportage : il peut s'agir d'un article, d'un reportage radio, d'un reportage télé ou d'un reportage web.

La production de ce reportage ou de cet outil devra impliquer de la programmation en Python pour moissonner et/ou traiter et/ou visualiser des données.

Votre reportage devra également comprendre au moins une entrevue avec un expert, un témoin, ou tout autre intervenant en mesure de valider ou d'incarner ce que racontent les données dans votre reportage.

L'option outil peut prendre diverses formes. Il peut s'agir d'un robot Instagram, d'un outil qui automatise des tâches fastidieuses dans une salle de presse, etc. Si vous vous êtes déjà dit : « Hé! Ce serait cool si on pouvait faire telle chose! » Eh bien, allez-y! Faites-la! W kapab!

Making-of (10 points)

Quelle que soit la forme que prendra votre travail final, il devra être accompagné d'un texte (en format PDF) qui :

  • compte entre 3 000 et 5 000 caractères;

  • comprend des liens vers toutes les sources de documentation qui vous ont aidées en cours de route;

  • comprend des hyperliens vers toutes les sources de vos données et/ou carnets que vous avez utilisés (s'il y a lieu);

  • décrit votre démarche :

    • Pourquoi ce sujet?

    • Quels outils ou quelles technologies avez-vous utilisés?

    • Pourquoi les avoir choisi(e)s?

    • Comment vous ont-ils(elles) servi?

    • Quels problèmes avez-vous éprouvés (s'il y a lieu).

Votre document PDF doit être accompagné, s'il y a lieu, de tous les carnets que vous avez écrits, et/ou de tous les autres fichiers pertinents (.py, .csv, .ods, .xls, .sql ou autres) que vous avez récoltés ou dont vous vous êtes servis.

Vous mettez tout cela dans Moudeul avant la fin du dernier cours (12h30, le 20 avril 2023) por favor.

Dernière mise à jour