🥣05.Python 4

10 février 2022

On continue dans l'apprentissage de BeautifulSoup pour :

  • contourner différents obstacles pouvant entraver votre moissonnage :

    • entêtes http

    • moissonner localement de grosses pages

    • essayer la version mobile d'un site

  • extraire de l'information de documents XML

Et on approfondit le moissonnage à l'aide d'autres exercices. Il se peut qu'on doive aussi parachever la matière qu'on n'aura pas eu le temps de couvrir dans les semaines précédentes.

Je vais aussi vous parler du travail pratique de moissonnage (ou devoir 3) à remettre la semaine prochaine.

Vous devrez rédiger un carnet qui moissonne des données d'un site de votre choix ou qui se connecte à un API de votre choix. Il faut, bien sûr, que le site ou l'API soient différents de ceux qu'on a vus en classe. Votre carnet devra :

  • contenir suffisamment de commentaires pour que je comprenne ce qu'il fait.

  • afficher suffisamment d'information dans votre carnet pour qu'on puisse en suivre le déroulement.

  • produire un fichier CSV.

Vous me le remettez par Moodle, comme d'habitude (devoir3.ipynb). Tous les détails se trouvent dans la section Travaux.

Commencez à y travailler dès que possible. Je vais répondre à vos questions pendant la semaine si vous éprouvez des problèmes.

Dernière mise à jour