05.Python 4
8 février 2024
On continue dans l'apprentissage de BeautifulSoup pour :
contourner différents obstacles pouvant entraver votre moissonnage, comme des entêtes HTTP ou des cookies
moissonner localement des pages récalcitrantes
essayer la version mobile d'un site
extraire de l'information de documents XML
toujours explorer les fichiers XHR envoyés par un site
Et on approfondit le moissonnage à l'aide d'autres exercices. Il se peut qu'on doive aussi parachever la matière qu'on n'aura pas eu le temps de couvrir dans les semaines précédentes.
Je vais aussi vous parler du travail pratique de moissonnage sur lequel on va travailler la semaine prochaine. Vous allez rédiger un carnet qui moissonne des données et qui produit un fichier CSV contenant au moins 1000 lignes.
Mais auparavant, vous devrez trouver un site web contenant suffisamment de ces données pour que l'exercice en vaille la peine. Il pourrait s'agir de moissonner les textes d'une journaliste ou d'une chroniqueuse de votre choix, par exemple. Je suis ouvert à d'autres idées.
Vous me remettez votre idée et un lien vers le site que vous souhaitez moissonner dans Moodle. Tous les détails se trouvent dans la section Travaux.
Dernière mise à jour