Utilisez le module Python CSV pour écrire, analyser, lire, mettre à jour les fichiers CSV

Dans ce module Python CSV, vous pouvez maîtriser les méthodes de lecture, d’analyse et d’écriture de CSV que vous pouvez utiliser pour ouvrir et enregistrer les fichiers CSV dans un format lisible

In the previous Chapter 2, we talked about how to install beautifulsoup4, requests, lxml, html5lib, and sublime text, and then scrape web data by them. But the data is not saved in a file or a database yet, so it’s not convenient for you to use for your business purpose and work operation.

Donc, dans ce didacticiel Python, nous expliquons comment écrire des scripts Python pour analyser et enregistrer les données dans les fichiers CSV locaux et lire les fichiers CSV dans un environnement Python.

À la fin de ce didacticiel Python, vous pouvez maîtriser les méthodes de lecture, d’analyse et d’écriture de CSV que vous pouvez utiliser pour ouvrir et enregistrer les fichiers CSV dans un format lisible, bien que nous n’allons pas plonger en profondeur dans des méthodes de grattage spécifiques, la rédaction de script que nous parlons que nous parlons feri À propos du prochain chapitre du tutoriel Python.

Table des matières: module Python CSV

Importer le module CSV

Auparavant, j’ai partagé d’importer BeautifulSoup et de demander le module afin de gratter les données Web ciblées et d’afficher les données correctes sur le texte sublime. Donc, lorsque vous parlez de scripts CSV dans Python, nous devons importer le module CSV. La voie est très facile en tapant le script ci-dessous au début du fichier Python.

import csv

Tutoriel Python – Écrivez des fichiers CSV

Afin de créer et d’écrire un nouveau fichier CSV pour enregistrer vos données grattées, vous devez apprendre ces deux méthodes Python – Open () et Writer ()

Open() Syntax: open(file, mode)

Dans l’argument de la méthode, le fichier signifie le chemin d’accès et le nom du fichier que vous pouvez ouvrir après le travail. Ensuite, le mode signifie une chaîne, qui définit le mode dans lequel vous souhaitez ouvrir le fichier, et en gros, il existe quatre modes

“r” – Read – Default value. Opens a file for reading, error if the file does not exist

“a” – Append – Opens a file for appending, creates the file if it does not exist

“w” – Write – Opens a file for writing, creates the file if it does not exist

“x” – Create – Creates the specified file, returns an error if the file exists

Dans ce cas, nous devons créer et écrire un nouveau fichier CSV, afin que nous puissions utiliser «W» ou «X»

Par exemple, nous pouvons créer une variable (CSV_FILE) et écrire une ligne de code comme ceci:

csv_file = open('ecommerce_scrape.csv','w')

Writer() Syntax: writer(variable)

La méthode csv.writer () renvoie un objet d’écrivain qui convertit les données de l’utilisateur en chaînes délimitées sur l’objet de type fichier donné.

Par exemple, nous pouvons créer une variable (CSV_Writer) et écrire une ligne de code comme ceci:

csv_writer = csv.writer(csv_file)

Normalement, nous gratons les données et visons à diviser les données et à alimenter les données dans différentes colonnes spécifiques dans CSV. Ainsi, le but de l’écrivain () est de créer un environnement de travail analytique avant d’analyser les données de fichiers CSV.

Nous ne nous attendons pas à lire et à utiliser les données d’une seule boîte Excel. Au lieu de cela, que nous enregistrons les fichiers localement ou sur le serveur, nous visons à diviser les données brutes en différents titres de ligne, qui sont pratiques pour nous de lire, d’appeler et d’utiliser. Afin d’obtenir les données dans un format attendu, nous devons analyser les données. Aujourd’hui, nous présenterons une méthode – Writerow (). Fondamentalement, la méthode writerow () est utilisée pour créer chaque titre de colonne et écrit une ligne de données dans le fichier spécifié.

Writerow() Syntax: writerow([‘ ’],[‘ ’],[‘ ’],……, or [variable, variable2, variable3,….]

Par exemple, nous pouvons écrire une ligne de code comme ceci:

csv_writer.writerow(['Headline','Summary'])

Maintenant, chaque dénomination de colonne est effectuée dans le fichier CSV, puis nous pourrions nourrir les données grattées par des colonnes.

Par exemple, nous pouvons écrire une ligne de code comme ceci:

csv_writer.writerow([headline,summary])

Comme vous le savez peut-être, les arguments dans le Writerow ci-dessus sont toutes les variables que nous avons créées pour gratter les différentes sections de données dans la page d’article Easy2digital Ecommerce. Veuillez garder cela à l’esprit et éviter d’utiliser la dénomination de la colonne que nous avons faite à l’étape précédente.

(Note: We’ll discuss how to scrape specific data in Python3 on Sublime Text in the next chapter. Before that, you can refer to the other article “Web Scraping with Google Sheets ImportXML to Automatically Collect Product Price Info”, where you can find the ways to use developer tools to identify the specific data location and path and learn about HTML structure.)

Enregistrer les données grattées dans les fichiers CSV

Afin de le dire Python3, le travail de codage de fichiers CSV est terminé et exporter un fichier, ou mettre à jour les données vers un emplacement du serveur, nous devons utiliser une méthode – close ()

Python File Method Close () ferme le fichier ouvert. Un fichier fermé ne peut plus être lu ou écrit. Toute opération, qui exige que le fichier soit ouvert, augmentera une valeur d’énergie après la fermeture du fichier. Appeler Close () plus d’une fois est autorisé.

Python automatically closes a file when the reference object of a file is reassigned to another file. It is a good practice to use the close() method to close a file.
For example, we can write a line of code like this:

csv_file.close()

Ensuite, nous pouvons entrer «Commande + B». Il affiche toujours le titre et le résumé sur le texte sublime, mais vous constatez qu’il existe un nouveau fichier CSV que vous nommez dans le script (eCommerce_scrap.csv) qui apparaît dans l’emplacement attribué.

Si vous essayez de l’ouvrir, vous pouvez trouver que toutes les informations grattées sont enregistrées dans le fichier CSV. Il n’y a aucune limitation aux données que vous souhaitez gratter automatiquement et où enregistrer ce nouveau fichier. Cela dépend simplement de votre objectif commercial et de votre opération de travail.

Lire les fichiers CSV

Dans de nombreux cas, vous devrez écrire un script Python pour automatiser un flux de travail complet, comme la mise à jour de la calculatrice de profit SKU de commerce électronique. Ainsi, l’ouverture des fichiers existants et l’obtention des informations sont un ingrédient clé dans le processus automatique. Ici, nous introduisrions deux modèles avec..es et pour la ligne, et deux méthodes – Reader () et Next ()

Tout d’abord, importons le module CSV et ouvrons le fichier existant que nous venons de créer au format CSV. Comme vous pouvez le voir, nous utilisons ici «R» dans la méthode ouverte au lieu de «X», ou «W» parce que nous voulons lire les informations et la définir comme CSV_FILE en utilisant Open….

import csv

with open('ecommerce_scrape.csv','r') as csv_file:

Ensuite, nous devons utiliser la méthode du lecteur pour saisir les informations et nous les montrer, nous créons donc une variable CSV_Reading ainsi que la ligne de code énumérée ci-dessous

csv_reading = csv.reader(csv_file)

Notté: Reader () Renvoie un objet de lecture qui est un itérateur de lignes dans le fichier CSV.

Si nous essayons d’imprimer (csv_reading) et entrez la commande b, le retour est les informations de l’objet.

Afin d’afficher les informations du fichier, nous devons écrire une ligne de code en utilisant pour la ligne comme celle-ci:

Pour boucle

for line in csv_reading:

Then, not all of the information is necessary to grasp, so you can modify and select the information you want to use by using next() and [number].
next () function returns the next item from the iterator. For example in this case, if you don’t need each column headline name, you can use:

next(csv_reading)

Enfin et surtout, vous pourriez simplement avoir besoin d’informations de colonnes spécifiques comme le titre de l’article ici. En programmation générale, 0 signifie la première. Donc, si nous avons juste besoin du titre de l’article, nous pouvons ajouter après une méthode de ligne dans l’impression comme celle-ci:

print(line[0])

Comme vous pouvez le voir, il ne montre que tous les titres de l’article dans le tableau de bord de retour.

Si facile, non? J’espère que vous aimez lire le chapitre 3: comment écrire, analyser et lire les fichiers CSV avec des données grattées. Si vous l’avez fait, veuillez nous soutenir en faisant l’une des choses énumérées ci-dessous, car cela aide toujours notre chaîne.

  • Support and donate to our channel through PayPal (paypal.me/Easy2digital)
  • Subscribe to my channel and turn on the notification bell Easy2Digital Youtube channel.
  • Follow and like my page Easy2Digital Facebook page
  • Partagez l’article sur votre réseau social avec le hashtag # easy2digital
  • Buy products with Easy2Digital 10% OFF Discount code (Easy2DigitalNewBuyers2020)
  • Vous vous inscrivez à notre newsletter hebdomadaire pour recevoir les derniers articles, vidéos et codes de réduction Easy2digital
  • Subscribe to our monthly membership through Patreon to enjoy exclusive benefits (www.patreon.com/louisludigital)

Si vous êtes intéressé par le prochain chapitre, veuillez consulter l’article ci-dessous

Python Tutorial 4: Créez un bot de site Web pour gratter les données de site Web spécifiques à l’aide de BeautifulSoup

Table des matières: