Verwenden Sie das Python -CSV -Modul, um CSV -Dateien zu schreiben, zu analysieren, zu lesen, zu aktualisieren
In diesem Python -CSV -Modul können Sie beherrschen, welche CSV -Methoden Sie zum Öffnen und Speichern von CSV -Dateien in einem lesbaren Format lesen, analysieren und schreiben können

Im vorherigen Kapitel 2 haben wir darüber gesprochen, wie BeautifulSoup4, Anfragen, LXML, HTML5LIB und Sublime Text installiert werden und dann Webdaten von ihnen abkratzen. Die Daten werden jedoch noch nicht in einer Datei oder einer Datenbank gespeichert, sodass Sie nicht bequem für Ihren Geschäftszweck und Ihren Arbeitsbetrieb verwenden können.
In diesem Python -Tutorial sprachen wir darüber, wie man Python -Skripte schreibt, um die Daten in CSV -Dateien lokal zu analysieren und zu speichern und die CSV -Dateien in einer Python -Umgebung zu lesen.
Am Ende dieses Python -Tutorials können Sie beherrschen, welche CSV -Methoden Sie zum Öffnen und Speichern von CSV -Dateien in einem lesbaren Format lesen, analysieren und schreiben können, obwohl wir nicht tief in bestimmte Script -Schriftzahlen eintauchen, über die wir sprechen würden Über im nächsten Kapitel des Python Tutorial.
Inhaltsverzeichnis: Python CSV -Modul
- Importieren Sie das CSV -Modul in Python3 in erhabenem Text
- Schreiben Sie CSV -Dateien
- CSV -Dateien analysieren
- Speichern Sie abgekratzte Daten in CSV -Dateien
- Lesen Sie CSV -Dateien
CSV -Modul importieren
Zuvor habe ich das Importieren von BeautifulSoup und das Modul angefordert, um die gezielten Webdaten zu kratzen und korrekte Daten zum Sublime -Text anzuzeigen. Wenn wir also über CSV -Skripte in Python sprechen, müssen wir das CSV -Modul importieren. Der Weg ist sehr einfach, indem Sie das Skript unten zu Beginn der Python -Datei eingeben.
CSV importieren
Python Tutorial – Schreiben Sie CSV -Dateien
Um eine neue CSV -Datei zu erstellen und zu schreiben, um Ihre abgekratzten Daten zu speichern, müssen Sie diese beiden Python -Methoden lernen – Open () und Writer ()
Open () Syntax: Öffnen (Datei, Modus)
In dem Methodenargument bedeutet Datei den Pfad und den Namen der Datei, die Sie nach der Arbeit öffnen können. Dann bedeutet Modus eine Zeichenfolge, die definiert, in welchem Modus Sie die Datei öffnen möchten, und im Grunde gibt es vier Modi
- „R“ – Lesen – Standardwert. Öffnet eine Datei zum Lesen, Fehler, wenn die Datei nicht vorhanden ist
- „a“ – anhängen – öffnet eine Datei zum Anhängen, erstellt die Datei, wenn sie nicht vorhanden ist
- „W“ – Schreiben – öffnet eine Datei zum Schreiben, erstellt die Datei, wenn sie nicht vorhanden ist
- „x“ – erstellen – erstellt die angegebene Datei, gibt einen Fehler zurück, wenn die Datei vorliegt
In diesem Fall müssen wir eine neue CSV -Datei erstellen und schreiben, damit wir entweder „W“ oder „x“ verwenden können
Zum Beispiel können wir eine Variable (csv_file) erstellen und eine solche Codezeile schreiben:
csv_file = open ('ecommerce_scape.csv', 'w'))
Writer () syntax: writer (variable)
Die CSV.Writer () -Methode gibt ein Autor-Objekt zurück, das die Daten des Benutzers in abgrenzende Zeichenfolgen auf dem angegebenen Datei-ähnlichen Objekt umwandelt.
Zum Beispiel können wir eine Variable (CSV_Writer) erstellen und eine solche Codezeile schreiben:
csv_writer = csv.writer (csv_file)
Normalerweise kratzen wir Daten ab und wollen Daten aufteilen und Daten in verschiedene spezifische Spalten in CSV aufnehmen. Der Zweck von writer () besteht also darin, eine anerkennbare Arbeitsumgebung zu erstellen, bevor wir die CSV -Dateidaten analysieren.
CSV -Dateien analysieren
Wir erwarten nicht, die Daten aus einem einzigen Excel -Box zu lesen und zu verwenden. Unabhängig davon, ob wir die Dateien lokal oder auf dem Server speichern, wollen wir die Rohdaten in verschiedene Zeilenüberschriften aufteilen, die für uns das Lesen, Anrufen und Gebrauch praktisch sind. Um die Daten in einem erwarteten Format zu erhalten, müssen wir die Daten analysieren. Heute stellen wir eine Methode vor – writerow (). Grundsätzlich wird die Writerow () -Methode verwendet, um jede Spaltenüberschrift zu erstellen, und schreibt eine Datenreihe in die angegebene Datei.
Writerow () syntax: writerow ([''], [''], [''], ...... oder [variable, variable2, variable3, ....]
Zum Beispiel können wir eine Codezeile wie diese schreiben:
CSV_WRITER.Writerow (['Überschrift', 'Zusammenfassung'])
Jetzt erfolgt jede Spalte -Benennung in der CSV -Datei, und dann konnten wir die abgekratzten Daten nach Spalten füttern.
Zum Beispiel können wir eine Codezeile wie diese schreiben:
csv_writer.writerow ([Überschrift, Zusammenfassung])
Wie Sie vielleicht wissen, sind die Argumente in der obigen Schriftstelle alle Variablen, die wir erstellt haben, um die verschiedenen Datenabschnitte auf der Seite Easy2Digital -E -Commerce -Artikel abzukratzen. Bitte denken Sie daran und vermeiden Sie es, die Spalten zu benennen, die wir im vorherigen Schritt gemacht haben.
(Hinweis: Wir werden diskutieren, wie Sie im nächsten Kapitel bestimmte Daten in Python3 auf Sublime Text kratzen. Vorher können Sie den anderen Artikel „Web -Scraping mit Google Sheets ImportXML zum automatischen Sammeln von Produktpreisinformationen“ verweisen, wo Sie können Finden Sie die Möglichkeit, Entwicklertools zu verwenden, um den spezifischen Datenort und den spezifischen Pfad zu identifizieren und sich über die HTML -Struktur zu erfahren.)
Speichern Sie abgekratzte Daten in CSV -Dateien
Um Python3 mitzuteilen, wird die CSV -Datei -Codierungsarbeiten fertiggestellt und eine Datei exportieren oder die Daten an einen Serverspeicherort aktualisieren, müssen wir eine Methode verwenden – schließen ()
Die Python -Dateimethode Close () schließt die geöffnete Datei. Eine geschlossene Datei kann nicht mehr gelesen oder geschrieben werden. Bei jeder Operation, bei der die geöffnete Datei geöffnet wird, wird ein ValueError angehoben, nachdem die Datei geschlossen wurde. Close () mehr als einmal anzurufen ist erlaubt.
Python schließt automatisch eine Datei ab, wenn das Referenzobjekt einer Datei einer anderen Datei neu zugewiesen wird. Es ist eine gute Praxis, die Methode von Close () zu verwenden, um eine Datei zu schließen.
Zum Beispiel können wir eine Codezeile wie diese schreiben:
CSV_FILE.CLOSE ()
Dann können wir „Befehl + B“ eingeben. Es wird immer noch die Überschrift und Zusammenfassung des Sublime -Textes angezeigt, aber Sie stellen fest, dass es eine neue CSV -Datei gibt, die Sie im Skript (eCommerce_Scrape.csv) nennen, das im zugewiesenen Ort angezeigt wird.
Wenn Sie versuchen, es zu öffnen, können Sie alle abgekratzten Informationen in der CSV. -Datei gespeichert. Es gibt keine Einschränkung für die Daten, die Sie automatisch kratzen möchten und wo diese neue Datei speichern soll. Es hängt nur von Ihrem Geschäftszweck und Arbeitsbetrieb ab.
Lesen Sie CSV -Dateien
In vielen Fällen müssten Sie ein Python -Skript schreiben, um einen vollständigen Workflow zu automatisieren, z. B. die Aktualisierung des E -Commerce -SKU -Gewinnrechners. Das Öffnen vorhandener Dateien und das Erhalten der Informationen ist eine wichtige Zutat im automatischen Prozess. Hier würden wir zwei Muster mit … AS und für Zeile in und zwei Methoden vorstellen – Reader () und Next ()
Importieren wir zunächst das CSV -Modul und öffnen Sie die vorhandene Datei, die wir gerade im CSV -Format erstellt haben. Wie Sie sehen können, verwenden wir hier „r“ in der offenen Methode anstelle von „x“ oder „w“, weil wir die Informationen lesen und sie als CSV_FILE definieren möchten, indem wir Open verwenden … AS.
CSV importieren
mit Open ('ecommerce_scape.csv', 'r') als csv_file:
Anschließend müssen wir die Lesermethode verwenden, um die Informationen zu greifen und sie uns anzuzeigen, damit wir eine variable csv_reading sowie die unten aufgeführte Codezeile erstellen
csv_reading = csv.reader (csv_file)
Bekannt: Reader () -Methode gibt ein Leserobjekt zurück, das in der CSV -Datei eine Iteratorin von Zeilen ist.
Wenn wir versuchen zu drucken (csv_reading) und den Befehl B eingeben, sind die Rückgabe die Objektinformationen.
Um die Informationen in der Datei anzuzeigen, müssen wir eine Codezeile schreiben, indem wir für eine solche Zeile verwenden:
Zum Schleifen
Für Zeile in csv_reading:
Anschließend sind nicht alle Informationen erforderlich, damit Sie die Informationen ändern und auswählen können, die Sie verwenden möchten, indem Sie Next () und [Nummer] verwenden.
Next () Funktion gibt das nächste Element vom Iterator zurück. Wenn Sie beispielsweise nicht jeden Spalten -Schlagzeilennamen benötigen, können Sie in diesem Fall:
Weiter (csv_reading)
Zu guter Letzt benötigen Sie möglicherweise nur spezifische Spalteninformationen wie die Artikelüberschrift hier. In der allgemeinen Programmierung bedeutet 0 das erste. Wenn wir also nur die Artikelüberschrift benötigen, können wir nach einer Linie in der gedruckten Methode wie folgt hinzufügen:
drucken (Zeile [0])
Wie Sie sehen können, zeigt es nur alle Artikelüberschriften im Return Dashboard.
So einfach, oder? Ich hoffe, Sie lesen gerne Kapitel 3: So schreiben, analysieren und lesen Sie CSV -Dateien mit kratzten Daten. Wenn Sie dies getan haben, unterstützen Sie uns bitte, indem Sie eines der unten aufgeführten Dinge tun, da dies immer unserem Kanal hilft.
- Unterstützen Sie unseren Kanal durch Spenden über PayPal (paypal.me/Easy2digital)
- Abonnieren Sie meinen Kanal und schalten Sie die Benachrichtigungsglocke ein Easy2Digital Youtube Kanal.
- Folgen Sie und liken Sie unsere Seite Easy2Digital Facebook Seite
- Teilen Sie den Artikel in Ihrem sozialen Netzwerk mit dem Hashtag #easy2digital
- Melden Sie sich für unseren wöchentlichen Newsletter an, um die neuesten Artikel, Videos und Rabattcodes von Easy2Digital zu erhalten
- Abonnieren Sie unsere monatliche Mitgliedschaft über Patreon, um exklusive Vorteile zu genießen (www.patreon.com/louisludigital)