Gunakan modul CSV Python untuk menulis, parse, baca, perbarui file CSV

0

Dalam modul CSV Python ini, Anda dapat menguasai apa yang dibaca CSV, parse dan metode tulis yang dapat Anda gunakan untuk membuka dan menyimpan file CSV dalam format yang dapat dibaca

In the previous Chapter 2, we talked about how to install beautifulsoup4, requests, lxml, html5lib, and sublime text, and then scrape web data by them. But the data is not saved in a file or a database yet, so it’s not convenient for you to use for your business purpose and work operation.

Jadi dalam tutorial Python ini, kita akan berbicara tentang cara menulis skrip Python untuk menguraikan dan menyimpan data ke dalam file CSV lokal dan membaca file CSV di lingkungan Python.

Pada akhir tutorial Python ini, Anda dapat menguasai apa yang dibaca CSV, parse, dan metode menulis yang dapat Anda gunakan untuk membuka dan menyimpan file CSV dalam format yang dapat dibaca, meskipun kami tidak akan menyelam secara mendalam ke dalam metode pengikisan spesifik penulisan skrip yang akan kami bicarakan Tentang di bab berikutnya dari tutorial Python.

Daftar Isi: Modul CSV Python

Impor modul CSV

Sebelumnya, saya berbagi untuk mengimpor Modul Beautifulsoup dan meminta untuk mengikis data web yang ditargetkan dan menampilkan data yang benar pada teks Sublime. Jadi ketika berbicara tentang skrip CSV di Python, kita perlu mengimpor modul CSV. Jalannya sangat mudah dengan mengetikkan skrip di bawah ini di awal file Python.

import csv

Tutorial Python – Tulis file CSV

Untuk membuat dan menulis file CSV baru untuk menyimpan data terkikis Anda, Anda perlu mempelajari dua metode Python ini – Open () dan Writer ()

Open() Syntax: open(file, mode)

Dalam argumen metode, file berarti jalur dan nama file yang dapat Anda buka setelah pekerjaan selesai. Kemudian, mode berarti string, yang mendefinisikan mode mana yang ingin Anda buka file, dan pada dasarnya, ada empat mode

“r” – Read – Default value. Opens a file for reading, error if the file does not exist

“a” – Append – Opens a file for appending, creates the file if it does not exist

“w” – Write – Opens a file for writing, creates the file if it does not exist

“x” – Create – Creates the specified file, returns an error if the file exists

Dalam hal ini, kita perlu membuat dan menulis file CSV baru, jadi kita bisa menggunakan “w”, atau “x”

Misalnya, kita dapat membuat variabel (csv_file) dan menulis baris kode seperti ini:

csv_file = open('ecommerce_scrape.csv','w')

Writer() Syntax: writer(variable)

Metode CSV.Writer () mengembalikan objek penulis yang mengubah data pengguna menjadi string yang dibatasi pada objek seperti file yang diberikan.

Misalnya, kita dapat membuat variabel (csv_writer) dan menulis baris kode seperti ini:

csv_writer = csv.writer(csv_file)

Biasanya kami mengikis data dan bertujuan untuk membagi data dan memasukkan data menjadi kolom spesifik yang berbeda di CSV. Jadi tujuan penulis () adalah untuk menciptakan lingkungan kerja yang dapat diisi sebelum kita mengurai data file CSV.

Kami tidak berharap untuk membaca dan menggunakan data dari satu kotak Excel. Sebaliknya, tidak peduli apakah kami menyimpan file secara lokal atau di server, kami bertujuan untuk membagi data mentah menjadi berita utama baris yang berbeda, yang nyaman bagi kami untuk membaca, menelepon, dan menggunakan. Untuk mendapatkan data dalam format yang diharapkan, kita perlu menguraikan data. Hari ini, kami akan memperkenalkan metode – Writrow (). Pada dasarnya, metode writerow () digunakan untuk membuat setiap tajuk kolom dan menulis deretan data ke dalam file yang ditentukan.

Writerow() Syntax: writerow([‘ ’],[‘ ’],[‘ ’],……, or [variable, variable2, variable3,….]

Misalnya, kita dapat menulis baris kode seperti ini:

csv_writer.writerow(['Headline','Summary'])

Sekarang setiap penamaan kolom dilakukan dalam file CSV, dan kemudian kami dapat memberi makan data yang dikikis oleh kolom.

Misalnya, kita dapat menulis baris kode seperti ini:

csv_writer.writerow([headline,summary])

Seperti yang mungkin Anda ketahui, argumen dalam penulis di atas adalah semua variabel yang kami buat untuk mengikis berbagai bagian data di halaman artikel easy2Digital eCommerce. Harap ingatlah ini dan hindari menggunakan penamaan kolom yang kami lakukan pada langkah sebelumnya.

(Note: We’ll discuss how to scrape specific data in Python3 on Sublime Text in the next chapter. Before that, you can refer to the other article “Web Scraping with Google Sheets ImportXML to Automatically Collect Product Price Info”, where you can find the ways to use developer tools to identify the specific data location and path and learn about HTML structure.)

Simpan data yang dikikis ke dalam file CSV

Untuk memberi tahu Python3, pekerjaan pengkodean file CSV selesai dan mengekspor file, atau memperbarui data ke lokasi server, kita perlu menggunakan metode – tutup ()

Metode file python tutup () menutup file yang dibuka. File tertutup tidak dapat dibaca atau ditulis lagi. Operasi apa pun, yang mengharuskan file yang dibuka akan menaikkan NilaiError setelah file ditutup. Memanggil Close () lebih dari sekali diizinkan.

Python automatically closes a file when the reference object of a file is reassigned to another file. It is a good practice to use the close() method to close a file.
For example, we can write a line of code like this:

csv_file.close()

Kemudian, kita dapat memasukkan “Command + B”. Ini masih menunjukkan judul dan ringkasan pada teks luhur, tetapi Anda menemukan bahwa ada file CSV baru yang Anda sebutkan di skrip (eCommerce_scrape.csv) muncul di lokasi yang ditetapkan.

Jika Anda mencoba membukanya, Anda dapat menemukan semua informasi tergores disimpan di CSV.File. Tidak ada batasan pada data apa yang ingin Anda pengikis secara otomatis, dan di mana menyimpan file baru ini. Ini hanya tergantung pada tujuan bisnis dan operasi kerja Anda.

Baca file CSV

Dalam banyak kasus, Anda perlu menulis skrip Python untuk mengotomatiskan alur kerja penuh, seperti memperbarui kalkulator laba SKU e -commerce. Dengan demikian membuka file yang ada dan mendapatkan informasi adalah bahan utama dalam proses otomatis. Di sini kami akan memperkenalkan dua pola dengan..sebuah dan untuk baris, dan dua metode – pembaca () dan selanjutnya ()

Pertama -tama, mari kita impor modul CSV dan buka file yang ada yang baru saja kita buat dalam format CSV. Seperti yang Anda lihat, di sini kami menggunakan ‘R’ dalam metode terbuka alih -alih ‘X’, atau ‘W’ karena kami ingin membaca informasi, dan mendefinisikannya sebagai CSV_FILE dengan menggunakan Open… .As.

import csv

with open('ecommerce_scrape.csv','r') as csv_file:

Kemudian, kita perlu menggunakan metode pembaca untuk mengambil informasi dan menampilkannya kepada kita, jadi kita membuat variabel CSV_Reading serta baris kode yang tercantum di bawah ini

csv_reading = csv.reader(csv_file)

Tercatat: Metode pembaca () Mengembalikan objek pembaca yang merupakan iterator baris dalam file CSV.

Jika kami mencoba mencetak (CSV_READING) dan memasukkan perintah B, pengembalian adalah informasi objek.

Untuk menampilkan informasi dalam file, kita perlu menulis baris kode dengan menggunakan baris seperti ini:

Untuk perulangan

for line in csv_reading:

Then, not all of the information is necessary to grasp, so you can modify and select the information you want to use by using next() and [number].
next () function returns the next item from the iterator. For example in this case, if you don’t need each column headline name, you can use:

next(csv_reading)

Last but not least, Anda mungkin hanya perlu informasi kolom tertentu seperti tajuk artikel di sini. Dalam pemrograman umum, 0 berarti yang pertama. Jadi jika kita hanya membutuhkan judul artikel, kita dapat menambahkan setelah baris dalam metode cetak seperti ini:

print(line[0])

Seperti yang Anda lihat, itu hanya menunjukkan semua tajuk artikel di dasbor kembali.

Sangat mudah, bukan? Saya harap Anda menikmati membaca Bab 3: Cara Menulis, Mengurai, dan Membaca File CSV Dengan Data tergores. Jika Anda melakukannya, harap dukung kami dengan melakukan salah satu hal yang tercantum di bawah ini, karena selalu membantu saluran kami.

  • Support and donate to our channel through PayPal (paypal.me/Easy2digital)
  • Subscribe to my channel and turn on the notification bell Easy2Digital Youtube channel.
  • Follow and like my page Easy2Digital Facebook page
  • Bagikan artikel di jejaring sosial Anda dengan tagar #Easy2Digital
  • Buy products with Easy2Digital 10% OFF Discount code (Easy2DigitalNewBuyers2020)
  • Anda mendaftar untuk buletin mingguan kami untuk menerima artikel, video, dan kode diskon Easy2Digital terbaru
  • Subscribe to our monthly membership through Patreon to enjoy exclusive benefits (www.patreon.com/louisludigital)

Jika Anda tertarik dengan bab berikutnya, silakan lihat artikel di bawah ini

Tutorial Python 4: Buat bot situs web untuk mengikis data situs web tertentu menggunakan BeautifulSoup

Pertanyaan yang Sering Diajukan:

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *