Use el módulo CSV de Python para escribir, analizar, leer, actualizar archivos CSV

En este módulo CSV de Python, puede dominar los métodos de CSV que leen, analiza y escribe que puede usar para abrir y guardar archivos CSV en un formato legible

In the previous Chapter 2, we talked about how to install beautifulsoup4, requests, lxml, html5lib, and sublime text, and then scrape web data by them. But the data is not saved in a file or a database yet, so it’s not convenient for you to use for your business purpose and work operation.

Entonces, en este tutorial de Python, hablamos sobre cómo escribir scripts de Python para analizar y guardar los datos en archivos CSV locales y leer los archivos CSV en un entorno de Python.

Al final de este tutorial de Python, puede dominar los métodos de CSV que leen, analiza y escribe que puede usar para abrir y guardar archivos CSV en un formato legible, aunque no vamos a sumergirnos profundamente en métodos de raspado específicos que hablamos que hablaríamos que hablaríamos. Acerca del próximo capítulo del tutorial de Python.

Tabla de contenido: módulo CSV de Python

Importar módulo CSV

Anteriormente, compartí para importar BeautifulSoup y Módulo de solicitudes para raspar los datos web específicos y mostrar los datos correctos sobre el texto sublime. Entonces, cuando hablamos de scripts CSV en Python, necesitamos importar el módulo CSV. El camino es muy fácil escribiendo el script a continuación al comienzo del archivo Python.

import csv

Tutorial de Python – Escribir archivos CSV

Para crear y escribir un nuevo archivo CSV para guardar sus datos raspados, debe aprender estos dos métodos Python – Open () y Writer ()

Open() Syntax: open(file, mode)

En el argumento del método, el archivo significa la ruta y el nombre del archivo que puede abrir después del trabajo. Luego, el modo significa una cadena, que define en qué modo desea abrir el archivo, y básicamente, hay cuatro modos

“r” – Read – Default value. Opens a file for reading, error if the file does not exist

“a” – Append – Opens a file for appending, creates the file if it does not exist

“w” – Write – Opens a file for writing, creates the file if it does not exist

“x” – Create – Creates the specified file, returns an error if the file exists

En este caso, necesitamos crear y escribir un nuevo archivo CSV, para que podamos usar «W» o «X»

Por ejemplo, podemos crear una variable (csv_file) y escribir una línea de código como esta:

csv_file = open('ecommerce_scrape.csv','w')

Writer() Syntax: writer(variable)

El método csv.writer () devuelve un objeto de escritor que convierte los datos del usuario en cadenas delimitadas en el objeto tipo archivo dado.

Por ejemplo, podemos crear una variable (CSV_Writer) y escribir una línea de código como esta:

csv_writer = csv.writer(csv_file)

Normalmente raspamos los datos y el objetivo de dividir los datos y alimentar los datos en diferentes columnas específicas en CSV. Entonces, el propósito de Writer () es crear un entorno de trabajo parsable antes de analizar los datos del archivo CSV.

No esperamos leer y usar los datos de un solo cuadro de Excel. En su lugar, no importa si guardamos los archivos localmente o en el servidor, nuestro objetivo es dividir los datos sin procesar en diferentes titulares de filas, que son convenientes para que podamos leer, llamar y usar. Para obtener los datos en un formato esperado, necesitamos analizar los datos. Hoy presentaremos un método: WriterOW (). Básicamente, el método Escritura () se utiliza para crear cada titular de la columna y escribe una fila de datos en el archivo especificado.

Writerow() Syntax: writerow([‘ ’],[‘ ’],[‘ ’],……, or [variable, variable2, variable3,….]

Por ejemplo, podemos escribir una línea de código como esta:

csv_writer.writerow(['Headline','Summary'])

Ahora, cada denominación de columna se realiza en el archivo CSV, y luego podríamos alimentar los datos raspados por columnas.

Por ejemplo, podemos escribir una línea de código como esta:

csv_writer.writerow([headline,summary])

Como puede saber, los argumentos en la escritura anterior son todas las variables que creamos para raspar las diferentes secciones de datos en la página del artículo Easy2Digital Ecommerce. Tenga esto en cuenta y evite usar el nombre de columna que hicimos en el paso anterior.

(Note: We’ll discuss how to scrape specific data in Python3 on Sublime Text in the next chapter. Before that, you can refer to the other article “Web Scraping with Google Sheets ImportXML to Automatically Collect Product Price Info”, where you can find the ways to use developer tools to identify the specific data location and path and learn about HTML structure.)

Guardar datos raspados en archivos CSV

Para decirle a Python3, el trabajo de codificación de archivos CSV está terminado y exporta un archivo, o actualizar los datos en la ubicación de un servidor, necesitamos usar un método – Close ()

Python File Method Close () cierra el archivo abierto. Un archivo cerrado ya no se puede leer o escribir. Cualquier operación que requiera que se abra el archivo recaude un ValueError después de que se haya cerrado el archivo. Llamar a Close () se permite más de una vez.

Python automatically closes a file when the reference object of a file is reassigned to another file. It is a good practice to use the close() method to close a file.
For example, we can write a line of code like this:

csv_file.close()

Entonces, podemos ingresar «Comando + B». Todavía muestra el titular y el resumen en el texto sublime, pero descubre que hay un nuevo archivo CSV que nombra en el script (comercio electrónico_scrape.csv) que aparece en la ubicación asignada.

Si intenta abrirlo, puede encontrar que toda la información raspada se guarda en CSV.File. No hay limitación de qué datos desea raspar automáticamente y dónde guardar este nuevo archivo. Solo depende del propósito de su negocio y la operación de trabajo.

Leer archivos CSV

En muchos casos, necesitaría escribir un script de Python para automatizar un flujo de trabajo completo, como actualizar la calculadora de ganancias SKU de comercio electrónico. Por lo tanto, abrir archivos existentes y obtener la información es un ingrediente clave en el proceso automático. Aquí presentaríamos dos patrones con … como y para línea en, y dos métodos: lector () y next ()

En primer lugar, importemos el módulo CSV y abra el archivo existente que acabamos de crear en formato CSV. Como puede ver, aquí usamos «R» en el método abierto en lugar de «x», o «w» porque queremos leer la información y definirla como csv_file usando Open ….

import csv

with open('ecommerce_scrape.csv','r') as csv_file:

Luego, debemos usar el método del lector para obtener la información y mostrarnos, por lo que creamos una variable CSV_reading, así como la línea de código que se enumera a continuación.

csv_reading = csv.reader(csv_file)

Notado: el método Reader () Devuelve un objeto Reader que es un iterador de líneas en el archivo CSV.

Si intentamos imprimir (CSV_reading) e ingresar al comando B, la devolución es la información del objeto.

Para mostrar la información en el archivo, necesitamos escribir una línea de código usando para una línea como esta:

Para bucle

for line in csv_reading:

Then, not all of the information is necessary to grasp, so you can modify and select the information you want to use by using next() and [number].
next () function returns the next item from the iterator. For example in this case, if you don’t need each column headline name, you can use:

next(csv_reading)

Por último, pero no menos importante, es posible que solo necesite información de columna específica como el título del artículo aquí. En la programación general, 0 significa el primero. Entonces, si solo necesitamos el titular del artículo, podemos agregar después de un método de impresión de línea como este:

print(line[0])

Como puede ver, solo muestra todos los titulares del artículo en el tablero de retorno.

Tan fácil, ¿verdad? Espero que disfrute leyendo Capítulo 3: Cómo escribir, analizar y leer archivos CSV con datos raspados. Si lo hizo, por favor nos apoye haciendo una de las cosas enumeradas a continuación, porque siempre ayuda a nuestro canal.

  • Support and donate to our channel through PayPal (paypal.me/Easy2digital)
  • Subscribe to my channel and turn on the notification bell Easy2Digital Youtube channel.
  • Follow and like my page Easy2Digital Facebook page
  • Comparta el artículo en su red social con el hashtag #Easy2Digital
  • Buy products with Easy2Digital 10% OFF Discount code (Easy2DigitalNewBuyers2020)
  • Usted se registra en nuestro boletín semanal para recibir los últimos artículos, videos y códigos de descuento de Easy2Digital.
  • Subscribe to our monthly membership through Patreon to enjoy exclusive benefits (www.patreon.com/louisludigital)

Si está interesado en el próximo capítulo, consulte el artículo a continuación

Tutorial de Python 4: Cree un bot del sitio web para raspar datos específicos del sitio web utilizando BeautifulSoup

Tabla de contenido:

Q1: ¿Qué es el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q2: ¿Cómo funciona el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q3: ¿Qué cursos y lecciones están disponibles?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q4: ¿Cuánto cuesta el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q5: ¿Dónde puedo comprar el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q6: ¿Qué tipo de garantía tiene el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q7: ¿Qué tipo de soporte técnico está disponible para el módulo?

A: El módulo es un nuevo producto que ofrece una forma innovadora de aprender. Es un dispositivo portátil que se puede usar en cualquier lugar y en cualquier momento. El módulo contiene una variedad de cursos y lecciones que se pueden acceder en línea o sin conexión.

Q8: ¿Cuáles son los beneficios de usar el módulo?

A: Hay una serie de beneficios al usar el módulo. Estos incluyen: La capacidad de aprender en cualquier lugar y en cualquier momento
Acceso a una variedad de cursos y lecciones
La capacidad de tomar notas, resaltar texto y crear tarjetas de memoria
Una garantía de un año
Soporte técnico gratuito

Q9: ¿Cuáles son los desafíos de usar el módulo?

A: Hay algunos desafíos al usar el módulo. Estos incluyen: El costo del dispositivo
La necesidad de descargar cursos y lecciones antes de usarlos sin conexión
La posibilidad de que el dispositivo se pierda o sea robado

Q10: ¿El módulo es adecuado para mí?

A: El módulo es adecuado para una variedad de personas. Estos incluyen: Estudiantes que quieren aprender de una manera nueva e innovadora
Personas que quieren aprender sobre temas específicos
Personas que quieren aprender a su propio ritmo
Personas que quieren aprender sin tener que ir a la escuela