Python CSVモジュールを使用して、CSVファイルを書き込み、解析、読み取り、更新します

このPython CSVモジュールでは、CSVが読み取り可能な形式でCSVファイルを開き、保存するために使用できるCSVの読み取り、解析、および書き込みをマスターできます。

前の第2章では、 beautifulsoup4、requests、lxml、html5lib、sublimeテキストのインストール方法。ただし、データはまだファイルやデータベースに保存されていないため、ビジネス目的と作業操作に使用するのに便利ではありません。

このPythonチュートリアルでは、Pythonスクリプトを作成してデータを解析してCSVファイルに保存する方法について説明します。 Python環境内のCSVファイル。

このPythonチュートリアルの最後までに、CSVを読み取り、解析、書き込みCSVファイルを開き、保存するために使用できる方法を習得できます。読みやすい形式では、Pythonチュートリアルの次の章で説明する特定のスクレイピング方法に深く掘り下げるつもりはありません。

目次:Python CSVモジュール

import csvモジュール

以前は、ターゲットWebデータをスクレイプし、崇高なテキストに関する正しいデータを表示するために、beautifulsoupとリクエストモジュールを共有しました。したがって、PythonでCSVスクリプトについて話すときは、CSVモジュールをインポートする必要があります。 Pythonファイルの先頭に以下のスクリプトを入力することで、方法は非常に簡単です。

pythonチュートリアル – csvファイルの書き込み

スクレイプされたデータを保存するための新しいCSVファイルを作成して書き込むために、これら2つのPythonメソッドを学習する必要があります-open()およびwriter()

open()syntax: open(file、mode)

メソッド引数では、ファイルとは、作業後に開くことができるファイルのパスと名前を意味します。次に、モードとは、ファイルを開くモードを定義する文字列を意味し、基本的には4つのモードがあります

“r” – 読み取り – デフォルト値。読み取り用のファイルを開き、ファイルが存在しない場合はエラー

“a” – append -appendingのファイルを開き、存在しない場合はファイルを作成します

“w” – 書き込み – 書き込みファイルを開き、存在しない場合はファイルを作成します

“x” – 作成 – 指定されたファイルを作成し、戻ります。ファイルが存在する場合のエラー

この場合、新しいcsvファイルを作成して書き込む必要があるため、「w」または「x」を使用できます。

たとえば、変数(csv_file)を作成して、次のようなコードを書くことができます:

csv_file = open( 'ecommerce_scrape.csv'、 'w')

writer()syntax: writer(variable)>

csv.writer()メソッドは、ユーザーのデータを指定されたファイルのようなオブジェクトの区切り文字列に変換するライターオブジェクトを返します。

たとえば、変数(csv_writer)を作成して、次のようなコードを書くことができます:

csv_writer = csv.writer(csv_file)

通常、データをスクリープし、データを分割してデータをCSVの異なる特定の列に供給することを目指します。したがって、writer()の目的は、CSVファイルデータを解析する前に、解析可能な作業環境を作成することです。

Python csvファイルを解析

単一のExcelボックスのデータを読んで使用することは期待していません。代わりに、ファイルをローカルに保存してもサーバー上に保存しても、RAWデータを異なる行の見出しに分割することを目指しています。データを予想される形式で取得するには、データを解析する必要があります。今日は、方法を紹介します – writerow()。基本的に、writerow()メソッドを使用して各列の見出しを作成し、指定されたファイルにデータの行を書き込みます。

writerow()syntax: writerow(['']、[[[ '']、['']、......または[variable、variable2、variable3、....]

たとえば、次のようなコードを書くことができます:

csv_writer.writerow(['headline'、 'summary'])

これで、各列の命名はCSVファイルで実行され、列ごとに削除されたデータを送信できます。

たとえば、次のようなコードを書くことができます:

csv_writer.writerow([headline、summary])

ご存知かもしれませんが、上記のwriterowの引数は、easy2digitalのさまざまなデータセクションをこすりつけるために作成したすべての変数です。 eコマースの記事ページ。これを念頭に置いて、前のステップで行った列の命名を使用しないでください。

(注:次の章の崇高なテキストでPython3の特定のデータを削る方法について説明します。その前に、他の記事「 GoogleシートでWebスクレイピングImportXMLを自動的に収集するためにImportXML ”。開発者ツールを使用して特定のデータの位置とパスを識別し、HTML構造について学習する方法を見つけることができます。)

スクレイプデータをCSVファイルに保存

python3に伝えるために、CSVファイルのコーディング作業が終了してファイルをエクスポートするか、サーバーの場所にデータを更新する、メソッドを使用する必要がある-close()

pythonファイルメソッドclose()は、開いたファイルを閉じます。閉じたファイルを読み取ったり書いたりすることはできません。ファイルを開く必要がある操作は、ファイルが閉じた後に値を上げます。 Close()を複数回呼び出します。

pythonは、ファイルの参照オブジェクトが別のファイルに再割り当てされた場合にファイルを自動的に閉じます。 close()メソッドを使用してファイルを閉じることをお勧めします。
たとえば、書くことができますこのようなコードの行:

csv_file.close()

次に、「コマンド + b」を入力できます。崇高なテキストの見出しと要約はまだ表示されていますが、スクリプトに名前を付けた新しいCSVファイル(ecommerce_scrape.csv)が割り当てられた場所に表示されていることがわかります。

それを開こうとすると、すべてのスクレイプされた情報がCSV.fileに保存されていることがわかります。自動的にスクレイプするデータと、この新しいファイルを保存する場所に制限はありません。ビジネスの目的と作業操作に依存しています。

csvファイルの読み取り

多くの場合、eコマースSKU利益計算機の更新など、完全なワークフローを自動化するためにPythonスクリプトを作成する必要があります。したがって、既存のファイルを開き、情報を取得することは、自動プロセスの重要な成分です。ここでは、2つのパターンを紹介します。

まず、CSVモジュールをインポートし、現在作成した既存のファイルをCSV形式で開いてください。ご覧のとおり、ここでは、「x」の代わりにオープンメソッドで「r」を使用するか、「w」を使用し、情報を読みたいので、openを使用してcsv_fileとして定義します

csv

import

with open( 'ecommerce_scrape.csv'、 'r')as csv_file:

次に、読者の方法を使用して情報を取得して表示する必要があります。以下にリストされているコードの行

csv_reading = csv.reader(csv_file)

noted:reader()メソッドは、csvファイルの線の繰り返しであるreaderオブジェクトを返します。

印刷しようとする場合(csv_reading)、コマンドbを入力すると、返品はオブジェクト情報です。

ファイルに情報を表示するには、次のような行を使用してコードを記述する必要があります。 >

ループ

csv_reading:

それから、すべての情報が把握するために必要であるわけではないので、次のものを使用して使用する情報を変更して選択できます( )and [number]。
next()関数は、イテレーターから次のアイテムを返します。たとえば、この場合、各列のヘッドライン名が必要ない場合は、次のことを使用できます。

next(csv_reading)

最後になりますが、記事の見出しのような特定の列情報が必要になる場合があります。一般的なプログラミングでは、0は最初のプログラミングを意味します。そのため、記事の見出しが必要な場合は、このような印刷方法の行の後に追加できます。

print(line [0])

あなたが見ることができるように、それは返されたダッシュボードのすべての記事の見出しを示しています。

とても簡単ですよね?削ったデータを使用して、第3章:書き込み、解析、および読み取り方法をお楽しみください。もしそうなら、以下にリストされていることの1つを行うことで私たちをサポートしてください。
https://www.searchenginejournal.com/wp-content/uploads/2022/10/keyword-research-6345722969950-sej.png

  • PayPal (paypal.me/Easy2digital)を通じて弊社チャンネルをサポートおよび寄付を行う
  • Easy2Digital YouTubeチャンネルの登録と通知ベルをオンにする。
  • Easy2Digital Facebookページをフォローしていいね!を押す
  • ハッシュタグ#easy2digitalを使用して、ソーシャルネットワーク上で記事を共有する
  • Easy2Digitalの最新記事、動画、割引コードを受け取るために、週刊ニュースレターに登録する
  • www.patreon.com/louisludigitalを通じて、独占的な特典をお楽しみいただくための月額会員に登録する

よくある質問:

Q1: Pythonとは何ですか?

A: Pythonは高水準なプログラミング言語であり、直感的で読みやすい文法を持っています。

Q2: Pythonの主な特徴は何ですか?

A: Pythonの主な特徴はシンプルさ、拡張性、オープンソース性です。

Q3: Pythonはどのような用途に使用できますか?

A: PythonはWeb開発、データ分析、人工知能、科学計算、自動化など、さまざまな用途に使用できます。

Q4: Pythonのバージョンはどれが最新ですか?

A: 2021年現在、Pythonの最新バージョンはPython 3.9です。

Q5: Pythonを学ぶためにはどのようなリソースがありますか?

A: Pythonを学ぶためには、オンラインのチュートリアル、書籍、コース、コミュニティなどのリソースが利用できます。

Q6: Pythonの開発環境はどのように設定しますか?

A: Pythonの開発環境は、インストール後にテキストエディタや統合開発環境(IDE)を使用して設定できます。

Q7: Pythonでのデータ処理はどのように行いますか?

A: Pythonでのデータ処理は、組み込みのデータ構造やライブラリ(例:NumPy、Pandas)を使用して行います。

Q8: Pythonでのエラーハンドリングはどのように行いますか?

A: Pythonでのエラーハンドリングは、try-except文を使用して例外をキャッチして処理することで行います。

Q9: Pythonでのファイル操作はどのように行いますか?

A: Pythonでのファイル操作は、open関数を使用してファイルを開き、readやwriteなどのメソッドを使用して操作します。

Q10: Pythonのコードを実行するにはどのようにすればよいですか?

A: Pythonのコードを実行するには、コードを.pyファイルに保存し、コマンドラインや統合開発環境で実行するか、Pythonの対話型シェル(IDLE)で実行します。