PythonとpandasでCSVファイルを読み込もうとしたら、いつもはうまくいくpd.read_csv()が突然エラーを吐き出して、処理が止まってしまった…。そんな経験はありませんか?特に、様々なシステムから出力された生データを扱う際によく遭遇するのがこの問題です。
PythonにはCSV形式のデータを扱うためのCSVモジュールがあります。ですがデータ処理といえばPandasという有名なライブラリがあります。Pandasはcsvだけでなく、Excel形式のデータ(拡張子が.xls、.xlsxのやつ)、JSONやHTML形式のデータが扱えます。 ではcsvデータ ...
次にCSVファイルをPythonで読み込んで、中身のデータを確認していきます。分析するのは前回の記事でも使ったコンビニエンスストアの売り上げと関連情報をまとめたデータ「sales_data.csv」です。 今回の分析に利用するデータの中身。コンビニエンスストアの ...
会員(無料)になると、いいね!でマイページに保存できます。 上記以外に、機械学習を実装するときに使うPythonのオープンソースのライブラリもあります。代表的なものがscikit-learnです。 scikit-learnは開発が活発に行われているため、改善が高速に進み ...
まずは、前回のおさらいだ。前回に取り上げたコードよりもシンプルにしたコードを次に示す。 pandas_create_4.py import pandas as ...
門脇@satoru_kadowakiです。今月のPython Monthly Topicsでは、Rust製の高速データフレームライブラリ Polarsについて紹介します。 Polarsとは Pythonでデータ分析に使用される主なライブラリに pandasがあります。Polarsはpandasと同様にデータフレームというデータ構造 ...
今や大人気のスクリプト言語「Python」は、PC内の処理はもちろんインターネットやクラウドとの親和性も高いという特徴を持つ。Pythonを使ってExcelファイルの変換などPC内で完結する処理から、クラウドを活用した各種自動化処理まで便利なスクリプトの数々 ...
最初に、PythonとExcelで「どちらが気軽に使えるか」を比べてみよう。言うまでもなく、Excelを使う時は、スプレッドシートのセルにデータを入力し、マウスで操作を選んでいくというスタイルだ。これに対して、Pythonはエディタでプログラムを書いて実行する ...