ブログ記事5件
先々週、かなりはまった部分を書き残しておきます。DataFrameで一旦読み込んでしまったObject型をDatetime型に変換する手法が、ダイレクトに検索できなかったので、今後の仕事のためにも書き残し。GCSのストレージから直接読み込んだファイル内容を処理してます。インデントで整形されてしまっているレコードを1行形式に再整形。#GCSから処理対象ファイルを取得storage_client=storage.Client(project=PROJECT_ID)buc
PythonにはNumPyという便利なライブラリがありますが、それの2次元行列をExcel的に拡張したものがpandasと思えばいいでしょうか。NumPyだと要素の型が同じでないとダメなのですが、pandasだとExcelのようにカラムごとの型を変えられるところが便利な点でしょう。この本を読むとSeriesおよびDataFrameというデータ構造が重要らしいですが、基本的にDataFrameだけ使えばよさそう。Excelは行のフィルタリングが簡単な
Spark'sfrequentlyusedcodenotesSinceSparkisaPythonprogram,itcanbewrittenquitefreely.However,sinceIalwayshaveageneralideaofwhatIneedtodo,andknowi…
クエリ関数を使っての操作print(df.query('state=="CA"'))#nameagestatepoint#1Bob42CA92#2Charlie18CA70#4Ellen24CA88print(df.query('state!="CA"'))#nameagestatepoint#0Alice24
特定の列をリストに変換するdf=pd.read_excel('https://biotech-lab.org/wp-content/uploads/2020/03/dataframe-sample-01.xlsx')list_sample=df['名前'].to_list()print(list_sample)特定の行をリストに変換するdf=pd.read_excel('https://biotech-lab.org/wp-content/uploads/2020/03/d