pandas.DataFrameの行・列を指定して削除するdrop

pandas.DataFrameの行・列を指定して削除するにはdrop()メソッドを使います。

pandas.DataFrame.drop — pandas 0.21.1 documentation

ここでは以下の内容について説明します。

DataFrameの行を指定して削除 DataFrameの列を指定して削除 複数行・複数列をまとめて削除

バージョン0.21.0より前は引数labelsとaxisで行・列を指定します。0.21.0以降は引数indexまたはcolumnsが使えるようになった。 例として、以下のデータを使用します。

import pandas as pd

df = pd.read_csv('data/src/sample_pandas_normal.csv')
print(df)
#       name  age state  point
# 0    Alice   24    NY     64
# 1      Bob   42    CA     92
# 2  Charlie   18    CA     70
# 3     Dave   68    TX     70
# 4    Ellen   24    CA     88
# 5    Frank   30    NY     57

csvファイルはコチラ。

sample_pandas_normal.csv

DataFrameの行を指定して削除

引数labelsとaxisで指定します。行の場合はaxis=0。

df_new = df.drop(2, axis=0)
print(df_new)
#     name  age state  point
# 0  Alice   24    NY     64
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 4  Ellen   24    CA     88
# 5  Frank   30    NY     57

デフォルトがaxis=0なので、省略することも可能。

df_new = df.drop(2)
print(df_new)
#     name  age state  point
# 0  Alice   24    NY     64
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 4  Ellen   24    CA     88
# 5  Frank   30    NY     57

バージョン0.21.0以降からは引数indexで指定することもできます。

df_new = df.drop(index=2)
print(df_new)
#     name  age state  point
# 0  Alice   24    NY     64
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 4  Ellen   24    CA     88
# 5  Frank   30    NY     57

複数の行をまとめて削除する場合はリストで指定します。

df_new = df.drop([0, 2, 4])
print(df_new)
#     name  age state  point
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 5  Frank   30    NY     57

df_new = df.drop(index=[0, 2, 4])
print(df_new)
#     name  age state  point
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 5  Frank   30    NY     57

デフォルトでは元のDataFrameは変更されず、新しいDataFrameが返される。引数inplaceをTrueにすると、元のDataFrameが変更される。この場合、新しいDataFrameは返されず、返り値はNone。

df_org = df.copy()
df_org.drop(index=[0, 2, 4], inplace=True)
print(df_org)
#     name  age state  point
# 1    Bob   42    CA     92
# 3   Dave   68    TX     70
# 5  Frank   30    NY     57

なお、この例では行ラベルとしてデフォルトの連番を使っているので数値で指定しているが、行ラベルが文字列で設定されている場合はもちろん文字列で指定します。

df2 = pd.read_csv('data/src/sample_pandas_normal.csv', index_col=0)
print(df2)
#          age state  point
# name                     
# Alice     24    NY     64
# Bob       42    CA     92
# Charlie   18    CA     70
# Dave      68    TX     70
# Ellen     24    CA     88
# Frank     30    NY     57

df_new = df2.drop(index=['Bob', 'Dave', 'Frank'])
print(df_new)
#          age state  point
# name                     
# Alice     24    NY     64
# Charlie   18    CA     70
# Ellen     24    CA     88

DataFrameの列を指定して削除

引数labelsとaxisで指定します。列の場合はaxis=1。

df_new = df.drop('state', axis=1)
print(df_new)
#       name  age  point
# 0    Alice   24     64
# 1      Bob   42     92
# 2  Charlie   18     70
# 3     Dave   68     70
# 4    Ellen   24     88
# 5    Frank   30     57

バージョン0.21.0以降からは引数columnsで指定することもできます。

df_new = df.drop(columns='state')
print(df_new)
#       name  age  point
# 0    Alice   24     64
# 1      Bob   42     92
# 2  Charlie   18     70
# 3     Dave   68     70
# 4    Ellen   24     88
# 5    Frank   30     57

複数の列をまとめて削除する場合はリストで指定します。

df_new = df.drop(['state', 'point'], axis=1)
print(df_new)
#       name  age
# 0    Alice   24
# 1      Bob   42
# 2  Charlie   18
# 3     Dave   68
# 4    Ellen   24
# 5    Frank   30

df_new = df.drop(columns=['state', 'point'])
print(df_new)
#       name  age
# 0    Alice   24
# 1      Bob   42
# 2  Charlie   18
# 3     Dave   68
# 4    Ellen   24
# 5    Frank   30

引数inplaceについても行の場合と同様。

df_org = df.copy()
df_org.drop(columns=['state', 'point'], inplace=True)
print(df_org)
#       name  age
# 0    Alice   24
# 1      Bob   42
# 2  Charlie   18
# 3     Dave   68
# 4    Ellen   24
# 5    Frank   30

複数行・複数列をまとめて削除

バージョン0.21.0以降からは引数indexとcolumnsを同時に指定して複数行・複数列をまとめて削除することができます。

df_new = df.drop(index=[0, 2, 4], columns=['state', 'point'])
print(df_new)
#     name  age
# 1    Bob   42
# 3   Dave   68
# 5  Frank   30

df_org = df.copy()
df_org.drop(index=[0, 2, 4], columns=['state', 'point'], inplace=True)
print(df_org)
#     name  age
# 1    Bob   42
# 3   Dave   68
# 5  Frank   30

シェア

関連カテゴリー

Python pandas

pandasで要素、行、列に関数を適用するmap, applymap, apply pandasのバージョンを確認(pd.show_versions) pandas.DataFrame, Seriesの重複した行を抽出・削除 pandasの文字列から正規表現で抽出して新たな列を生成 pandas.DataFrameの行と列を入れ替える(転置) Python, pandasでwebページの表(htmlのtable)をスクレイピング pandasのMultiindexで階層ごとの統計量・サンプル数を算出 pandas.DataFrame, Seriesの行をランダムソート(シャッフル) pandasで特定の文字列を含む行を抽出(完全一致、部分一致) pandas.DataFrameの構造とその作成方法 pandas.DataFrame, Seriesの要素の値を置換するreplace pandas参考書『Pythonによるデータ分析入門』の注意点 Pythonでe-Stat APIを使って政府統計データを一括ダウンロード pandasで欠損値NaNが含まれているか判定、個数をカウント

Last Updated: 6/26/2019, 10:34:03 PM