在分析通常非常庞大的真实数据集时, 我们可能需要获取列名才能执行某些特定操作。
让我们讨论一下如何在Pandas中获取列名数据框.
首先, 让我们创建一个简单的数据框nba.csv文件。
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "https://media.lsbin.org/wp-content/uploads/nba.csv" )
# calling head() method
# storing in new variable
data_top = data.head()
# display
data_top
现在, 让我们尝试从上面的数据集中获取列名称。
方法1:只需遍历列
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "nba.csv" )
# iterating the columns
for col in data.columns:
print (col)
输出如下:
方法2:将列与数据框对象一起使用
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "nba.csv" )
# list(data) or
list (data.columns)
输出如下:
方法3:column.values方法返回一个索引数组。
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "nba.csv" )
list (data.columns.values)
输出如下:
方法4:使用tolist()具有给定列列表的值的方法。
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "nba.csv" )
list (data.columns.values.tolist())
输出如下:
方法5:使用sorted()方法
Sorted()方法将返回按字母顺序排序的列的列表。
# Import pandas package
import pandas as pd
# making data frame
data = pd.read_csv( "nba.csv" )
# using sorted() method
sorted (data)
输出如下:
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。