在现实世界中, 将通过从现有存储中加载数据集来创建Pandas DataFrame, 存储可以是SQL数据库, CSV文件和Excel文件。可以从列表, 字典以及字典列表等创建Pandas DataFrame。
数据框是二维数据结构, 即, 数据以表格的形式在行和列中对齐。在以行和列排列的数据框数据集中, 我们可以在一个数据框中存储任意数量的数据集。我们可以对这些数据集执行许多操作, 例如算术运算, 列/行选择, 列/行加法等。
Pandas DataFrame可以通过多种方式创建。让我们逐一讨论创建DataFrame的不同方法。
创建一个空的数据框:
可以创建的基本DataFrame是Empty Dataframe。仅通过调用数据框构造函数即可创建一个空数据框。
# import pandas as pd
import pandas as pd
# Calling DataFrame constructor
df = pd.DataFrame()
print (df)
输出:
Empty DataFrame
Columns: []
Index: []
使用列表创建数据框
:
可以使用单个列表或列表列表创建DataFrame。
# import pandas as pd
import pandas as pd
# list of strings
lst = [ 'Geeks' , 'For' , 'Geeks' , 'is' , 'portal' , 'for' , 'Geeks' ]
# Calling DataFrame constructor on list
df = pd.DataFrame(lst)
print (df)
输出如下:
从ndarray/list的字典创建DataFrame
:
要从narray/list的dict创建DataFrame, 所有narray的长度必须相同。如果传递了索引, 则长度索引应等于数组的长度。如果没有传递索引, 则默认情况下, 索引将是range(n), 其中n是数组长度。
# Python code demonstrate creating
# DataFrame from dict narray /lists
# By default addresses.
import pandas as pd
# intialise data of lists.
data = { 'Name' :[ 'Tom' , 'nick' , 'krish' , 'jack' ], 'Age' :[ 20 , 21 , 19 , 18 ]}
# Create DataFrame
df = pd.DataFrame(data)
# Print the output.
print (df)
输出如下:
使用字典从列表创建Pandas 数据框
:
使用字典从列表创建Pandas 数据框架可以通过不同的方式来实现。我们可以使用以下字典从列表中创建Pandas 数据框:
Pandas .DataFrame
。使用Pandas中的此方法, 我们可以将列表的字典转换为数据框。
# importing pandas as pd
import pandas as pd
# dictionary of lists
dict = { 'name' :[ "aparna" , "pankaj" , "sudhir" , "Geeku" ], 'degree' : [ "MBA" , "BCA" , "M.Tech" , "MBA" ], 'score' :[ 90 , 40 , 80 , 98 ]}
df = pd.DataFrame( dict )
print (df)
输出如下:
创建数据框的多种方法:
- 创建Pandas 数据框的不同方法
- 使用zip从列表创建Pandas 数据框
- 从字典列表创建Pandas DataFrame
- 从等长列表的字典创建Pandas Dataframe
- 使用列表创建数据框
- 使用字典从列表创建Pandas 数据框
首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。