data=[1,2,3,4,5]
df=pd.DataFrame(data)
print(df)
data=[1,2,3,4,5]
df=pd.Series(data)
print(df)
#列表中的每一个元素代表一行数据
data=[[;xiaowang;,20],[;Lily;,30],[;Anna;,40]]
#未分配列标签
df=pd.DataFrame(data)
print(df)
data=[[;xiaowang;,20],[;Lily;,30],[;Anna;,40]]
#分配列标签
df=pd.DtaFrame(data,columns=[;Name;,;Age;])
print(df)
指定数值元素的数据类型为float
需要注意;dtype只能设置一个;设置多个列的数据类型;需要使用其他形式
data=[{;a;:1,;b;:2},{;a;:5,;b;:10,;c;:20}]
#df=pd.DataFrame(data)
df=pd.DataFrame(data,index=[;first;,;second;])
print(df)
d={;one;:pd.Series([1,2,3],index=[;a;,;b;,;c;]),
;two;:pd.Series([1,2,3,4],index=[;a;,;b;,;c;,;d;])}
df=pd.DataFrame(d)
print(df)
python数据分析及可视化(七)pandas数据清洗,显性问题(异常、缺失、重复),隐形问题(离散、面元、字符串)