如果你是一個pandas初學者,那么不知道你會不會像我一樣。在學用列表或者數組創建DataFrame時理不清怎樣用數據生成以及想要形狀的的Dataframe,那么,現在,你不用自己琢磨了,我這里給你整理了一下,現在我們就來看看這三種生成Dataframe的方式。
1.用傳入列表或者數組創建DataFrame 采用列表創建DataFrame
nums = [[i for i in range(3)] for _ in range(10)] nums
colu = [f'col_{i}' for i in range(3)] # 用來做列名 inde = [f'row_{i}' for i in range(10)] # 用來做索引 pd.DataFrame(data=nums,index=inde,columns=colu) # 參數解釋:data是要傳入的數據,index是索引(不指定會自動產生自增長的索引), # columns為指定的列名,按照順序裝在一個列表中
不知道你發現沒有,生成的DataFrame形狀和前面的列表'長相‘是一樣的,所以,以后要用這種方式創建DataFrame的話是不是只要先把列表生成好形狀,就不用再調整DataFrame形狀了。
當然用數組創建DataFrame其實是一樣的道理,所以我不演示了,我這里給一段代碼,需要請自行調試。
用列表創建DataFrame
import numpy as np import pandas as pd nums = np.array([i for i in range(1,31)]).reshape(10,3) colu = [f'col_{i}' for i in range(3)] inde = [f'row_{i}' for i in range(10)] pd.DataFrame(data=nums,index=inde,columns=colu)
實際上這兩種方式我們并不推薦,我們更推薦用下面這種data參數給字典的方式來創建DataFrame
2.傳入字典形式參數創建DataFrame
import numpy as np import pandas as pd hight = np.random.randint(158,180,10) weight = np.random.randint(49,75,10) pd.DataFrame(data={ 'hight':hight, 'weight':weight,} ) # 這里沒有設置索引,會自動生成
怎么樣,這樣是不是超級簡單呢?
將直接讀取數據文件生成DataFrame
但實際上以上創建DataFrame的方式都不是日常工作中最常用的,很多時候,其實我們是直接讀取以個文件,然后將文件中的數據放入DataFrame中進行數據分析。
那么,接下來我們看一下用pandas讀取excel文件或者csv文件
當我們輸入代碼pd.read_然后按tab鍵我們發現
因此我們發現,其實不僅僅是csv和excel文件,實際上還可以讀取很多種類型的文件,但這里我們只演示讀取excel和csv文件
讀取excel
df = pd.read_excel('data/2020年銷售數據.xlsx') df
讀取csv
df = pd.read_csv('data/2018年北京積分落戶數據.csv',encoding='utf-8') # encoding參數指定數據的編碼方式為utf-8 df
好了,創建DataFrame就先分享到這里,下篇文章見。
到此這篇關于pandas創建DataFrame的方式小結的文章就介紹到這了,更多相關pandas創建DataFrame內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://blog.csdn.net/dchzxl/article/details/120558378