更新時間:2022-08-22 來源:黑馬程序員 瀏覽量:
concat()函數(shù)可以沿著一條軸將多個對象進行堆疊,其使用方式類似數(shù)據(jù)庫中的數(shù)據(jù)表合并,該函數(shù)的語法格式如下:
pandas.contact(objs,axis=0,join='outer',join_axes=None,ignore_index=False, keys=None,levels=None,names=None,verify_integrity=False, sort=None, copy=True)
上述函數(shù)中常用參數(shù)表示的含義如下:
(1)axis:表示連接的軸向,可以為0或1,默認為0。
(2)join:表示連接的方式,inner表示內連接,outer表示外連接,默認使用外連接。
(3)ignore_index:接收布爾值,默認為False。如果設置為True,則表示清除現(xiàn)有索引并重置索引值。
(4)keys:接收序列,表示添加最外層索引。
(5)levels:用于構建MultiIndex的特定級別(唯一值)。
(6)names:在設置了keys和level參數(shù)后,用于創(chuàng)建分層級別的名稱。
(7)verify_integerity:檢查新的連接軸是否包含重復項。接收布爾值,當設置為True時,如果有重復的軸將會拋出錯誤,默認為False。
根據(jù)軸方向的不同(axis參數(shù)),可以將堆疊分成橫向堆疊或縱向堆疊,默認采用的是縱向堆疊方式。在堆疊數(shù)據(jù)時,默認采用的是縱向堆疊方式。在堆疊數(shù)據(jù)時,默認采用的是外連接(join參數(shù)設為outer)的方式,當然也可以通過join=inner設置為內連接的方式,圖4-10是兩種連接方式的示意圖。
圖4-10 連接方式
圖4-10中,A和B分別表示兩個數(shù)據(jù)集。當A與B采用外連接的方式合并時,所得的結果為索引并集部分的數(shù)據(jù),數(shù)據(jù)不足的地方使用NaN補齊即可;當A與B采用內連接的方式合并時,則所得的結果僅僅為索引交集(重疊)部分的數(shù)據(jù)。