全國(guó)咨詢(xún)/投訴熱線(xiàn):400-618-4000

首頁(yè)技術(shù)文章正文

Pandas數(shù)據(jù)預(yù)處理:更改明確指定數(shù)據(jù)的類(lèi)型

更新時(shí)間:2022-09-27 來(lái)源:黑馬程序員 瀏覽量:

IT培訓(xùn)班

  在Python中,當(dāng)我們?cè)谔幚頂?shù)據(jù)時(shí),可能會(huì)遇到數(shù)據(jù)類(lèi)型不一致的問(wèn)題。例如,通過(guò)爬蟲(chóng)采集到的數(shù)據(jù)都是整型的數(shù)據(jù),在使用數(shù)據(jù)時(shí)希望保留兩位小數(shù)點(diǎn),這時(shí)就需要將數(shù)據(jù)的類(lèi)型轉(zhuǎn)換成浮點(diǎn)型。針對(duì)這種問(wèn)題,既可以在創(chuàng)建Pandas對(duì)象時(shí)明確指定數(shù)據(jù)的類(lèi)型,也可以使用astype()方法和to_numberic()函數(shù)進(jìn)行轉(zhuǎn)換,下面先來(lái)介紹明確指定數(shù)據(jù)的類(lèi)型。

  創(chuàng)建Pandas數(shù)據(jù)對(duì)象時(shí),如果沒(méi)有明確地指出數(shù)據(jù)的類(lèi)型,則可以根據(jù)傳入的數(shù)據(jù)推斷出來(lái),并且通過(guò)dtypes屬性進(jìn)行查看。例如,創(chuàng)建一個(gè)Series對(duì)象,并查看其數(shù)據(jù)的類(lèi)型,具體代碼如下。

In [19]: import pandas as pd
         df=pd.DataFrame({'A':['5', '6', '7'], 'B':['3', '2', '1']})
         df.dtypes # 查看數(shù)據(jù)的類(lèi)型
Out[19]:
         A     object
         B     object
         dtype:object

  除此之外,還可以在創(chuàng)建Pandas對(duì)象時(shí)明確地指出數(shù)據(jù)的類(lèi)型,即在使用構(gòu)造方法創(chuàng)建對(duì)象時(shí),使用dtype參數(shù)指定數(shù)據(jù)的類(lèi)型,示例代碼如下。

In [20]: import pandas as pd
         # 創(chuàng)建DataFrame對(duì)象,數(shù)據(jù)的類(lèi)型為int
         df=pd.DataFrame({'A': ['5', '6', '7'], 'B': ['3', '2', '1']},
                           dtype='int')
         df.dtypes

Out[20]:
         A     int32
         B     int32
         dtype:  object


分享到:
在線(xiàn)咨詢(xún) 我要報(bào)名
和我們?cè)诰€(xiàn)交談!