目前的互聯(lián)網(wǎng)已經(jīng)邁入大數(shù)據(jù)時代,通過對海量的數(shù)據(jù)進(jìn)行分析,能夠產(chǎn)生極大的商業(yè)價值。如果我們需要大量數(shù)據(jù),有哪些獲取數(shù)據(jù)的方式呢?常用的方式主要有以下5種。查看全文>>
字符串是一種表示文本的數(shù)據(jù)類型,字符串中的字符可以是ASCII字符、各種符號以及各種Unicode字符。Python中的字符串有如下三種表現(xiàn)方式。第1種方式:使用單引號包含字符。示例代碼如下:查看全文>>
前期采集到的數(shù)據(jù),或多或少都存在一些瑕疵和不足,比如數(shù)據(jù)缺失、極端值、數(shù)據(jù)格式不統(tǒng)一等問題。因此,在分析數(shù)據(jù)之前需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)的清洗、合并、重塑與轉(zhuǎn)換。Pandas中專門提供了用于數(shù)據(jù)預(yù)處理的很多函數(shù)與方法,用于替換異常數(shù)據(jù)、合并數(shù)據(jù)、重塑數(shù)據(jù)。查看全文>>
斐波那契數(shù)列(Fibonacci sequence),又稱黃金分割數(shù)列、因數(shù)學(xué)家萊昂納多·斐波那契(Leonardoda Fibonacci)以兔子繁殖為例子而引入,故又稱為“兔子數(shù)列”。查看全文>>
MySQL屬于關(guān)系型數(shù)據(jù)庫,Mongodb屬于非關(guān)系型數(shù)據(jù)庫,兩者有不同的特點,為什么選擇Mongodb而非MySQL存儲爬蟲數(shù)據(jù)呢?本節(jié)課就對這一問題做詳細(xì)解答。查看全文>>
Python中的模塊可分為三類,分別是內(nèi)置模塊、第三方模塊和自定義模塊,相關(guān)介紹如下。查看全文>>