首頁技術(shù)文章正文

HDFS存儲架構(gòu)【大數(shù)據(jù)技術(shù)文章】

更新時(shí)間:2020-12-30 來源:黑馬程序員瀏覽量:

1577370495235_學(xué)IT就到黑馬程序員.gif

　　HDFS是一個(gè)分布式的文件系統(tǒng)，相比普通的文件系統(tǒng)來說更加復(fù)雜，因此在學(xué)習(xí)HDFS的操作之前有必要先來學(xué)習(xí)一下HDFS的存儲架構(gòu)。如圖1所示。

圖1 HDFS存儲架構(gòu)圖

　　從圖1可以看出，HDFS采用主從架構(gòu)(Master/Slave架構(gòu))。HDFS集群分別是由一個(gè)NameNode和多個(gè)的 DataNode組成。其中，NameNode是HDFS集群的主節(jié)點(diǎn)，負(fù)責(zé)管理文件系統(tǒng)的命名空間以及客戶端對文件的訪問;DataNode是集群的從節(jié)點(diǎn)，負(fù)責(zé)管理它所在節(jié)點(diǎn)上的數(shù)據(jù)存儲。HDFS分布式文件系統(tǒng)中的NameNode和DataNode兩種角色各司其職，共同協(xié)調(diào)完成分布式的文件存儲服務(wù)。

　　那么，NameNode是如何管理分布式文件系統(tǒng)的命名空間呢?其實(shí)，在NameNode內(nèi)部是以元數(shù)據(jù)的形式，維護(hù)著兩個(gè)文件，分別是FsImage鏡像文件和EditLog日志文件。其中，F(xiàn)sImage鏡像文件用于存儲整個(gè)文件系統(tǒng)命名空間的信息，EditLog日志文件用于持久化記錄文件系統(tǒng)元數(shù)據(jù)發(fā)生的變化。當(dāng)NameNode啟動(dòng)的時(shí)候，F(xiàn)sImage鏡像文件就會被加載到內(nèi)存中，然后對內(nèi)存里的數(shù)據(jù)執(zhí)行記錄的操作，以確保內(nèi)存所保留的數(shù)據(jù)處于最新的狀態(tài)，這樣就加快了元數(shù)據(jù)的讀取和更新操作。

　　隨著集群運(yùn)行時(shí)間長，NameNode中存儲的元數(shù)據(jù)信息越來越多，這樣就會導(dǎo)致EditLog日志文件越來越大。當(dāng)集群重啟時(shí)，NameNode需要恢復(fù)元數(shù)據(jù)信息，首先加載上一次的FsImage鏡像文件，然后在重復(fù)EditLog日志文件的操作記錄，一旦EditLog日志文件很大，在合并的過程中就會花費(fèi)很長時(shí)間，而且如果NameNode宕機(jī)就會丟失數(shù)據(jù)。為了解決這個(gè)問題，HDFS中提供了Secondary NameNode(輔助名稱節(jié)點(diǎn))，它并不是要取代掉NameNode也不是NameNode的備份，它的職責(zé)主要是是周期性的把NameNode中的EditLog日志文件合并到FsImage鏡像文件中，從而減小EditLog日志文件的大小，縮短集群重啟時(shí)間，并且也保證了HDFS系統(tǒng)的完整性。

　　Namenode存儲的是元數(shù)據(jù)信息，元數(shù)據(jù)信息并不是真正的數(shù)據(jù)，真正的數(shù)據(jù)是存儲在DataNode中。DataNode是負(fù)責(zé)管理它所在節(jié)點(diǎn)上的數(shù)據(jù)存儲。DataNode中的數(shù)據(jù)塊是以文件的類型存儲在磁盤中，其中包含兩個(gè)文件，一是數(shù)據(jù)本身(僅數(shù)據(jù))，二是每個(gè)數(shù)據(jù)塊對應(yīng)的一個(gè)元數(shù)據(jù)文件(包括數(shù)據(jù)長度，塊數(shù)據(jù)校驗(yàn)和，以及時(shí)間戳)。

猜你喜歡：

Spark Shell讀取HDFS文件的步驟有哪些？

什么是DAG?有向無環(huán)圖的幾種連貫關(guān)系講解

Scala下載和環(huán)境變量配置教程

黑馬程序員大數(shù)據(jù)培訓(xùn)課程

最新資訊

有哪些頁面置換算法?
2024-05-22
如何解決Redis的并發(fā)競爭Key問題?
2024-05-22
varchar和char的使用場景?
2024-05-22
協(xié)程為何比線程還快?
2024-05-17
TIME_WAIT過多是因?yàn)槭裁?
2024-05-17
range和xrange的區(qū)別是什么?
2024-05-17

相關(guān)閱讀

分享到：

javaee

python大數(shù)據(jù)

web

ui

cloud

test

c

netmarket

pm

Linux

movies

robot

uids

AI

jdbc

選擇校區(qū)

北京校區(qū)

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

申請?jiān)嚶犆~

熱門課程推薦

更多>>

首頁|校區(qū)分布|師資力量|關(guān)于我們|報(bào)名流程

常見問題|技術(shù)資訊

江蘇傳智播客教育科技股份有限公司版權(quán)所有
Copyright 2006-2023, All Rights Reserved

在線咨詢我要報(bào)名

和我們在線交談！