全國(guó)咨詢(xún)/投訴熱線(xiàn):400-618-4000

首頁(yè)技術(shù)文章正文

什么是數(shù)據(jù)倉(cāng)庫(kù)?Hive數(shù)據(jù)倉(cāng)庫(kù)特點(diǎn)簡(jiǎn)介

更新時(shí)間:2020-12-07 來(lái)源:黑馬程序員 瀏覽量:

  數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、隨時(shí)間變化的,但信息本身相對(duì)穩(wěn)定的數(shù)據(jù)集合,它用于支持企業(yè)或組織的決策分析處理,這里對(duì)數(shù)據(jù)倉(cāng)庫(kù)的定義,指出了數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)特點(diǎn):

  數(shù)據(jù)倉(cāng)庫(kù)是面向主題的

  操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)組織是面向事務(wù)處理任務(wù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織,這里說(shuō)的“主題”是一個(gè)抽象的概念,它指的是用戶(hù)使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)關(guān)心的重點(diǎn)方面,一個(gè)主題通常與多個(gè)操作型信息系統(tǒng)相關(guān)。例如,商品的推薦系統(tǒng)就是基于數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的,商品的信息就是數(shù)據(jù)倉(cāng)庫(kù)所面向的主題。

  數(shù)據(jù)倉(cāng)庫(kù)是隨時(shí)間變化的

  數(shù)據(jù)倉(cāng)庫(kù)是不同時(shí)間的數(shù)據(jù)集合,它所擁有的信息并不只是反映企業(yè)當(dāng)前的運(yùn)營(yíng)狀態(tài),而是記錄了從過(guò)去某一時(shí)間點(diǎn)到當(dāng)前各個(gè)階段的信息。可以這么說(shuō),數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)保存時(shí)限要能滿(mǎn)足進(jìn)行決策分析的需要(例如:過(guò)去的5-10年),而且數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)都要標(biāo)明該數(shù)據(jù)的歷史時(shí)期。

  數(shù)據(jù)倉(cāng)庫(kù)相對(duì)穩(wěn)定

  數(shù)據(jù)倉(cāng)庫(kù)是不可更新的。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)主要目的是為決策分析提供數(shù)據(jù),所涉及的操作主要是數(shù)據(jù)的查詢(xún),一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢(xún)操作,修改和刪除操作很少,通常只需要定期的加載、刷新來(lái)更新數(shù)據(jù)。

  多學(xué)一招:OLTP和OLAP

  數(shù)據(jù)處理大致可以分為兩類(lèi),分別是聯(lián)機(jī)事務(wù)處理OLTP和聯(lián)機(jī)分析處理OLAP,其中:

  (1) OLTP是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的主要應(yīng)用,主要針對(duì)的是基本的日常事務(wù)處理,例如,銀行轉(zhuǎn)賬。

  (2) OLAP是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢(xún)結(jié)果,例如,商品的推薦系統(tǒng)。

  接下來(lái),通過(guò)一張表來(lái)比較OLTP和OLAP,具體如表1所示。

  表1 OLTP和OLAP的對(duì)比
1607322367849_20201202171534742.png



猜你喜歡:

Sqoop是什么?Sqoop發(fā)展歷程簡(jiǎn)介

MapReduce程序如何設(shè)置本地運(yùn)行模式?

黑馬程序員大數(shù)據(jù)培訓(xùn)課程 

分享到:
在線(xiàn)咨詢(xún) 我要報(bào)名
和我們?cè)诰€(xiàn)交談!