大數(shù)據(jù)培訓(xùn)機(jī)構(gòu):淺談Hive vs HBase。對(duì)于剛接觸大數(shù)據(jù)分析的用戶來(lái)說(shuō),要想?yún)^(qū)分Hive與HBase是有一定難度的。本文將嘗試從其各自的
大數(shù)據(jù)培訓(xùn)機(jī)構(gòu):淺談Hive vs. HBase。對(duì)于剛接觸大數(shù)據(jù)分析的用戶來(lái)說(shuō),要想?yún)^(qū)分Hive與HBase是有一定難度的。本文將嘗試從其各自的定義、特點(diǎn)、限制、應(yīng)用場(chǎng)景等角度來(lái)進(jìn)行分析,以作拋磚引玉之用。
Apache HBase是運(yùn)行于HDFS頂層的NoSQL(=Not Only SQL,泛指非關(guān)系型的數(shù)據(jù)庫(kù))數(shù)據(jù)庫(kù)系統(tǒng)。區(qū)別于Hive,HBase具備隨即讀寫功能,是一種面向列的數(shù)據(jù)庫(kù)。HBase以表的形式存儲(chǔ)數(shù)據(jù),表由行和列組成,列劃分為若干個(gè)列簇(row family)。例如:一個(gè)消息列簇包含了發(fā)送者、接受者、發(fā)送日期、消息標(biāo)題以及消息內(nèi)容。每一對(duì)鍵值在HBase會(huì)被定義為一個(gè)Cell,其中,鍵由row-key(行鍵),列簇,列,時(shí)間戳構(gòu)成。而在HBase中每一行代表由行鍵標(biāo)識(shí)的鍵值映射組合。Hbase目標(biāo)主要依靠橫向擴(kuò)展,通過(guò)不斷增加廉價(jià)的商用服務(wù)器,來(lái)增加計(jì)算和存儲(chǔ)能力。