17.6K
7307
流式大數據
大數據處理系統中的大數據可分為批式大數據和流式大數據兩類(lèi)。其中,批式大數據又稱(chēng)歷史大數據,流式大數據又稱(chēng)實(shí)時(shí)大數據。
流式計算取代傳統的批處理計算被廣泛應用于實(shí)時(shí)信息推薦、實(shí)時(shí)搜索等領(lǐng)域中。與大數據批處理不同,流式大數據處理的特點(diǎn)主要包括:①流水式數據模式。數據源源不斷流入處理單元被處理,各個(gè)處理單元之間通過(guò)網(wǎng)絡(luò )進(jìn)行傳播。②數據產(chǎn)生速率隨時(shí)間呈波動(dòng)性變化。由于流式大數據處理平臺上的數據多來(lái)源于用戶(hù)行為產(chǎn)生的數據,而用戶(hù)行為隨時(shí)間波動(dòng)性變化。③數據具有高時(shí)效性。在實(shí)時(shí)處理業(yè)務(wù)場(chǎng)景中,對數據處理過(guò)程中的延遲要求十分嚴格。流式大數據處理平臺以低延遲作為服務(wù)質(zhì)量的主要目標之一。流式大數據處理平臺主要分為兩類(lèi),即小批量數據流處理和直接數據流處理等。

