隨著(zhù)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展,實(shí)時(shí)數據分析應用的業(yè)務(wù)需求量日益增長(cháng),例如實(shí)時(shí)推薦、實(shí)時(shí)風(fēng)控、實(shí)時(shí)監測、精準營(yíng)銷(xiāo)等,數據實(shí)時(shí)處理能力成為企業(yè)提升競爭力的一大因素。華為云GaussDB(DWS)實(shí)時(shí)數倉提供即開(kāi)即用、可擴展且完全托管的分析型數據倉庫服務(wù),支撐高并發(fā)高性能實(shí)時(shí)數據分析。4月8日,在華為云TechWave全球技術(shù)峰會(huì )數據使能分論壇上,GaussDB(DWS)技術(shù)專(zhuān)家詳談實(shí)時(shí)數倉黑科技。
GaussDB(DWS)實(shí)時(shí)數據分析技術(shù)架構基于企業(yè)級內核,采用統一SQL引擎,多引擎協(xié)同,實(shí)現數據體系內自閉環(huán),從而達到一份數據多個(gè)引擎調用,高效多維度分析。依據流數據和時(shí)序數據特征打造出從優(yōu)化器、執行器到存儲的全系列、高性能、可擴展的實(shí)時(shí)數倉,提供四大技術(shù)創(chuàng )新:
1.CEP引擎告別T+1模式
改變傳統數據先入庫再查詢(xún)的分析模式,CEP引擎提供流計算能力:數據先計算分析,并實(shí)時(shí)反饋計算結果,計算結果可以繼續進(jìn)行下一步計算或者保存,大大降低了數據處理時(shí)延。
2.1=N:GaussDB(DWS)實(shí)時(shí)數倉=Flink/SparkStreaming+Druid+InfluxDB……
國內首創(chuàng )在同一套系統內實(shí)現流和時(shí)序數據的處理和預聚合操作,減少數據跨系統間遷移,降低冗余存儲和加載時(shí)間,最大化的利用系統緩存,提高處理效率。
3.預置豐富時(shí)序、流處理函數,一切皆SQL
采用最簡(jiǎn)潔高效的數據開(kāi)發(fā)語(yǔ)言SQL,并預置豐富的時(shí)序和流處理函數,通過(guò)SQL即可完成復雜流式計算,可實(shí)現億級數據,秒級聚合,極大簡(jiǎn)化應用開(kāi)發(fā)。
4.高達40:1的壓縮比,極大節約存儲成本
通過(guò)自適應壓縮算法,充分利用行列混合存儲+時(shí)序數據專(zhuān)用壓縮算法優(yōu)勢,實(shí)現低時(shí)延查詢(xún)和高效存儲。

技術(shù)專(zhuān)家還分享了實(shí)時(shí)智能監控平臺的實(shí)踐,傳統數據倉庫單節點(diǎn)入口性能和散列度存在瓶頸,GaussDB(DWS)實(shí)時(shí)數倉單節點(diǎn)入庫性能超過(guò)10w/s,支持千萬(wàn)級散列度計算,徹底解決時(shí)序數據和流數據“裝不進(jìn)”和“算不動(dòng)”的問(wèn)題。
目前GaussDB(DWS)實(shí)時(shí)數倉已經(jīng)正式發(fā)布公測。華為云GaussDB(DWS)實(shí)時(shí)數倉仍將不斷迭代優(yōu)化,為企業(yè)用戶(hù)提供更強大的實(shí)時(shí)數據分析能力。
責任編輯: 中國能源網(wǎng)