183.17.231.* 2020-11-09 13:42:01 |
數(shù)據(jù)可視化起源于圖形學(xué)、計(jì)算機(jī)圖形學(xué)、人工智能、科學(xué)可視化以及用戶界面等領(lǐng)域的相互促進(jìn)和發(fā)展,是當(dāng)前計(jì)算機(jī)科學(xué)的一個(gè)重要研究方向,它利用計(jì)算機(jī)對(duì)抽象信息進(jìn)行直觀的表示,以利于快速檢索信息和增強(qiáng)認(rèn)知能力。
數(shù)據(jù)可視化到底能干什么呢?數(shù)據(jù)可視化系統(tǒng)并不是為了展示用戶的已知的數(shù)據(jù)之間的規(guī)律,而是為了幫助用戶通過認(rèn)知數(shù)據(jù),有新的發(fā)現(xiàn),發(fā)現(xiàn)這些數(shù)據(jù)所反映的實(shí)質(zhì)。
從技術(shù)上來說,大數(shù)據(jù)可視化的實(shí)施步驟主要有四項(xiàng):需求分析,建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市模型,數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL),建立可視化分析場(chǎng)景。
一、需求分析
需求分析是大數(shù)據(jù)可視化項(xiàng)目開展的前提,要描述項(xiàng)目背景與目的、業(yè)務(wù)目標(biāo)、業(yè)務(wù)范圍、業(yè)務(wù)需求和功能需求等內(nèi)容,明確實(shí)施單位對(duì)可視化的期望和需求。包括需要分析的主題、各主題可能查看的角度、需要發(fā)泄企業(yè)各方面的規(guī)律、用戶的需求等內(nèi)容。
二、建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型
數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型是在需求分析的基礎(chǔ)上建立起來的。數(shù)據(jù)倉庫/數(shù)據(jù)集市建模除了數(shù)據(jù)庫的ER建模和關(guān)系建模,還包括專門針對(duì)數(shù)據(jù)倉庫的維度建模技術(shù)。維度建模的關(guān)鍵在于明確下面四個(gè)問題:
1.哪些維度對(duì)主題分析有用?
2.如何使用現(xiàn)有數(shù)據(jù)生成維表?
3.用什么指標(biāo)來"度量"主題?
4.如何使用現(xiàn)有數(shù)據(jù)生成事實(shí)表?
三、數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL)
數(shù)據(jù)抽取是指將數(shù)據(jù)倉庫/集市需要的數(shù)據(jù)從各個(gè)業(yè)務(wù)系統(tǒng)中抽離出來,因?yàn)槊總(gè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)質(zhì)量不同,所以要對(duì)每個(gè)數(shù)據(jù)源建立不同的抽取程序,每個(gè)數(shù)據(jù)抽取流程都需要使用接口將元數(shù)據(jù)傳送到清洗和轉(zhuǎn)換階段。
數(shù)據(jù)清洗的目的是保證抽取的原數(shù)據(jù)的質(zhì)量符合數(shù)據(jù)倉庫/集市的要求并保持?jǐn)?shù)據(jù)的一致性。
數(shù)據(jù)轉(zhuǎn)換是整個(gè)ETL過程的核心部分,主要是對(duì)原數(shù)據(jù)進(jìn)行計(jì)算和放大。數(shù)據(jù)加載是按照數(shù)據(jù)倉庫/集市模型中各個(gè)實(shí)體之間的關(guān)系將數(shù)據(jù)加載到目標(biāo)表中。
四、建立可視化場(chǎng)景
建立可視化場(chǎng)景是對(duì)數(shù)據(jù)倉庫/集市中的數(shù)據(jù)進(jìn)行分析處理的成果,用戶能夠借此從多個(gè)角度查看企業(yè)/單位的運(yùn)營(yíng)狀況,按照不同的主題和方式探查企業(yè)/單位業(yè)務(wù)內(nèi)容的核心數(shù)據(jù),從而作出更精準(zhǔn)的預(yù)測(cè)和判斷。
大數(shù)據(jù)可視化有哪些分析步驟.中琛魔方大數(shù)據(jù)平臺(tái)(www.zcmorefun.com)表示隨著社會(huì)的發(fā)展,大數(shù)據(jù)可視化的新工具和圖表類型也不斷涌現(xiàn),每一種都試圖創(chuàng)造出比以往更有吸引力,更有利于信息圖表的傳播,所以,可視化項(xiàng)目應(yīng)該自己去親自感受總結(jié)方法,以及享受過程步驟,這樣才能更加易懂。 |