你對于元數(shù)據(jù)管理有興趣嘛?元數(shù)據(jù)管理被越來越多的企業(yè)所需求,元數(shù)據(jù)是通過企業(yè)中的用戶和技術(shù)用戶溝通得來的。下面是小編帶來的DAMA元數(shù)據(jù)管理活動學(xué)習(xí)心得,有興趣的可以看看。
理解元數(shù)據(jù)需求
元數(shù)據(jù)管理戰(zhàn)略必須反映對企業(yè)元數(shù)據(jù)需求的理解,收集需求的目的包括:
確認(rèn)企業(yè)需要元數(shù)據(jù)管理環(huán)境
設(shè)定范圍和優(yōu)先級
教育和溝通
指導(dǎo)工具評估和實(shí)施
指導(dǎo)元數(shù)據(jù)建模
指導(dǎo)建立元數(shù)據(jù)內(nèi)部標(biāo)準(zhǔn)
指導(dǎo)提供基于元數(shù)據(jù)的服務(wù)
元數(shù)據(jù)需求是通過與企業(yè)中的業(yè)務(wù)用戶和技術(shù)用戶進(jìn)行溝通而獲得的,并且對企業(yè)中特定人員的崗位角色、職責(zé)、挑戰(zhàn)等進(jìn)行分析可提煉出需求,而不是簡單地詢問用戶的元數(shù)據(jù)需求
業(yè)務(wù)用戶對來自于操作型系統(tǒng)和分析系統(tǒng)的信息需要加深理解,來自企業(yè)數(shù)據(jù)倉庫、分析應(yīng)用和操作型系統(tǒng)需要產(chǎn)生讓業(yè)務(wù)用戶可以高度信任的信息。此外還需要根據(jù)角色定制的信息提供方法,如報(bào)表、查詢、推送、OLAP、儀表盤等,同時(shí)還要附帶高質(zhì)量的文檔和信息的上下文背景
業(yè)務(wù)用戶需要理解元數(shù)據(jù)管理的意圖和目的,為了給用戶提供有意義的業(yè)務(wù)需求,需要讓他們學(xué)習(xí)數(shù)據(jù)與元數(shù)據(jù)的區(qū)別,如何讓業(yè)務(wù)用戶的關(guān)注點(diǎn)限定在元數(shù)據(jù)需求而非其他的數(shù)據(jù)需求則是一個(gè)挑戰(zhàn)
另一個(gè)對元數(shù)據(jù)管理的成功至關(guān)重要的因素是建立數(shù)據(jù)治理組織,數(shù)據(jù)治理委員會是企業(yè)數(shù)據(jù)和元數(shù)據(jù)管理的方向和需求的治理主體
技術(shù)用戶宏觀的技術(shù)需求主題包括:
每日數(shù)據(jù)處理流量-大小和處理時(shí)間
現(xiàn)有元數(shù)據(jù)
已知和未知數(shù)據(jù)源
目標(biāo)
轉(zhuǎn)換
物理與邏輯架構(gòu)流程
非標(biāo)準(zhǔn)元數(shù)據(jù)需求
技術(shù)用戶包括數(shù)據(jù)庫管理員(DBA)、元數(shù)據(jù)專家、架構(gòu)師、IT支持人員和開發(fā)人員。通常這些人員是企業(yè)信息資產(chǎn)的監(jiān)管人,他們必須完整地理解數(shù)據(jù)的技術(shù)實(shí)現(xiàn),此外他們必須對數(shù)據(jù)的業(yè)務(wù)上下文背景有足夠程度的理解,以便業(yè)務(wù)用戶所提出的需求提供必要的支持
定義元數(shù)據(jù)架構(gòu)
元數(shù)據(jù)管理方案或環(huán)境包含如下架構(gòu)層次
元數(shù)據(jù)創(chuàng)建/獲取
元數(shù)據(jù)整合
一個(gè)或多個(gè)元數(shù)據(jù)存儲庫
元數(shù)據(jù)交付
元數(shù)據(jù)應(yīng)用和元數(shù)據(jù)管理/控制
元數(shù)據(jù)管理系統(tǒng)必須具備從多種元數(shù)據(jù)來源抽取元數(shù)據(jù)的能力,所設(shè)計(jì)的元數(shù)據(jù)架構(gòu)需要能掃描各種元數(shù)據(jù)來源并定期更新元數(shù)據(jù)存儲庫,且系統(tǒng)必須支持多用戶組進(jìn)行元數(shù)據(jù)手工更新、請求、搜索和查詢
一個(gè)受控的元數(shù)據(jù)環(huán)境應(yīng)該為最終用戶屏蔽元數(shù)據(jù)的位置、類型的差異,其架構(gòu)應(yīng)該為用戶提供一個(gè)統(tǒng)一的元數(shù)據(jù)存儲庫訪問入口,該入口需要透明地向用戶提供所有相關(guān)元數(shù)據(jù)的資源
公共元數(shù)據(jù)存儲庫通常有3中技術(shù)架構(gòu)方法:集中式、分布式、和混合式
集中式:一個(gè)單獨(dú)的元數(shù)據(jù)存儲庫,保存來自各個(gè)元數(shù)據(jù)來源的最新元數(shù)據(jù)副本,如果企業(yè)高度重視元數(shù)據(jù)存儲庫的統(tǒng)一性和一致性,集中式架構(gòu)是個(gè)不錯(cuò)的選擇
分布式:元數(shù)據(jù)架構(gòu)只維護(hù)一個(gè)單一訪問點(diǎn),元數(shù)據(jù)獲取引擎響應(yīng)用戶的需求,從元數(shù)據(jù)來源系統(tǒng)實(shí)時(shí)獲取元數(shù)據(jù),而不存在永久的元數(shù)據(jù)存儲庫中
混合元數(shù)據(jù)架構(gòu)中元數(shù)據(jù)依然從元數(shù)據(jù)來源系統(tǒng)進(jìn)入存儲庫,但存儲庫的設(shè)計(jì)只考慮用戶增加的元數(shù)據(jù)、高度標(biāo)準(zhǔn)化的元數(shù)據(jù)以及手工獲取的元數(shù)據(jù)。該架構(gòu)的好處是可以實(shí)現(xiàn)準(zhǔn)時(shí)的獲取元數(shù)據(jù),以及提供更完善的元數(shù)據(jù)信息更好地滿足元數(shù)據(jù)用戶的需求;旌霞軜(gòu)減少了IT人工參與和訪問私有系統(tǒng)所需的定制化開發(fā)功能,但混合架構(gòu)不能提升系統(tǒng)的可用性;旌霞軜(gòu)適用于快速變更的元數(shù)據(jù)、需要元數(shù)據(jù)的統(tǒng)一和一致、并且元數(shù)據(jù)量和元數(shù)據(jù)來源數(shù)量都顯著增長的組織
開發(fā)和維護(hù)元數(shù)據(jù)標(biāo)準(zhǔn)
元數(shù)據(jù)標(biāo)準(zhǔn)有兩種類型:行業(yè)或共識標(biāo)準(zhǔn),以及國際標(biāo)準(zhǔn),總體而言國際標(biāo)準(zhǔn)是制定和執(zhí)行行業(yè)標(biāo)準(zhǔn)的基礎(chǔ)框架
行業(yè)元數(shù)據(jù)標(biāo)準(zhǔn)對于希望實(shí)施元數(shù)據(jù)管理、引進(jìn)和使用適用的元數(shù)據(jù)方案的企業(yè)至關(guān)重要,元數(shù)據(jù)標(biāo)準(zhǔn)與運(yùn)營交易伙伴進(jìn)行數(shù)據(jù)交換的領(lǐng)域非常關(guān)鍵,許多公司意識到了與客戶、供應(yīng)商、合作伙伴和監(jiān)管機(jī)構(gòu)進(jìn)行數(shù)據(jù)共享的價(jià)值,而信息共享需要公共元數(shù)據(jù)共享的支撐
數(shù)據(jù)整合、關(guān)系型和多維數(shù)據(jù)庫、需求管理、商務(wù)智能報(bào)表、數(shù)據(jù)建模和業(yè)務(wù)規(guī)則在內(nèi)的各種技術(shù)都提供了基于XML的元數(shù)據(jù)和數(shù)據(jù)的導(dǎo)入導(dǎo)出能力。對于XML的支持是重要的,但是由于缺少XML Schema標(biāo)準(zhǔn),所以進(jìn)行跨產(chǎn)品的元數(shù)據(jù)整合就變成了巨大的挑戰(zhàn)
值得關(guān)注的行業(yè)元數(shù)據(jù)標(biāo)準(zhǔn)包括:
OMG規(guī)范:公共倉儲元模型(CWM)、本體定義元模型(ODM)
萬維網(wǎng)協(xié)會(W3C):資源描述框架(RDF)
都柏林核心規(guī)范:都柏林核心元數(shù)據(jù)(DCMI)
非結(jié)構(gòu)化數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn):ISO5964、ISO2788、 ANSI/NISO Z39 ISO 704
空間地理標(biāo)準(zhǔn)
值得關(guān)注的國際元數(shù)據(jù)標(biāo)準(zhǔn) ISO/IEC 11179
標(biāo)準(zhǔn)化元數(shù)據(jù)的評估指標(biāo)
為控制環(huán)境中所實(shí)施的元數(shù)據(jù)的有效性,應(yīng)對量化評估用戶的理解、企業(yè)的投入以及內(nèi)容覆蓋度和質(zhì)量,評估指標(biāo)主要應(yīng)采取定量指標(biāo),包括:
元數(shù)據(jù)存儲庫的完整性
元數(shù)據(jù)文檔的質(zhì)量
主數(shù)據(jù)服務(wù)數(shù)據(jù)合規(guī)性
管理職責(zé)/范圍
元數(shù)據(jù)的使用/引用
元數(shù)據(jù)管理成熟度
元數(shù)據(jù)存儲庫可用性
實(shí)現(xiàn)受控的元數(shù)據(jù)環(huán)境
為減小風(fēng)險(xiǎn)并提高被接受的程度,一般通過分布推進(jìn)的方式實(shí)現(xiàn)一個(gè)受控的元數(shù)據(jù)環(huán)境:
實(shí)施一個(gè)試驗(yàn)項(xiàng)目來理解受管理的元數(shù)據(jù)環(huán)境并進(jìn)行概念驗(yàn)證,一個(gè)試驗(yàn)項(xiàng)目應(yīng)具有一定的復(fù)雜度,包括需求評估、戰(zhàn)略制定、技術(shù)評估選型和初始實(shí)施周期
在后續(xù)項(xiàng)目中包含路線圖規(guī)劃、人員培訓(xùn)、組織變更和一個(gè)后續(xù)發(fā)布計(jì)劃,并根據(jù)需要進(jìn)行評估和再評估工作
創(chuàng)建和維護(hù)元數(shù)據(jù)
添加元數(shù)據(jù)等操作可以由授權(quán)用戶和程序以手工方式完成,也可以通過元數(shù)據(jù)創(chuàng)建和更新工具定期掃描和更新存儲庫,最后需要采用審計(jì)流程以驗(yàn)證各項(xiàng)操作活動并報(bào)告異常
企業(yè)將元數(shù)據(jù)視為數(shù)據(jù)的索引,因此元數(shù)據(jù)的質(zhì)量至關(guān)重要,低質(zhì)量元數(shù)據(jù)會導(dǎo)致:
重復(fù)的數(shù)據(jù)字典/存儲庫/元數(shù)據(jù)存儲庫
不一致的元數(shù)據(jù)
元數(shù)據(jù)的來源和版本有沖突
對元數(shù)據(jù)系統(tǒng)可靠性的質(zhì)疑
相反高質(zhì)量的元數(shù)據(jù)會帶來:
在企業(yè)層面的信息
對于數(shù)據(jù)資源的價(jià)值的一致理解
企業(yè)范圍內(nèi)的元數(shù)據(jù)—即知識
整合元數(shù)據(jù)
元數(shù)據(jù)整合過程是在企業(yè)范圍內(nèi)采集并存儲元數(shù)據(jù)的過程,也包括企業(yè)外部數(shù)據(jù)的元數(shù)據(jù),把元數(shù)據(jù)來源庫中抽取到的元數(shù)據(jù),與相關(guān)的業(yè)務(wù)元數(shù)據(jù)和技術(shù)元數(shù)據(jù)進(jìn)行整合,最終存儲到元數(shù)據(jù)存儲庫中。元數(shù)據(jù)抽取有多種方式,包括適配程序、掃描程序、橋接程序或者直接訪問數(shù)據(jù)存儲中的元數(shù)據(jù)
元數(shù)據(jù)整合過程中可能存在一些挑戰(zhàn),也可能需要訴諸于數(shù)據(jù)治理流程進(jìn)行協(xié)調(diào)解決,如對內(nèi)部數(shù)據(jù)集、外部數(shù)據(jù)、非電子形式數(shù)據(jù)進(jìn)行整合時(shí),可能會出現(xiàn)大量的質(zhì)量和與語義方面的問題
管理元數(shù)據(jù)存儲庫
對存儲庫的控制意味著對元數(shù)據(jù)技術(shù)人員執(zhí)行的元數(shù)據(jù)遷移和存儲庫更新活動進(jìn)行控制,包括監(jiān)視、響應(yīng)報(bào)告、告警、任務(wù)日志和解決存儲庫環(huán)境中的各類問題
元數(shù)據(jù)存儲庫是指存儲元數(shù)據(jù)的物理數(shù)據(jù)庫表,通常采用開放標(biāo)準(zhǔn)的關(guān)系型數(shù)據(jù)庫平臺實(shí)現(xiàn)
存儲庫的內(nèi)容在設(shè)計(jì)上應(yīng)該是通用的,而不是僅僅反應(yīng)來源系統(tǒng)的數(shù)據(jù)庫設(shè)計(jì),并需要綜合考慮企業(yè)主題域?qū)<业囊庖,同時(shí)基于一個(gè)易于理解的元數(shù)據(jù)模型。
目錄是一類元數(shù)據(jù)存儲,它將元數(shù)據(jù)限制在特定位置或數(shù)據(jù)來源,應(yīng)在目錄中指明多個(gè)來源,元數(shù)據(jù)目錄對于開發(fā)人員、數(shù)據(jù)超級用戶和數(shù)據(jù)分析師尤為有用
術(shù)語表通常提供術(shù)語使用的索引,同義詞可以指導(dǎo)用戶完成相等、層級、關(guān)聯(lián)的關(guān)系結(jié)構(gòu)化選擇,可以為“術(shù)語表內(nèi)”和“術(shù)語表間”的兩個(gè)術(shù)語之間指定這些關(guān)系類型
分發(fā)和交付元數(shù)據(jù)
元數(shù)據(jù)交付層負(fù)責(zé)將元數(shù)據(jù)從存儲庫分發(fā)到最終用戶和其他需要使用元數(shù)據(jù)的應(yīng)用或工具,包括:
元數(shù)據(jù)內(nèi)網(wǎng)
報(bào)告、術(shù)語表、其他文檔及網(wǎng)站
數(shù)據(jù)倉庫、數(shù)據(jù)集市和商務(wù)智能工具
建模和軟件開發(fā)
消息傳輸交換
應(yīng)用程序
外部組織接口方案
查詢、報(bào)告和分析元數(shù)據(jù)
元數(shù)據(jù)指導(dǎo)我們?nèi)绾问褂脭?shù)據(jù)資產(chǎn),體現(xiàn)在商務(wù)智能(報(bào)表和分析)、商業(yè)決策(操作型、運(yùn)營型、戰(zhàn)略型)以及業(yè)務(wù)語義方面使用
元數(shù)據(jù)指導(dǎo)我們?nèi)绾喂芾頂?shù)據(jù)資產(chǎn):在數(shù)據(jù)治理流程中使用元數(shù)據(jù)進(jìn)行控制、治理;信息系統(tǒng)實(shí)現(xiàn)和傳送過程中使用元數(shù)據(jù)增加、變更、刪除和訪問數(shù)據(jù);數(shù)據(jù)整合通過數(shù)據(jù)的標(biāo)簽或元數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)整合,元數(shù)據(jù)控制并審計(jì)數(shù)據(jù)、流程和系統(tǒng)整合;一些質(zhì)量提升活動通常是從對元數(shù)據(jù)及元數(shù)據(jù)與數(shù)據(jù)關(guān)系進(jìn)行檢查開始的
元數(shù)據(jù)存儲庫應(yīng)該具有前端應(yīng)用程序,并支持查詢和獲取功能,從而滿足以上各類數(shù)據(jù)資產(chǎn)管理的需要
綜述
建立元數(shù)據(jù)管理職能的指導(dǎo)原則:
建立和保持一套元數(shù)據(jù)戰(zhàn)略和相關(guān)政策,特別是有關(guān)元數(shù)據(jù)管理和使用方面的清洗目標(biāo)和目的
需要來自于高層管理者的對企業(yè)元數(shù)據(jù)管理的持續(xù)可靠承諾、資金支持和宣傳方面的支持
從企業(yè)全局著眼規(guī)劃,確保可擴(kuò)展性;同時(shí)采取迭代和漸進(jìn)交付的實(shí)現(xiàn)方案
評估、采購和安裝元數(shù)據(jù)產(chǎn)品之前,制定元數(shù)據(jù)戰(zhàn)略
建立或采用元數(shù)據(jù)標(biāo)準(zhǔn),確保在企業(yè)范圍內(nèi)元數(shù)據(jù)的互操作性
確保對內(nèi)部和外部元數(shù)據(jù)的有效獲取
最大化的用戶訪問,因?yàn)闆]有使用或使用率較低的方案無法體現(xiàn)業(yè)務(wù)價(jià)值
理解和溝通元數(shù)據(jù)的必要性和每一類元數(shù)據(jù)的目的;傳播元數(shù)據(jù)的價(jià)值,促進(jìn)業(yè)務(wù)使用
評估元數(shù)據(jù)內(nèi)容和使用情況
采用 XML、消息和WEB服務(wù)等技術(shù)手段
建立數(shù)據(jù)監(jiān)管制度,并保持業(yè)務(wù)人員對該制度的參與,賦予元數(shù)據(jù)管理責(zé)任
定義操作程序和流程并進(jìn)行監(jiān)控,確保政策執(zhí)行的正確性
關(guān)注角色、人員、標(biāo)準(zhǔn)、操作程序、培訓(xùn)和評估指標(biāo)
為項(xiàng)目和后續(xù)管理提供專職的元數(shù)據(jù)專家
認(rèn)證元數(shù)據(jù)的質(zhì)量
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時(shí)刪除。