1、數(shù)據(jù)挖掘技術的應用及特點
數(shù)據(jù)挖掘技術是一種新型的技術,在現(xiàn)代數(shù)據(jù)存儲以及測量技術的迅猛發(fā)展過程中,人們可以進行信息的大量測量并進行存儲。但是,在大量的信息背后卻沒有一種有效的手段和技術進行直觀的表達和分析。而數(shù)據(jù)挖掘技術的出現(xiàn),是對目前大數(shù)據(jù)時代的一種應急手段,使得有關計算機數(shù)據(jù)處理技術得到加快發(fā)展。數(shù)據(jù)挖掘技術最早是從機器學習的概念中而產生的,在對機器的學習過程中,一般不采用歸納或者較少使用這種方法,這是一種非常機械的操作辦法。而沒有指導性學習的辦法一般不從這些環(huán)境得出反饋,而是通過沒有干預的情況下進行歸納和學習,并建立一種理論模型。數(shù)據(jù)挖掘技術是屬于例子歸納學習的一種方式,這種從例子中進行歸納學習的方式是介于上述無指導性學習以及較少使用歸納學習這兩種方式之間的一種方式。因此,可以說,數(shù)據(jù)挖掘技術的特征在出自于機器學習的背景下,與其相比機器主要關心的是如何才能有效提高機器的學習能力,但數(shù)據(jù)挖掘技術主要關心如何才能找到有用、有價值的信息。其第二個特征是,與機器學習特點相比較而言,機器關心的是小數(shù)據(jù),而數(shù)據(jù)挖掘技術所面臨的對象則是現(xiàn)實中海量規(guī)模的數(shù)據(jù)庫,其作用主要是用來處理一些異,F(xiàn)象,特別是處理殘缺的、有噪音以及維數(shù)很高的數(shù)據(jù)項,甚至是一些不同類型數(shù)據(jù)。以往的數(shù)據(jù)處理方法和現(xiàn)代的數(shù)據(jù)挖掘技術相比較而言,其不同點是以往的傳統(tǒng)數(shù)據(jù)處理方法前提是把理論作為一種指導數(shù)據(jù)來進行處理,在現(xiàn)代數(shù)據(jù)挖掘技術的出發(fā)角度不同,主要運用啟發(fā)式的歸納學習進行理論以及假設來處理的。
2、數(shù)據(jù)挖掘技術主要步驟
數(shù)據(jù)挖掘技術首先要建立數(shù)據(jù)倉庫,要根據(jù)實際情況而定,在易出現(xiàn)問題的有關領域建立有效的數(shù)據(jù)庫。主要是用來把數(shù)據(jù)庫中的所有的存儲數(shù)據(jù)進行分析,而目前的一些數(shù)據(jù)庫雖然可以進行大量的存儲數(shù)據(jù),同時也進行了一系列的技術發(fā)展。比如,系統(tǒng)中的在線分析處理,主要是為用戶查詢,但是卻沒有查詢結果的分析能力,而查詢的結果仍舊由人工進行操作,依賴于對手工方式進行數(shù)據(jù)測試并建模。其次,在數(shù)據(jù)庫中存儲的數(shù)據(jù)選一數(shù)據(jù)集,作為對數(shù)據(jù)挖掘算法原始輸入。此數(shù)據(jù)集所涉及到數(shù)據(jù)的時變性以及統(tǒng)一性等情況。然后,再進行數(shù)據(jù)的預處理,在處理中主要對一些缺損數(shù)據(jù)進行補齊,并消除噪聲,此外還應對數(shù)據(jù)進行標準化的處理。隨后,再對數(shù)據(jù)進行降維和變換。如果數(shù)據(jù)的維數(shù)比較高,還應找出維分量高的數(shù)據(jù),對高維數(shù)數(shù)據(jù)空間能夠容易轉化為檢點的低維數(shù)數(shù)據(jù)空間進行處理。下一步驟就是確定任務,要根據(jù)現(xiàn)實的需要,對數(shù)據(jù)挖掘目標進行確定,并建立預測性的模型、數(shù)據(jù)的摘要等。隨后再決定數(shù)據(jù)挖掘的算法,這一步驟中,主要是對當前的數(shù)據(jù)類型選擇有效的處理方法,此過程非常重要,在所有數(shù)據(jù)挖掘技術中起到較大作用。隨后再對數(shù)據(jù)挖掘進行具體的處理和結果檢驗,在處理過程中,要按照不同的目的,選擇不同的算法,是運用決策樹還是分類等的算法,是運用聚類算法還是使用回歸算法,都要認真處理,得出科學的結論。在數(shù)據(jù)挖掘結果檢驗時,要注意幾個問題,要充分利用結論對照其他的信息進行校核,可對圖表等一些直觀的信息和手段進行輔助分析,使結論能夠更加科學合理。需要注意的是要根據(jù)用戶來決定結論有用的程度。最后一項步驟是把所得出的結論進行應用到實際,要對數(shù)據(jù)挖掘的結果進行仔細的校驗,重點是解決好以前的觀點和看法有無差錯,使目前的結論和原先看法的矛盾有效解除。
3、數(shù)據(jù)挖掘技術的方法以及在電力營銷系統(tǒng)中的應用和發(fā)展
數(shù)控挖掘技術得到了非常廣泛的應用,按照技術本身的發(fā)展出現(xiàn)了較多方法。例如,建立預測性建模方法,也就是對歷史數(shù)據(jù)進行分析并歸納總結,從而建立成預測性模型。根據(jù)此模型以及當前的其他數(shù)據(jù)進行推斷相關聯(lián)的數(shù)據(jù)。如果推斷的對象屬于連續(xù)型的變量,那么此類的推斷問題可屬回歸問題。根據(jù)歷史數(shù)據(jù)來進行分析和檢測,再做出科學的架設和推定。在常用的回歸算法以及非線性變換進行有效的結合,能夠使許多問題得到解決。電力營銷系統(tǒng)中的數(shù)據(jù)挖掘技術應用中關聯(lián)規(guī)則是最為關鍵的技術應用之一。這種應用可以有效地幫助決策人員進行當前有關數(shù)據(jù)以及歷史數(shù)據(jù)的規(guī)律分析,最后預測出未來情況。把關聯(lián)規(guī)則成功引入電力營銷分析,通過FP-Growth算法對電力營銷的有關數(shù)據(jù)進行關聯(lián)規(guī)則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關聯(lián)信息,以便更好地為電力的市場營銷策略提供參謀和決策。對電力營銷系統(tǒng)的應用中,時間序列挖掘以及序列挖掘非常經典、系統(tǒng),是應用最為廣泛的一種預測方法。這種方法的應用中,對神經網(wǎng)絡的研究非常之多。因此,在現(xiàn)實中應用主要把時間序列挖掘以及神經網(wǎng)絡兩者進行有效地結合,然后再分析有關電力營銷數(shù)據(jù)。此外,有關專家還提出應用一種時間窗的序列挖掘算法,這種方式可以進行有效地報警處理,使電力系統(tǒng)中的故障能夠準確的定位并診斷事故。此算法對電力系統(tǒng)的分析和挖掘能力的提高非常有效,還可判定電力系統(tǒng)的運行是否穩(wěn)定,對錯誤模型的分析精度達到一定的精確度。
4、結語
目前,對數(shù)據(jù)挖掘技術在整個電力營銷系統(tǒng)中的應用還處于較低水平上,其挖掘算法的單一并不能有效地滿足實際決策需要。但是,由于數(shù)據(jù)挖掘技術對一些潛在的問題預測能力較強,特別是對電力營銷系統(tǒng)中較大規(guī)模的非線性問題,具有較強的處理能力,在未來的發(fā)展中會成為營銷領域中重要的應用工具。
來源:網(wǎng)絡整理 免責聲明:本文僅限學習分享,如產生版權問題,請聯(lián)系我們及時刪除。