平特心水报图
新網絡營銷基礎與實踐

你的位置:首頁 >網絡營銷 >數據挖掘技術

數據挖掘技術

數據挖掘技術定義

      數據挖掘技術是從大量的、不完全的、有噪聲的、模糊的、隨機的、實際數據中,提取人們事先不知道的。但是又是潛在有用的信息和知識的過程。

      隨著信息技術的高速發展,人們積累的數據量急劇增長,如何從海量的數據中提取有用的知識成為當務之急。數據挖掘就是為順應這種需要應運而生發展起來的數據處理技術。其主要任務是關聯分析、分類、預測時序模式和偏差分析等。是知識發現(knowledge discovery in database)的關鍵步驟。

數據挖掘商業定義

  數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據。

  簡而言之,數據挖掘其實是一類深層次的數據分析方法。數據分析本身已經有很多年的歷史,只不過在過去數據收集和分析的目的是用于科學研究,另外,由于當時計算能力的限制,對大數據量進行分析的復雜數據分析方法受到很大限制。現在,由于各行業業務自動化的實現,商業領域產生了大量的業務數據,這些數據不再是為了分析的目的而收集的,而是由于純機會的(Opportunistic)商業運作而產生。分析這些數據也不再是單純為了研究的需要,更主要是為商業決策提供真正有價值的信息,進而獲得利潤。但所有企業面臨的一個共同問題是:企業數據量非常大,而其中真正有價值的信息卻很少,因此從大量的數據中經過深層分析,獲得有利于商業運作、提高競爭力的信息,就像從礦石中淘金一樣,數據挖掘也因此而得名。

  因此,數據挖掘可以描述為:按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,并進一步將其模型化的先進有效的方法。

數據挖掘技術在電子商務中應用

(1)發現潛在客戶。在對客戶訪問的信息的挖掘中,利用分類技術可以在網絡上找到未來的潛在客戶。

(2)提供優質個性化服務。通過對客戶訪問信息的挖掘。就能知道客戶的瀏覽行為,從而了解客戶的興趣和要求。

(3)改進網站設計。

(4)聚類客戶。通過具有相似瀏覽行為的客戶分為一組,并分析組中客戶的共同點,可以幫助電子商務客戶更好的了解自己的客戶向客戶提供更好適合、更面向客戶的服務。

(5)搜索引擎的應用.

(6) 網絡安全。通過分析的服務器上留下網上銀行。網上商店交易日記。可以防范黑客攻擊。惡意詐騙。

數據挖掘與傳統分析方法的區別

  數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識.數據挖掘所得到的信息應具有先前未知,有效和可實用三個特征.

  先前未知的信息是指該信息是預先未曾預料到的,即數據挖掘是要發現那些不能靠直覺發現的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值.在商業應用中最典型的例子就是一家連鎖店通過數據挖掘發現了小孩尿布和啤酒之間有著驚人的聯系.

數據挖掘的任務

  數據挖掘的任務主要是關聯分析、聚類分析、分類、預測、時序模式和偏差分析等。關聯分析(association analysis)

  關聯規則挖掘是由rakesh apwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規律性,就稱為關聯。數據關聯是數據庫中存在的一類重要的、可被發現的知識。關聯分為簡單關聯、時序關聯和因果關聯。關聯分析的目的是找出數據庫中隱藏的關聯網。一般用支持度和可信度兩個閥值來度量關聯規則的相關性,還不斷引入興趣度、相關性等參數,使得所挖掘的規則更符合需求。聚類分析(clustering)

  聚類是把數據按照相似性歸納成若干類別,同一類中的數據彼此相似,不同類中的數據相異。聚類分析可以建立宏觀的概念,發現數據的分布模式,以及可能的數據屬性之間的相互關系。分類(classification)

  分類就是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,并用這種描述來構造模型,一般用規則或決策樹模式表示。分類是利用訓練數據集通過一定的算法而求得分類規則。分類可被用于規則描述和預測。預測(predication)

  預測是利用歷史數據找出變化規律,建立模型,并由此模型對未來數據的種類及特征進行預測。預測關心的是精度和不確定性,通常用預測方差來度量。時序模式(time-series pattern)

  時序模式是指通過時間序列搜索出的重復發生概率較高的模式。與回歸一樣,它也是用己知的數據預測未來的值,但這些數據的區別是變量所處時間的不同。偏差分析(deviation)

  在偏差中包括很多有用的知識,數據庫中的數據存在很多異常情況,發現數據庫中數據存在的異常情況是非常重要的。偏差檢驗的基本方法就是尋找觀察結果與參照之間的差別。

網絡營銷詞典內容均由網友提供,僅供參考。

平特心水报图 双色球最经典规律 我要机选投注双色球号码 福利彩票几点结束投注 有实体店如何开网店 后一大小单双稳赚翻倍技巧 江苏快三玩法技巧规律 福建时时6选3 七乐彩开奖号码查询 怎么买时时彩能稳赚 有什么好的计划软件吗