資料探勘具體要做什麼,資料探勘是做什麼的

2021-03-21 23:19:53 字數 5266 閱讀 3509

1樓:cda資料分析師

資料探勘的用處有很多,在這裡我只想從技術和應用兩個層面來簡單談談。

1、從技術層面來說,按照資料探勘產出的知識可以粗分為兩大類:描述型挖掘和**型挖掘。

描述型挖掘是對現有資料的進一步精煉和歸納,從中抽取中更巨集觀的反映數 據特徵的概念描述。舉個例子來說,某家銀行有幾百萬客戶,資料倉儲中儲存了每個客戶的人口統計資訊、賬戶資訊、交易資訊、客服聯絡資訊等詳細資料。但是銀 行不可能清楚地了解每位客戶是什麼樣的客戶,客戶的消費模式到底是怎樣的?

這時一般需要把全體客戶進行細分,劃分為幾個客戶群,而且這種劃分可以保證具有 相似行為、相似價值的客戶會被放入同乙個群組中。有了這些客戶群,銀行就能更容易地發現營銷機會並制定營銷戰略。這個例子中所用的挖掘技術是聚類模型,它 就是一種典型的描述型挖掘。

**型挖掘,顧名思義,就是建立的挖掘模型具備**能力。這種**能力可能包括**哪些客戶下個月會流失,哪些客戶對**活動會積極響應,哪些客戶的未來價值會成長以及成長多少等等。**型挖掘常常對企業運營具有更強的指導作用,從而更快地見效。

2、從應用層面來說,資料探勘可以應用到很多行業中,包括電信、銀行、**、保險、製造、網際網路等等。

拋開具體行業的特定應用不談,在各個行業中一般都會把資料探勘應用在客戶關係管理(crm)之中。在crm中的資料探勘應用,包括客戶細分、客戶價值分析、客戶獲取、客戶保持、交叉銷售和提公升銷售等等。此外,信用評分、欺詐偵測和文字挖掘等也是常見的應用。

2樓:網際網路軒軒

對使用者的年齡和消費水平進行收集

對使用者的行為特性進行了解

對使用者搜尋行為習慣進行觀察

對使用者資訊反饋進行整理

對使用者需求和自身優勢進行相結合

3樓:匿名使用者

就是將資料經過抽取、轉換、載入到資料倉儲 然後根據一定的指標分析、挖掘出可用的、有價值東西;

資料探勘是做什麼的

4樓:匿名使用者

說的最直白的就是從一堆資料中找出有價值的東西,以便用來賺更多的錢。。。

5樓:前景一片光明

主要就是為了完成資料分析的。

6樓:cda資料分析師

資料探勘的用處有很多,在這裡我只想從技術和應用兩個層面來簡單談談。

1、從技術層面來說,按照資料探勘產出的知識可以粗分為兩大類:描述型挖掘和**型挖掘。

描述型挖掘是對現有資料的進一步精煉和歸納,從中抽取中更巨集觀的反映數 據特徵的概念描述。舉個例子來說,某家銀行有幾百萬客戶,資料倉儲中儲存了每個客戶的人口統計資訊、賬戶資訊、交易資訊、客服聯絡資訊等詳細資料。但是銀 行不可能清楚地了解每位客戶是什麼樣的客戶,客戶的消費模式到底是怎樣的?

這時一般需要把全體客戶進行細分,劃分為幾個客戶群,而且這種劃分可以保證具有 相似行為、相似價值的客戶會被放入同乙個群組中。有了這些客戶群,銀行就能更容易地發現營銷機會並制定營銷戰略。這個例子中所用的挖掘技術是聚類模型,它 就是一種典型的描述型挖掘。

**型挖掘,顧名思義,就是建立的挖掘模型具備**能力。這種**能力可能包括**哪些客戶下個月會流失,哪些客戶對**活動會積極響應,哪些客戶的未來價值會成長以及成長多少等等。**型挖掘常常對企業運營具有更強的指導作用,從而更快地見效。

2、從應用層面來說,資料探勘可以應用到很多行業中,包括電信、銀行、**、保險、製造、網際網路等等。

拋開具體行業的特定應用不談,在各個行業中一般都會把資料探勘應用在客戶關係管理(crm)之中。在crm中的資料探勘應用,包括客戶細分、客戶價值分析、客戶獲取、客戶保持、交叉銷售和提公升銷售等等。此外,信用評分、欺詐偵測和文字挖掘等也是常見的應用。

資料探勘工程師一般都做什麼?

7樓:匿名使用者

資料探勘指的是在bai長期積累的du資料中分析和挖zhi掘有價值的資訊dao以供決策。

這個概念主回要還是因為erp(企業資源計畫)答和oa(辦公自動化)軟體系統的廣泛使用和發展的基礎上出現的乙個概念。因為企業在使用這些軟體系統的過程中,雖然運營的狀態和管理以及成本有很大的節約,大大提高了企業的運營效率,可是這些系統卻只能對企業的狀態和管理進行乙個狀態性的記錄,對長期記錄下來的這些資料的分析和在挖掘能力是非常有限的,雖然眾多軟體**商想出各種辦法來利用其這些資料,比如出各種報表甚至自定義的報表,可是仍然受制於erp和oa本身設計的缺陷,因為它們原本就不是設計來做資料分析的。

8樓:尊威天下網路

資料探勘工程師抄是做什麼的?數襲據挖掘,

bai從字面上理解,就是在

du資料中找到zhi

有用的dao東西,哪些東西有用就要看具體的業務目標了。最簡單的就是統計應用了,比如電商資料,如**統計過哪個省購買泳衣最多、哪個省的女生**最大等,進一步

9樓:加公尺谷大資料科技

1、運用資料

挖掘、統計學習的理論和方法,深入挖掘和分析資料,並設計實現相應的版演算法;

2、大規模資料的分類權、聚類、關聯等演算法的比較研究;

3、對使用者與客戶的行為進行分析,負責使用者與客戶行為分析的目標確定、資料採集、分析模型設計;

4、指導開發人員完成演算法實現。

10樓:匿名使用者

1、 資料預處理

通常的數

據挖掘需要涉及相對較大的資料量,這些資料可能**專不一導屬致格式不同,也許有的資料還存在一些缺失值或者無效值,如果不經處理直接將這些『髒』資料放到我們的模型中去跑,非常容易導致模型計算的失敗或者可用性很差,所以資料預處理是我們所有資料探勘過程中都不可或缺的一步。通常佔用了我們資料探勘過程中的很大部分時間。

2、 資料探勘

通過進行的特徵的構造然後放到特定的模型中去計算,利用某種標準去評判不同模型或組合模型的表現,最後確定乙個最合適的模型用於我們的後處理。

3、 後處理

應用或者用合適的方式將其特徵表示出來。

資料探勘主要涉及到哪些方面的知識?

11樓:超超呢

資料庫,統計學,office常用辦公軟體,常用演算法,邏輯思維能力,業務知識

什麼是資料探勘?

12樓:cda資料分析師

簡單地說,資料探勘是從大量資料中提取或『挖掘』知識。該術語實際上有點用詞不當。資料探勘應當更正確地命名為『從資料中挖掘知識』,不幸的是它有點長。

許多人把資料探勘視為另乙個常用的術語『資料庫中知識發現』或kdd的同義詞。而另一些人只是把資料探勘視為資料庫中知識發現過程的乙個基本步驟。

資料探勘是乙個用資料發現問題、解決問題的學科。

通常通過對資料的探索、處理、分析或建模實現。

我們可以看到資料探勘具有以下幾個特點:

基於大量資料:並非說小資料量上就不可以進行挖掘,實際上大多數資料探勘的演算法都可以在小資料量上執行並得到結果。但是,一方面過小的資料量完全可以通過人工分析來總結規律,另一方面來說,小資料量常常無法反映出真實世界中的普遍特性。

隱含性:資料探勘是要發現深藏在資料內部的知識,而不是那些直接浮現在資料表面的資訊。常用的bi工具,例如報表和olap,完全可以讓使用者找出這些資訊。

新奇性:挖掘出來的知識應該是以前未知的,否則只不過是驗證了業務專家的經驗而已。只有全新的知識,才可以幫助企業獲得進一步的洞察力。

價值性:挖掘的結果必須能給企業帶來直接的或間接的效益。有人說資料探勘只是「屠龍之技」,看起來神乎其神,卻什麼用處也沒有。

這只是一種誤解,不可否認的 是在一些資料探勘專案中,或者因為缺乏明確的業務目標,或者因為資料質量的不足,或者因為人們對改變業務流程的抵制,或者因為挖掘人員的經驗不足,都會導 致效果不佳甚至完全沒有效果。但大量的成功案例也在證明,資料探勘的確可以變成提公升效益的利器。

13樓:知於大資料

由於資料科學剛剛興起,資料科學家作為一種新生職業被提出,資料研究高階科學家rachel schutt將其定義為「計算機科學家、軟體工程師和統計學家的混合體「。資料探勘作為乙個學術領域,橫跨多個學科,涵蓋了統計學、數學、機器學習和資料庫等,此外還包括各類專業方向比如從油田電力、海洋生物、歷史文字、電子通訊、法律稅務等的各個專業領域。注意每一分類都需要相當的行業經驗。

而要明白某一事物的本質,就需要通過另一些近似的事物特性對比來說明。就好像你單獨提問什麼是男人?很難解釋對不對。

所以咱們來舉個栗子簡單看看:

一、分析報告

在《大鬧天宮》裡孫悟空跟二郎神在花果山下大戰三百回合,咱來寫一篇文章分析。

孫悟空有金剛不壞火眼金睛筋斗雲七十二般變化加上定海神針身法靈活。

二郎神楊戩有三隻眼縛妖索哮天犬銀袍金甲加上三尖兩刃四竅八環刀力量無窮。

所以在大戰開始三百回合時候不相上下,結果後來二郎神派出天兵天將放火燒花果山讓大聖慌了心神被偷襲得手。

最後二郎神贏了。

分析報告完成。

二、統計分析

大聖二戰楊戩。這次在二位大戰之前做個數理統計來**結果。

首先根據歷史樣本史書記載發現兩人在之前的五百年裡打過100次,其中孫悟空贏60次。

然後有記錄顯示,之前孫悟空和牛魔王戰鬥的勝率是80%,而楊戩鬥牛魔王勝率是70%。

所以可以得出綜合**總體勝率是孫悟空贏面大。

結論依靠歷史記錄,使用樣本**總體,根據經驗做出假設。

統計分析完成。

三、資料探勘

孫悟空和楊戩終極決戰。這次咱們根據兩位的詳細資料(如家庭出身、教育背景、工作經驗、婚育情況等)讓計算機做協同過濾關聯分析。計算機通過資料清洗建模後發現:

貧苦出身的孩子一般比皇親國戚更能吃苦所以功夫底子更好平時訓練更加紮實。

戰鬥經驗豐富的鬥戰勝佛因為平時經常打架擅長利用天時地利環境因素而勝算更大。

在都得到大師指點的情況下,貧苦出身的孩子可以利用後天的努力來彌補先天悟性的欠缺。

樣貌奇特注定孤獨終老的神仙總是會比同等條件下美若天仙喜歡拈花惹草處處留情的神仙功夫好。

綜上所述,我們可知道:

論出身兩位大神不分伯仲。乙個從石頭出來,乙個是凡人與神仙結合所生。

悟空的**菩提老祖(準提道人)和二郎神的**玉鼎真人的**元始天尊同為鴻鈞老祖的高足所以前者更勝一籌。

鬥戰勝佛戰鬥經驗相對整日快活逍遙無憂無慮的二郎神來說更加豐富。

另孫行者由於樣貌原因始終單身(好傷感)。

所以可以得出結論,這次大戰孫悟空贏面大。

資料探勘完成。

四、最後總結:

分析報告一般是整個事件發生結束以後的總結(描述性)。

統計分析能利用大量的歷史樣本來**整個事件總體未來的走向(**性概率)。

資料探勘則透過事件的表象發現隱藏在背後的蛛絲馬跡,從而找到潛伏的規律以及看似無關事物之間背後的聯絡,用此來洞察未來(規範性)。

什麼是資料探勘什麼是資料探勘,簡述其作用和應用。

簡單地說,資料探勘是從大量資料中提取或 挖掘 知識。該術語實際上有點用詞不當。資料探勘應當更正確地命名為 從資料中挖掘知識 不幸的是它有點長。許多人把資料探勘視為另乙個常用的術語 資料庫中知識發現 或kdd的同義詞。而另一些人只是把資料探勘視為資料庫中知識發現過程的乙個基本步驟。資料探勘是乙個用資料...

資料探勘,情感分析,深度學習具體步驟是

有兩大類,一類是主觀性 主觀 客觀 中性 一類是情感傾向 褒義 貶義 中性。文字分析的話,主要是對詞 句子中觀點的挖掘。你所說的機器學習法,現在基本用於對電影觀點的打分系統吧。基本上就是利用分類計數,對文件中存在的情感進行分類的。就我個人理解而言,我認為機器學習法只是情感文字分析的方 之一,至於資料...

資料探勘中分類和聚類有什麼區別,資料探勘中分類和聚類的區別

分類是資料探勘中的一項非常重要的任務,利用分類技術可以從資料集中提取描述資料類的乙個函式或模型 也常稱為分類器 並把資料集中的每個物件歸結到某個已知的物件類中。從機器學習的觀點,分類技術是一種有指導的學習,即每個訓練樣本的資料物件已經有類標識,通過學習可以形成表達資料物件與類標識間對應的知識。從這個...