21世紀(jì)是以網(wǎng)絡(luò)為代表的信息技術(shù)突飛猛進(jìn)的時(shí)代,隨著網(wǎng)絡(luò)的飛速發(fā)展和經(jīng)濟(jì)全球化所帶來(lái)的激烈挑戰(zhàn),信息技術(shù)已經(jīng)成為現(xiàn)代企業(yè)進(jìn)行經(jīng)營(yíng)管理不可或缺的支撐。企業(yè)可獲得的數(shù)據(jù)在急劇增長(zhǎng),對(duì)客戶(hù)數(shù)據(jù)進(jìn)行全面收集、集成、分析與利用是知客CRM實(shí)施的基礎(chǔ)。如何管理和分析海量的客戶(hù)信息,并從中找出對(duì)CRM決策有價(jià)值的知識(shí)?這需要更先進(jìn)的技術(shù)和工具的支持,即數(shù)據(jù)挖掘技術(shù)。
一、統(tǒng)計(jì)學(xué)與數(shù)據(jù)挖掘的關(guān)系
數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)都試圖從數(shù)據(jù)中發(fā)現(xiàn)某種結(jié)構(gòu),從而得到有價(jià)值的信息,所以從數(shù)據(jù)挖掘誕生時(shí)起,就與統(tǒng)計(jì)學(xué)有了不可分割的聯(lián)系。統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)和人工智能共同構(gòu)成數(shù)據(jù)挖掘技術(shù)的三大支柱。統(tǒng)計(jì)學(xué)是搜集、展示、分析以及解釋數(shù)據(jù)的科學(xué),統(tǒng)計(jì)學(xué)并不是方法的羅列,而是處理數(shù)據(jù)的科學(xué)。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含的、事先不為人們所知的、潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘大部分核心功能的實(shí)現(xiàn)都以計(jì)量和統(tǒng)計(jì)分析方法作為支撐。數(shù)據(jù)挖掘本身是多學(xué)科交叉科學(xué),應(yīng)用了統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、數(shù)據(jù)倉(cāng)庫(kù)、神經(jīng)網(wǎng)絡(luò)等多種技術(shù)。
二、統(tǒng)計(jì)數(shù)據(jù)挖掘技術(shù)在知客CRM中的應(yīng)用
要使數(shù)據(jù)挖掘在商業(yè)活動(dòng)中起作用,就要把它與基本的商業(yè)過(guò)程關(guān)聯(lián)起來(lái)。數(shù)據(jù)挖掘是企業(yè)同客戶(hù)打交道的諸多步驟中的第一個(gè)。它要發(fā)現(xiàn)的是商業(yè)活動(dòng)中各個(gè)因素與客戶(hù)行為之間的不直觀(guān)的關(guān)系。統(tǒng)計(jì)數(shù)據(jù)挖掘技術(shù)對(duì)于新客戶(hù)開(kāi)發(fā)、交叉銷(xiāo)售及預(yù)測(cè)、顧客維系、顧客細(xì)分、關(guān)系贏利性識(shí)別等知客CRM功能都能提供良好的技術(shù)支撐。
(一)應(yīng)用流程
1.顧客獲取。對(duì)大多數(shù)企業(yè)而言,發(fā)展新客戶(hù)、擴(kuò)大客戶(hù)基礎(chǔ)的確是企業(yè)成長(zhǎng)的一種主要方式。通過(guò)數(shù)據(jù)挖掘?qū)崿F(xiàn)顧客獲取就是利用客戶(hù)檔案找出客戶(hù)的一些共同特征,通過(guò)聚類(lèi)分析對(duì)客戶(hù)分群,再通過(guò)模式分析預(yù)測(cè)潛在客戶(hù)。通過(guò)預(yù)測(cè)潛在客戶(hù)對(duì)開(kāi)發(fā)活動(dòng)的反映,從中識(shí)別出反映積極的客戶(hù),幫助市場(chǎng)人員對(duì)潛在客戶(hù)進(jìn)行篩選,然后有針對(duì)性的進(jìn)行營(yíng)銷(xiāo)活動(dòng)。
2.客戶(hù)細(xì)分?蛻(hù)細(xì)分是根據(jù)企業(yè)需求,將客戶(hù)劃分為多個(gè)小的同質(zhì)群體的過(guò)程。同屬一個(gè)群體的客戶(hù)往往有相似的需求,這樣,營(yíng)銷(xiāo)人員就容易對(duì)其進(jìn)行營(yíng)銷(xiāo)組合,有針對(duì)性的實(shí)施營(yíng)銷(xiāo)策略?蛻(hù)細(xì)分中比較典型的數(shù)據(jù)挖掘技術(shù)是決策樹(shù)和聚類(lèi)分析方法。
3.交叉銷(xiāo)售及預(yù)測(cè),F(xiàn)代企業(yè)和客戶(hù)之間的關(guān)系是經(jīng)常變動(dòng)的,交叉銷(xiāo)售是使這種關(guān)系趨于穩(wěn)定的一種手段。利用市場(chǎng)購(gòu)物藍(lán)圖分析挖掘客戶(hù)對(duì)產(chǎn)品的消費(fèi)模式,找出客戶(hù)最容易一起購(gòu)買(mǎi)哪些產(chǎn)品,從而有效的決定產(chǎn)品組合、產(chǎn)品擺放等。利用序慣分析預(yù)測(cè)客戶(hù)在買(mǎi)了某一樣產(chǎn)品之后,多久就會(huì)買(mǎi)另一樣產(chǎn)品。這樣做的結(jié)果是:企業(yè)獲得了更高的商業(yè)利潤(rùn),客戶(hù)得到了所需要的產(chǎn)品和服務(wù),從而使雙方達(dá)到雙贏的狀態(tài)。
4.顧客維系。隨著獲取新客戶(hù)的成本不斷提高,對(duì)企業(yè)而言,維系老客戶(hù),保持原有客戶(hù)的價(jià)值就顯得越發(fā)重要。在客戶(hù)保持中,通常涉及三個(gè)數(shù)據(jù)挖掘模型,首先建立模型用來(lái)預(yù)測(cè)和識(shí)別潛在流失者,然后挖掘和識(shí)別潛在流失者中的黃金客戶(hù)。最后對(duì)黃金客戶(hù)中的潛在流失者進(jìn)行分析挖掘,識(shí)別其行為模式,從而實(shí)行有針對(duì)性的營(yíng)銷(xiāo)策略以保持這些客戶(hù)。
5.客戶(hù)贏利性識(shí)別。對(duì)企業(yè)來(lái)說(shuō),客戶(hù)的數(shù)量并非越多越好,而是能夠給企業(yè)帶來(lái)贏利的客戶(hù)越多越好,因?yàn)椴煌蛻?hù)的贏利能力對(duì)企業(yè)的貢獻(xiàn)率是不同的。企業(yè)通過(guò)設(shè)置計(jì)算贏利能力的參數(shù),利用數(shù)據(jù)挖掘?qū)蛻?hù)信息、客戶(hù)歷史交易記錄和售后服務(wù)等信息進(jìn)行分析,對(duì)客戶(hù)進(jìn)行分類(lèi),預(yù)測(cè)其未來(lái)的購(gòu)買(mǎi)模式和購(gòu)買(mǎi)行為。這樣就可以在市場(chǎng)營(yíng)銷(xiāo)的過(guò)程中對(duì)有價(jià)值或潛在的客戶(hù)投入更多精力和財(cái)力,向他們提供及時(shí)的個(gè)性化服務(wù),既可以留住這些客戶(hù),又可以有針對(duì)性地開(kāi)展交叉銷(xiāo)售,提高其對(duì)企業(yè)的贏利能力。
(二)主要統(tǒng)計(jì)方法
1.運(yùn)用描述性統(tǒng)計(jì)分析方法對(duì)數(shù)據(jù)進(jìn)行初步分析。描述性分析是對(duì)初步整理后的數(shù)據(jù)資料進(jìn)行分析,并用統(tǒng)計(jì)量描述這些資料的一種方法。它主要包括了相對(duì)指標(biāo)分析、圖表法、集中趨勢(shì)和離散趨勢(shì)分析、相關(guān)分析等。
相對(duì)指標(biāo)是運(yùn)用對(duì)比的方法,反映某些相父事物之間數(shù)量聯(lián)系程度的綜合指標(biāo)。利用相對(duì)指標(biāo)可以表明現(xiàn)象的相對(duì)水平、普遍程度及比例關(guān)系,可以使某些不能直接對(duì)比的總量找到對(duì)比的基礎(chǔ),可以比較事物的發(fā)展程度、內(nèi)部結(jié)構(gòu)及比例,可以使不能用總量指標(biāo)直接對(duì)比的非同類(lèi)現(xiàn)象之間進(jìn)行比較。
圖表法屬于描述統(tǒng)計(jì)學(xué),它就是以圖形或表格的形式來(lái)表示總體變量值的分布狀況,它的表達(dá)形式比較簡(jiǎn)明、直觀(guān)。統(tǒng)計(jì)表格根據(jù)它的內(nèi)容可以分為頻次表、百分比表、累計(jì)表。常用的頻次表包括直方圖、折線(xiàn)圖和曲線(xiàn)圖。由于計(jì)算機(jī)的運(yùn)用,制作圖表都看可以通過(guò)軟件來(lái)實(shí)現(xiàn),例如Excel,SPSS等軟件。
統(tǒng)計(jì)圖是以圖形表示變量的分布情況,與統(tǒng)計(jì)表相比,雖然不如它精確,但卻更直觀(guān)、生動(dòng)、醒目。常用的統(tǒng)計(jì)表有餅圖、條形圖、直方圖和折線(xiàn)圖。
2.進(jìn)行復(fù)雜數(shù)據(jù)挖掘前的統(tǒng)計(jì)降維方法一因子分析方法。由于數(shù)據(jù)的結(jié)構(gòu)有時(shí)候會(huì)非常復(fù)雜,不便于直接用來(lái)做數(shù)據(jù)挖掘。這時(shí)候需要對(duì)復(fù)雜數(shù)據(jù)進(jìn)行統(tǒng)汁降維分析,從二簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)。因子分析是一類(lèi)降維的相關(guān)分析技術(shù),用來(lái)考察一組變量之間的協(xié)方差或者相關(guān)系數(shù)結(jié)構(gòu),并用以解釋這些變量與因子之間的關(guān)聯(lián)。目前的因子分析包括探索性因子分析與驗(yàn)證性因子分析。探索性因子分析是往事先不知道影響因素的基礎(chǔ)上,完全依據(jù)資料數(shù)據(jù),利用統(tǒng)計(jì)軟件,根據(jù)一定的原則進(jìn)行因子分析,最后得到因子的過(guò)程。而確定性因子分析是充分利用先驗(yàn)信息,在已知因子的情況下檢驗(yàn)所搜集的數(shù)據(jù)資料是否按照事先預(yù)定的結(jié)構(gòu)方式產(chǎn)生作用。本文所討論的是探索性因子分析,通過(guò)對(duì)數(shù)據(jù)資料的因子分析實(shí)現(xiàn)降維,從而為進(jìn)一步的數(shù)據(jù)挖掘做準(zhǔn)備。
(三)需要注意的問(wèn)題
1.對(duì)數(shù)據(jù)的要求。由于大多運(yùn)營(yíng)商現(xiàn)有的面向事物的數(shù)據(jù)在質(zhì)量、完整性和一致性方面存在很多問(wèn)題,因此在利用這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘之前,必須先對(duì)其進(jìn)行抽取、凈化和處理。
2.對(duì)人員素質(zhì)的要求。統(tǒng)計(jì)數(shù)據(jù)挖掘分析系統(tǒng)必須與實(shí)際緊密相聯(lián),在數(shù)據(jù)挖掘的多個(gè)環(huán)節(jié)中,都要求使用和分析人員不光具備數(shù)據(jù)挖掘的相關(guān)知識(shí),還必須有對(duì)企業(yè)經(jīng)營(yíng)管理流程和行業(yè)背景的深刻理解。
3.統(tǒng)計(jì)數(shù)據(jù)挖掘存在較長(zhǎng)的應(yīng)用周期,數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識(shí)和規(guī)則必須讓決策者理解并采納,才能將知識(shí)轉(zhuǎn)化為生產(chǎn)力,并通過(guò)實(shí)踐不斷檢驗(yàn)和完善數(shù)據(jù)挖掘所產(chǎn)生的模型和規(guī)則,以使模型更具實(shí)用價(jià)值。