數(shù)據(jù)挖掘預(yù)測(cè)企業(yè)老客戶流失探討論文
時(shí)間:2022-04-07 09:14:00
導(dǎo)語(yǔ):數(shù)據(jù)挖掘預(yù)測(cè)企業(yè)老客戶流失探討論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
編者按:本文從前言、客戶流失簡(jiǎn)介、數(shù)據(jù)挖掘產(chǎn)生的背景及主要分析方法、結(jié)束語(yǔ)四個(gè)方面進(jìn)行主要論述。其中,包括:如何保持老客戶,控制高價(jià)值客戶的流失必將成為企業(yè)提高競(jìng)爭(zhēng)力,在激烈競(jìng)爭(zhēng)中致勝的關(guān)鍵;客戶流失是指客戶停止使用原有的產(chǎn)品或服務(wù),或轉(zhuǎn)而使用競(jìng)爭(zhēng)對(duì)手的產(chǎn)品或服務(wù);研究哪些客戶即將流失,實(shí)質(zhì)上是一個(gè)分類問(wèn)題,即將現(xiàn)有客戶分為流失和不流失兩類;數(shù)據(jù)挖掘的主要方法有:概念/類描述,關(guān)聯(lián)分析,分類和預(yù)測(cè),聚類分析,孤立點(diǎn)分析和演變分析等,具體材料請(qǐng)?jiān)斠?jiàn):
[論文摘要]本文分析了客戶流失問(wèn)題產(chǎn)生的原因及幾種主要的表現(xiàn)形式,闡述了運(yùn)用數(shù)據(jù)挖掘技術(shù)建立客戶流失預(yù)測(cè)模型的必要性,介紹了幾種主要的數(shù)據(jù)挖掘分類方法,最后簡(jiǎn)單論述了數(shù)據(jù)挖掘流程中的數(shù)據(jù)準(zhǔn)備步驟。
關(guān)鍵詞:數(shù)據(jù)挖掘客戶流失預(yù)測(cè)模型應(yīng)用
一、前言
以前,人們往往很長(zhǎng)時(shí)間內(nèi)(甚至是一生)都選用同一家公司的產(chǎn)品,但現(xiàn)在情況已經(jīng)改變了。隨著經(jīng)濟(jì)的全球化、多樣化,公司之間的競(jìng)爭(zhēng)日趨激烈,客戶選擇產(chǎn)品及產(chǎn)家的余地越來(lái)越大,同時(shí)越來(lái)越注重服務(wù)等附加值,客戶流失正日益成為全球企業(yè)面臨的一個(gè)普遍性問(wèn)題。據(jù)統(tǒng)計(jì),贏得一個(gè)新客戶所花費(fèi)的成本是保留住一個(gè)老客戶的5~6倍,如何保持老客戶,控制高價(jià)值客戶的流失必將成為企業(yè)提高競(jìng)爭(zhēng)力,在激烈競(jìng)爭(zhēng)中致勝的關(guān)鍵。企業(yè)必須將戰(zhàn)略重心從優(yōu)化內(nèi)部流程、提高運(yùn)營(yíng)效率轉(zhuǎn)移到滿足客戶需求、穩(wěn)定和擴(kuò)大客戶群上,實(shí)踐以客戶為中心、以市場(chǎng)為導(dǎo)向的經(jīng)營(yíng)理念。
二、客戶流失簡(jiǎn)介
客戶流失是指客戶停止使用原有的產(chǎn)品或服務(wù),或轉(zhuǎn)而使用競(jìng)爭(zhēng)對(duì)手的產(chǎn)品或服務(wù)。企業(yè)客戶流失有三種表現(xiàn)形式:公司內(nèi)客戶轉(zhuǎn)移,客戶被動(dòng)流失,客戶主動(dòng)流失。以電信業(yè)為例,(1)公司內(nèi)客戶轉(zhuǎn)移表現(xiàn)為客戶轉(zhuǎn)移至本電信公司的不同網(wǎng)絡(luò)或不同業(yè)務(wù)。例如,電信企業(yè)增加新業(yè)務(wù),或者資費(fèi)調(diào)整引發(fā)的業(yè)務(wù)轉(zhuǎn)移,或者從普通的固定電話轉(zhuǎn)至IP電話等。在這種情況下,雖然就某個(gè)業(yè)務(wù)單獨(dú)統(tǒng)計(jì)來(lái)看存在客戶流失,但對(duì)公司整體而言客戶沒(méi)有流失,當(dāng)然公司內(nèi)客戶轉(zhuǎn)移也會(huì)影響公司的收入。(2)客戶被動(dòng)流失表現(xiàn)為電信運(yùn)營(yíng)商由于客戶欺詐或惡意欠費(fèi)等行為而主動(dòng)終止客戶使用網(wǎng)絡(luò)和業(yè)務(wù)。這是由于電信運(yùn)營(yíng)商在客戶開(kāi)發(fā)的過(guò)程中忽視了客戶質(zhì)量造成的。(3)客戶主動(dòng)流失分為兩種情況,一種是客戶不再使用任何一家電信運(yùn)營(yíng)商的電信業(yè)務(wù),另一種是客戶選擇了另一家運(yùn)營(yíng)商,即所謂的“客戶跳網(wǎng)”。后者的原因主要是客戶認(rèn)為公司不能提供他所期待的價(jià)值,即公司為客戶提供的客戶讓利價(jià)值低于另一家電信運(yùn)營(yíng)商。這可能是客戶對(duì)電信公司的業(yè)務(wù)或服務(wù)不滿意,也可能是客戶僅僅想嘗試一下別家公司提供而本公司未提供的新業(yè)務(wù)。這種客戶流失形式往往是研究的主要內(nèi)容。公務(wù)員之家
三、數(shù)據(jù)挖掘產(chǎn)生的背景及主要分析方法
研究哪些客戶即將流失,實(shí)質(zhì)上是一個(gè)分類問(wèn)題,即將現(xiàn)有客戶分為流失和不流失兩類。傳統(tǒng)的分類方法一般是基于經(jīng)驗(yàn)的分類方法或基于統(tǒng)計(jì)的簡(jiǎn)單劃分方法。前者一般由決策者根據(jù)以往的經(jīng)驗(yàn)對(duì)客戶進(jìn)行類別劃分,因此具有較強(qiáng)的主觀性;后者一般是根據(jù)對(duì)客戶屬性特征的簡(jiǎn)單統(tǒng)計(jì)來(lái)劃分客戶類別。雖然這些劃分對(duì)企業(yè)的客戶管理也是很有意義的,但卻無(wú)法滿足一些復(fù)雜的分析需求,例如:客戶流失的概率如何;哪些因素造成了客戶流失;不同類別之間客戶的流失情況有什么差別;如果某個(gè)客戶將要流失,他會(huì)在多長(zhǎng)時(shí)間內(nèi)流失等。另一方面,數(shù)據(jù)庫(kù)技術(shù)的成熟應(yīng)用已使企業(yè)積累了大量的數(shù)據(jù),管理層希望擺脫經(jīng)驗(yàn),從這些數(shù)據(jù)礦藏里提煉出有價(jià)值的“知識(shí)”,利用這些“知識(shí)”建立起有效的客戶流失預(yù)測(cè)模型。但是傳統(tǒng)的數(shù)據(jù)庫(kù)管理系統(tǒng)是面向應(yīng)用的,只處理日常的經(jīng)營(yíng)業(yè)務(wù),不具備智能數(shù)據(jù)處理的功能,如何獲得這些“知識(shí)”就促成了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生。概括地講,數(shù)據(jù)挖掘是指從數(shù)據(jù)倉(cāng)庫(kù)中提取人們感興趣的,事先未知的,有用的或潛在有用的信息。
數(shù)據(jù)挖掘的主要方法有:概念/類描述,關(guān)聯(lián)分析,分類和預(yù)測(cè),聚類分析,孤立點(diǎn)分析和演變分析。在客戶流失預(yù)測(cè)模型中主要用到的是分類算法。分類是一種有監(jiān)督的學(xué)習(xí)方法,它通過(guò)在一個(gè)包含了已知流失和未流失的客戶樣本集上進(jìn)行模型訓(xùn)練,得到一個(gè)能夠預(yù)測(cè)客戶是否會(huì)流失的分類器,然后去預(yù)測(cè)客戶未來(lái)的流失傾向。目前運(yùn)用最廣泛的是基于決策樹(shù)的分類算法,如ID3、C4.5、C5.0、CART等。決策樹(shù)算法建模簡(jiǎn)單,分類準(zhǔn)確率高,而且能導(dǎo)出簡(jiǎn)明易懂的諸如If-Then形式的分類規(guī)則,十分適合客戶流失預(yù)測(cè)問(wèn)題。但是,決策樹(shù)算法很難確定分類概率,即難以計(jì)算出客戶流失的概率。Logistic回歸、人工神經(jīng)網(wǎng)絡(luò)雖然能得出流失概率,但是這兩種模型的內(nèi)在表示是隱含的,不能像決策樹(shù)那樣可以得到一個(gè)If-Then形式的分類規(guī)則,而且神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)局部最小化和“過(guò)擬和”問(wèn)題,預(yù)測(cè)性能不佳。
以上的數(shù)據(jù)挖掘方法都要求有較多的訓(xùn)練樣本,對(duì)于小樣本集,訓(xùn)練結(jié)果最好的模型不一定是預(yù)測(cè)能力做好的模型。因此,如何從小樣本集出發(fā),得到預(yù)測(cè)能力最好的模型,就成為數(shù)據(jù)挖掘研究領(lǐng)域內(nèi)的一個(gè)難題。即所謂“小樣本難題”。支持向量機(jī)(SVM)是數(shù)據(jù)挖掘中的一項(xiàng)新技術(shù),最初于20世紀(jì)90年代有Vapnik提出,它從嚴(yán)格的數(shù)學(xué)理論出發(fā),論證和實(shí)現(xiàn)了在小樣本情況下能最大限度地提高預(yù)測(cè)可靠性的方法。近年來(lái),SVM在解決分類問(wèn)題方面得到了廣泛的應(yīng)用。
四、結(jié)束語(yǔ)
在整個(gè)數(shù)據(jù)挖掘流程中最關(guān)鍵,工作量最大,也最容易被忽視的一個(gè)步驟是數(shù)據(jù)準(zhǔn)備,即通過(guò)數(shù)據(jù)清理、數(shù)據(jù)集成和變換、數(shù)據(jù)規(guī)約建立起訓(xùn)練樣本集和測(cè)試樣本集。無(wú)論算法多先進(jìn),如果數(shù)據(jù)不準(zhǔn)確或不完整,結(jié)果都是錯(cuò)誤的,正所謂“垃圾進(jìn),垃圾出”。如何提供干凈、正確、完整的數(shù)據(jù),這有待于進(jìn)一步的研究。
參考文獻(xiàn):
[1]JiaweiHan:數(shù)據(jù)挖掘概念與技術(shù).機(jī)械工業(yè)出版社,2002.9出版
[2]夏國(guó)恩陳云金煒東:電信企業(yè)客戶流失預(yù)測(cè)模型.統(tǒng)計(jì)與決策,2006.10
[3]AlexBerson:構(gòu)建面向CRM的數(shù)據(jù)挖掘應(yīng)用.人民郵電出版社,2001.8出版
熱門(mén)標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)安全論文 數(shù)據(jù)管理論文 數(shù)據(jù)庫(kù)論文 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)誤差 數(shù)據(jù)采集 數(shù)據(jù)通信論文 數(shù)據(jù) 心理培訓(xùn) 人文科學(xué)概論