前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經(jīng)網(wǎng)絡(luò)算法的優(yōu)點(diǎn)范文,相信會(huì)為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
【關(guān)鍵詞】改進(jìn)型BP型神經(jīng)網(wǎng)絡(luò);模型參考;BP算法
引言
在現(xiàn)代化的工業(yè)生產(chǎn)中,隨著生產(chǎn)率的不斷提高,對(duì)產(chǎn)品質(zhì)量品種提出了越來越高的要求,使得生產(chǎn)過程變得日益復(fù)雜,要在越來越復(fù)雜的動(dòng)態(tài)系統(tǒng)及過程與環(huán)境高度不確定的情況下獲得更好的的控制效果,這就使得控制面臨新的挑戰(zhàn)。
1、BP神經(jīng)網(wǎng)絡(luò)及其改進(jìn)算法
1.1BP神經(jīng)網(wǎng)絡(luò)及傳統(tǒng)BP算法存在的問題
BP神經(jīng)網(wǎng)絡(luò)是基于誤差反向傳播算法(BP算法)的多層前向神經(jīng)網(wǎng)絡(luò),BP算法也已成為目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,其三層前饋神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
其中,網(wǎng)絡(luò)響應(yīng)函數(shù)為:(1)
BP算法按梯度下降的原則多次修改輸入層至隱含層,隱含層至輸出層的相應(yīng)權(quán)值,直到滿足精度要求或網(wǎng)絡(luò)不收斂。眾所周知,BP網(wǎng)絡(luò)的學(xué)習(xí)過程是對(duì)一個(gè)高度非線性函數(shù)求全局最優(yōu)問題,網(wǎng)絡(luò)訓(xùn)練中存在兩個(gè)比較典型的問題。一是收斂速度慢,二是容易陷入局部極小。對(duì)此已有很多學(xué)者提出了各種解決方案和修正算法,如累計(jì)誤差校正算法、S函數(shù)輸出限幅算法、結(jié)合遺傳算法的優(yōu)化權(quán)值算法等。
1.2傳統(tǒng)BP算法的改進(jìn)
BP算法存在的上述兩個(gè)問題,其原因在本質(zhì)上是相同的,都是由于網(wǎng)絡(luò)的響應(yīng)函數(shù)造成的。BP算法中每次調(diào)節(jié)網(wǎng)絡(luò)權(quán)值的幅度均按與響應(yīng)函數(shù)導(dǎo)數(shù)成正比進(jìn)行,這樣,在誤差曲線平面較平坦處,網(wǎng)絡(luò)誤差大,偏導(dǎo)數(shù)值小,權(quán)值參數(shù)的調(diào)節(jié)幅度也較小,致使需多次調(diào)整才能降低誤差曲面;而在誤差曲面曲率較高處偏導(dǎo)數(shù)數(shù)值較大,權(quán)值參數(shù)調(diào)節(jié)的幅度也較大,致使在誤差函數(shù)最小點(diǎn)附近發(fā)生過沖現(xiàn)象,產(chǎn)生振蕩,難以收斂到最小點(diǎn)。現(xiàn)通過慣性校正方法及重新構(gòu)造響應(yīng)函數(shù)法來克服這兩個(gè)問題。
1.2.1慣性校正法
分別對(duì)這些情況進(jìn)行仿真,得到圖3和圖4所示的仿真結(jié)果,圖3是基于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)作為控制器而得出的波形圖對(duì)比,圖4是基于改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)作為控制器得出的波形圖對(duì)比。
圖3中的曲線為參考模型輸出和改變參考模型參數(shù)時(shí)的波形輸出對(duì)比.其中,波形幅值最小的是參考模型輸出結(jié)果,改變系統(tǒng)模型的參數(shù),輸出基本上能夠跟隨系統(tǒng)輸出,改變參數(shù)過大時(shí),結(jié)果也可以在接受的范圍之內(nèi).實(shí)驗(yàn)結(jié)果表明,當(dāng)系統(tǒng)的數(shù)學(xué)模型和參考模型有較大差異時(shí),采用傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)而建立的自適應(yīng)控制器,盡管利用這種控制策略可以獲得比較滿意的結(jié)果,但是,系統(tǒng)的穩(wěn)定性較差,收斂性也比較慢些。
圖4中的曲線也是參考模型輸出和改變參考模型參數(shù)時(shí)的波形輸出對(duì)比,其中,波形幅值最小的是參考模型輸出結(jié)果,改變系統(tǒng)模型的參數(shù),輸出基本上跟隨系統(tǒng)輸出,改變參數(shù)過大時(shí),結(jié)果仍然在接受的范圍之內(nèi).實(shí)驗(yàn)結(jié)果表明,當(dāng)系統(tǒng)的數(shù)學(xué)模型和參考模型有較大差異時(shí),采用改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)而建立的自適應(yīng)控制器,要比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)而建立的自適應(yīng)控制器具有更好的穩(wěn)定性和更好的跟蹤效果。
4、結(jié)論
借助BP神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)而建立的自適應(yīng)控制器策略,不需被控對(duì)象的數(shù)學(xué)模型,只需對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后利用訓(xùn)練結(jié)果進(jìn)行控制系統(tǒng)設(shè)計(jì)。仿真結(jié)果可以看出,改進(jìn)型BP網(wǎng)絡(luò)結(jié)合自適應(yīng)控制設(shè)計(jì)出的控制器,比傳統(tǒng)的BP網(wǎng)絡(luò)結(jié)合自適應(yīng)控制設(shè)計(jì)出的控制器能夠更好的跟蹤被控對(duì)象.
參考文獻(xiàn)
關(guān)鍵詞:RBF神經(jīng)網(wǎng)絡(luò);數(shù)據(jù)挖掘;遺傳算法
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)07-0151-03
Research on Data Mining Method Based on RBF Neural Network
CAO Jia-jie, YANG Meng, XU Xin-yu
(Beijing Satellite Manufacturing Plant, Beijing 100000, China)
Abstract: The rapid development of Internet technology and database technology is widely used at the same time, human through information technology to collect data is more and more strong, and how to from a lot of data mining valuable information and knowledge has become particularly urgent. In order to solve the above problems, data mining technology arises at the historic moment. It is found that the data mining the data for the nonlinear, messy and the presence of noise data, neural network is by virtue of the degree of fault tolerance, distributed storage, parallel processing, adaptive and robust feature is widely used to deal with some of the data mining problems. Accordingly, in this case, the author first introduces the data mining and RBF neural network of the relevant theoretical knowledge, and then focus on the RBF neural network based on the data mining method for peer reference.
Key words: RBF neural network; data mining; genetic algorithm
數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘有價(jià)值的信息和知識(shí),以便為管理決策和戰(zhàn)略部署提供數(shù)據(jù)支撐。數(shù)據(jù)挖掘作為信息技術(shù)發(fā)展的結(jié)果,其應(yīng)用前景相當(dāng)廣泛。數(shù)據(jù)庫技術(shù)主要研究數(shù)據(jù)的組織、存儲(chǔ)、獲取和處理,而信息技術(shù)主要經(jīng)歷以下發(fā)展歷程:數(shù)據(jù)的簡單收集和數(shù)據(jù)庫的初期建設(shè)數(shù)據(jù)的存儲(chǔ)與檢索、數(shù)據(jù)庫的事務(wù)處理數(shù)據(jù)的分析與理解,此時(shí)便出現(xiàn)數(shù)據(jù)挖掘技術(shù)。基于上述研究背景,下文首先分別介紹數(shù)據(jù)挖掘與RBF神經(jīng)網(wǎng)絡(luò)的相關(guān)理論知識(shí),并在此基礎(chǔ)上,討論基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,目的是為了研究數(shù)據(jù)挖掘所用到的分類算法。關(guān)于神經(jīng)網(wǎng)絡(luò),作為一種人工智能技術(shù),其一方面可以省去繁瑣的數(shù)學(xué)建模和數(shù)學(xué)推理,另一方面在處理含噪聲的非線性數(shù)據(jù)時(shí)表現(xiàn)出無與倫比的優(yōu)越性。
1 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是非平凡的數(shù)據(jù)處理過程,即識(shí)別數(shù)據(jù)集中具有潛在價(jià)值、新穎有效且最終可被理解的模式,其中潛在價(jià)值指的是挖掘出的知識(shí)具有實(shí)際效用;新穎是指識(shí)別出的模式新穎;有效是指識(shí)別出的模式在一定程度上是正確的;最終可被理解是指識(shí)別出的數(shù)據(jù)可被用戶理解。圖1所示為數(shù)據(jù)挖掘的工作流程。
如圖1所示,數(shù)據(jù)挖掘主要經(jīng)歷數(shù)據(jù)準(zhǔn)備、模式提取、結(jié)果解釋與評(píng)估等階段,其中數(shù)據(jù)準(zhǔn)備的步驟為:數(shù)據(jù)清洗數(shù)據(jù)選取數(shù)據(jù)預(yù)處理數(shù)據(jù)表示;數(shù)據(jù)提取階段又稱數(shù)據(jù)挖掘階段,其實(shí)現(xiàn)步驟為:確定數(shù)據(jù)挖掘的目標(biāo)或任務(wù)選取適宜的數(shù)據(jù)挖掘工具或算法進(jìn)行數(shù)據(jù)挖掘操作;結(jié)果解釋與評(píng)估階段主要對(duì)所識(shí)別的數(shù)據(jù)進(jìn)行評(píng)估、篩除。一般來講,數(shù)據(jù)挖掘質(zhì)量主要與以下影響因素有關(guān):數(shù)據(jù)挖掘技術(shù)的可靠性與有效性;目標(biāo)數(shù)據(jù)的數(shù)量與質(zhì)量。總之,數(shù)據(jù)挖掘是一個(gè)反復(fù)反饋的過程,而可視化貫穿在數(shù)據(jù)挖掘的全過程。
數(shù)據(jù)挖掘的方法一般分為統(tǒng)計(jì)型、機(jī)械學(xué)習(xí)型兩大類,而較為常用的算法包括遺傳算法、神經(jīng)網(wǎng)絡(luò)等。遺傳算法是一種以生物進(jìn)化理論為基礎(chǔ)的優(yōu)化空間搜尋法,其在數(shù)據(jù)挖掘中,通常以搜索問題的形式來表述具體的任務(wù),并通過選擇、交叉、變異遺傳等操作尋得最優(yōu)解。神經(jīng)網(wǎng)絡(luò)是一種與人類大腦重復(fù)學(xué)習(xí)類似的方法,即通過學(xué)習(xí)和訓(xùn)練一些事先給出的樣本,產(chǎn)生與樣品有所區(qū)別的特征和模式,其中樣本集應(yīng)具有代表性。研究表明,神經(jīng)網(wǎng)絡(luò)具有準(zhǔn)確預(yù)測復(fù)雜的問題、有效處理存在噪聲的數(shù)據(jù)等優(yōu)點(diǎn)。神經(jīng)網(wǎng)絡(luò)一般分為自組織、反饋式和前饋式神經(jīng)網(wǎng)絡(luò),目前正被廣泛應(yīng)用于商業(yè)領(lǐng)域。
2 RBF神經(jīng)網(wǎng)絡(luò)
RBF網(wǎng)絡(luò)結(jié)構(gòu)是一種由輸入層、隱含層和輸出層組成的三層前向網(wǎng)絡(luò),其中輸入層包含信號(hào)源結(jié)點(diǎn);隱含層主要由節(jié)點(diǎn)數(shù)目描述的具體問題而定;輸出層主要響應(yīng)輸入模式的具體作用。圖2所示為RBF神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)模型。
如圖2所示,RBF網(wǎng)絡(luò)由輸入層向隱含層變換的過程具有非線性的特征,而由隱含層向輸入層變化的過程具有線性的特征。據(jù)此可知,RBF神經(jīng)網(wǎng)絡(luò)是一種基于前饋網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。研究發(fā)現(xiàn),RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)會(huì)對(duì)自身的性能產(chǎn)生影響,而以下因素又會(huì)對(duì)RBF網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)產(chǎn)生影響:RBF的隱節(jié)點(diǎn)數(shù)目、中心矢量、徑向基函數(shù)寬度和隱含層與輸出層的權(quán)值矩陣。
RBF網(wǎng)絡(luò)具有較強(qiáng)的非線性逼近性能。得益于此,其目前主要用來實(shí)現(xiàn)非線性系統(tǒng)的建模與數(shù)據(jù)挖掘、貝葉斯規(guī)則和連續(xù)輸入/出數(shù)據(jù)對(duì)的映射建模。與其他前向神經(jīng)網(wǎng)絡(luò)相比,RBF神經(jīng)網(wǎng)絡(luò)具有以下優(yōu)點(diǎn):
1)RBF神經(jīng)網(wǎng)絡(luò)能逼近任意非線性映射,也能處理系統(tǒng)內(nèi)部的規(guī)律性問題。就無噪聲數(shù)據(jù)而言,RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度高且擬合能力強(qiáng);而就存在噪聲的數(shù)據(jù)來講,RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差和擬合誤差均偏低,且收斂速度相當(dāng)快。得益于此,RBF神經(jīng)網(wǎng)絡(luò)在時(shí)序建模和分析中的應(yīng)用十分廣泛。
2)RBF神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)加快了學(xué)習(xí)速度和規(guī)避了局部極小的問題。RBF神經(jīng)網(wǎng)絡(luò)采用核函數(shù),特別是高斯函數(shù)的使用使得核函數(shù)的優(yōu)點(diǎn)更為突出:表示簡單、光滑性好和解釋性好等。
3)RBF神經(jīng)網(wǎng)絡(luò)的可解釋性好。目前,以下理論均可用于RBF網(wǎng)絡(luò)參數(shù)和拓?fù)浣Y(jié)構(gòu)的解釋中:RBF網(wǎng)絡(luò)能夠?qū)斎雽愚D(zhuǎn)向輸出層進(jìn)行映射;核回歸能夠逼近存在噪聲的函數(shù)噪聲數(shù)據(jù)插值能夠逼近輸入缺少函數(shù);規(guī)則化可以通過在一般化與精確匹配中尋求平衡;貝葉斯規(guī)則可以根據(jù)前概率計(jì)算出后概率。
3 基于RBF神經(jīng)網(wǎng)絡(luò)的分類數(shù)據(jù)挖掘
關(guān)于RBF神經(jīng)網(wǎng)絡(luò)的研究,其主要表現(xiàn)在以下兩個(gè)方面: RBF網(wǎng)絡(luò)結(jié)構(gòu)模型; RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。
3.1 RBF網(wǎng)絡(luò)結(jié)構(gòu)模型
在實(shí)際應(yīng)用中,RBF模型的應(yīng)用范圍更廣,其核函數(shù)使用的是高斯函數(shù)。但研究發(fā)現(xiàn),在上述結(jié)構(gòu)模型中,訓(xùn)練算法的優(yōu)劣會(huì)對(duì)模型的應(yīng)用效果和RBF網(wǎng)絡(luò)性能的高低產(chǎn)生決定作用。鑒于此,研究人員提出一些具有新特點(diǎn)和新性能的網(wǎng)絡(luò)模型,具體包括:
1)高斯型核函數(shù)一般化。當(dāng)隱含層RBF采用以下高斯條函數(shù)時(shí),將大大改善RBFN的綜合性能:[Φ?x)=exp-(x-cj?T(x-cj)]/2σ2j]。對(duì)于普通高斯函數(shù),其擁有半徑相同的變量軸和超球面狀的函數(shù)曲面。但與此相比,高斯條核函數(shù)擁有超橢球面狀的函數(shù)曲面和半徑不同的變量軸,因此它具有更強(qiáng)的樣本點(diǎn)逼近能力和更大的網(wǎng)絡(luò)訓(xùn)練工作量。
2)WNN(小波神經(jīng)網(wǎng)絡(luò))。WNN是一種基于小波函數(shù)的函數(shù)連接型網(wǎng)絡(luò),因此在一定程度上應(yīng)被看作RBFN的推廣形式。WNN的激活函數(shù)為小波函數(shù),具體以仿射變換的方式創(chuàng)建網(wǎng)絡(luò)參數(shù)與小波變換之間的聯(lián)系,因此所表現(xiàn)出的特點(diǎn)與RBFN有所差異。此外,WNN具有極佳的時(shí)頻特征,因此被廣泛應(yīng)用于圖像處理和模式識(shí)別等領(lǐng)域。
3)RBPNN(徑向基概率神經(jīng)網(wǎng)絡(luò))。RBPNN作為RBFNN與PNN綜合發(fā)展的結(jié)果,其學(xué)習(xí)收斂速度比RBFN更快,同時(shí)也將模式之間的交錯(cuò)影響考慮其中。關(guān)于RBPNN,其結(jié)構(gòu)主要由2個(gè)隱含層、1個(gè)輸入層、2個(gè)輸出層組成,其中第一個(gè)隱含層為非線處理層,具體包括隱中心矢量,此乃網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的核心對(duì)象;在輸出層得出輸入樣本概率密度的估算值,可降低計(jì)算的復(fù)雜度。
4)GRNN(廣義回歸網(wǎng)絡(luò))。GRNN使用的也是高斯型徑向基函數(shù),一般被看作RBFN的變換形式。GRNN的結(jié)構(gòu)主要由模式層、輸入層、加和層、輸出層組成,其中核函數(shù)所包含的平滑因子需采用優(yōu)化或經(jīng)驗(yàn)方法來選定。
3.2 RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法
在RBF網(wǎng)絡(luò)設(shè)計(jì)中,最為核心的問題是如何合理確定中心點(diǎn)的位置、數(shù)目和訓(xùn)練網(wǎng)絡(luò)權(quán)值。通常情況下,中心點(diǎn)的確定與權(quán)值的訓(xùn)練既可分開實(shí)現(xiàn),又可同時(shí)進(jìn)行。鑒于此,RBF網(wǎng)絡(luò)可以采用以下兩類學(xué)習(xí)算法:
3.2.1 靜態(tài)學(xué)習(xí)算法
靜態(tài)學(xué)習(xí)算法是一種離線學(xué)習(xí)算法,即在離線設(shè)計(jì)RBF網(wǎng)絡(luò)時(shí),中心點(diǎn)的確定與權(quán)值的訓(xùn)練分開進(jìn)行。
1)隨機(jī)確定RBF中心點(diǎn),即隨機(jī)從訓(xùn)練數(shù)據(jù)集中選取RBF中心點(diǎn)。當(dāng)RBF選取以下高斯函數(shù):[G(X-Cj2=exp(-m/d2maxX-Cj)j=1,2,...,m],其中,[Cj]――RBF的中心點(diǎn);[m]――中心數(shù);[dmax]――相鄰中心點(diǎn)最大的間隔距離,因此高斯徑向基函數(shù)的寬度[σ=dmax/2m]。利用上述算法,可以避免RBF的形狀出現(xiàn)過平或過陡兩種極端現(xiàn)象。如此一來,便可通過計(jì)算線性方程組的方式來確定輸出層與隱含層的連接權(quán)值。
2)自組織學(xué)習(xí)確定RBF中心點(diǎn)。混合學(xué)習(xí)過程主要包括自組織學(xué)習(xí)階段、監(jiān)督學(xué)習(xí)階段,其中自組織學(xué)習(xí)階段的任務(wù)是采用聚類算法來估計(jì)隱含層RBF的中心點(diǎn);監(jiān)督學(xué)習(xí)階段主要通過對(duì)輸出層線性權(quán)重進(jìn)行估計(jì)來設(shè)計(jì)網(wǎng)絡(luò),具體采用最小二乘法。輸出層節(jié)點(diǎn)的LMS算法與隱含層節(jié)點(diǎn)的K-均值聚類同時(shí)進(jìn)行,以加速學(xué)習(xí)過程。
3)有監(jiān)督學(xué)習(xí)確定RBF中心點(diǎn),即通過有監(jiān)督學(xué)習(xí)解得RBF的中心點(diǎn)和自有參數(shù),具體使用牛頓法或梯度下降法等。如果使用梯度下降法,則應(yīng)從參數(shù)空間的某一有效區(qū)域開始進(jìn)行搜索,即先利用RBF網(wǎng)絡(luò)得到高斯分類算法,再以分類結(jié)果為搜索點(diǎn),以免學(xué)習(xí)程收斂至局部極小。
3.2.2 動(dòng)態(tài)學(xué)習(xí)算法
動(dòng)態(tài)學(xué)習(xí)算法是一種在線學(xué)習(xí)算法,其主要在在線數(shù)據(jù)挖掘環(huán)境中使用。由于在在線數(shù)據(jù)挖掘環(huán)境中,通常不會(huì)全部給定訓(xùn)練樣本,因此如果隱含層中心點(diǎn)與單元數(shù)目的確定采用靜態(tài)學(xué)習(xí)算法,則解算結(jié)果不一定最優(yōu),而在線學(xué)習(xí)算法支持動(dòng)態(tài)刪除或加入隱含層節(jié)點(diǎn),且隱含層中心點(diǎn)的確定和權(quán)值的訓(xùn)練同時(shí)進(jìn)行,因此可以動(dòng)態(tài)構(gòu)造網(wǎng)絡(luò)。
1)以分組優(yōu)化策略為基礎(chǔ)的在線學(xué)習(xí)法。訓(xùn)練神經(jīng)網(wǎng)絡(luò)是約束優(yōu)化的過程,則需對(duì)特定的神經(jīng)網(wǎng)絡(luò)類型進(jìn)行深入探討。以下內(nèi)容為在線隱含層單元的確定策略:當(dāng)輸入的訓(xùn)練樣本同時(shí)滿足以下條件時(shí),則為之分配相應(yīng)的隱含層但愿你:網(wǎng)絡(luò)輸出誤差比誤差的設(shè)定閥值大;輸入樣本與隱層中心點(diǎn)之間的距離比距離的設(shè)計(jì)閥值大。如果在RBF神經(jīng)網(wǎng)絡(luò)在線訓(xùn)練方式中引入分組優(yōu)化策略,則網(wǎng)絡(luò)輸出與網(wǎng)絡(luò)權(quán)值之間存在線性關(guān)系,同時(shí)與隱含層單元的寬度、中心點(diǎn)之間存在非線性關(guān)系,表明盡量采取不同的優(yōu)化方法來處理兩部分的參數(shù)。
2)最近鄰聚類算法。最近鄰居類算法作為動(dòng)態(tài)自適應(yīng)聚類學(xué)習(xí)算法,由其聚類得出的RBF網(wǎng)絡(luò)不僅最優(yōu),且支持在線學(xué)習(xí)。最近鄰聚類算法的實(shí)現(xiàn)過程為:
① 設(shè)定高斯函數(shù)寬度為r,定義矢量A(l)存放輸出矢量的總和,定義計(jì)數(shù)器B(l)統(tǒng)計(jì)樣本數(shù)量,其中類別數(shù)目為l。
② 對(duì)于數(shù)據(jù)對(duì)[(x1,y1)],于[x1]上創(chuàng)建1個(gè)聚類中心,并令[x1=c1],[y1=A(1)],[B(1)=1],那么在RBF網(wǎng)絡(luò)中便僅存在1個(gè)中心為[c1]的隱含層單元,且隱含層單元與輸出層的權(quán)矢量[w1=A(1)/B(1)]。
③ 對(duì)于數(shù)據(jù)對(duì)[(x2,y2)],解得[x2]與[c1]之間的距離[x2-c1]。假設(shè)[x2-c1≤r],那么[x2]的最近鄰聚類為[c1],假設(shè)[A(1)=y1+y2],[B(1)=B(1)+1],[w1=A(1)/B(1)];假設(shè)[x2-c1>r],那么以[x2]為新的聚類中心,同時(shí)假設(shè)[c2=x2],[A(2)=y2],[B(2)=1]。根據(jù)上述要求創(chuàng)建的RBF網(wǎng)絡(luò),再在其中加入一個(gè)隱含層單元,其與輸出層之間的權(quán)矢量[w2=A(2)/B(2)]。
④ 假設(shè)第k個(gè)數(shù)據(jù)對(duì)[(xk,yk)(k=3,4,...,n)]的聚類中心數(shù)為M,相應(yīng)的中心點(diǎn)為[c1,c2,...,cm],則由此創(chuàng)建的RBF網(wǎng)絡(luò)中便存在M個(gè)隱含層單元。據(jù)此,解得[xk]與M個(gè)聚類中心的間距為[xk-ci,i=1,2,...,M],假設(shè)兩者的減小間距為[xk-ci],那么[xk]的最近鄰聚類為[ci]。根據(jù)第一、二數(shù)據(jù)對(duì)的計(jì)算步驟,解得當(dāng)[xk-ci>r]時(shí),第M個(gè)隱含層單元與輸出層之間的權(quán)矢量[wM=A(M)/B(M)];當(dāng)[xk-ci≤r]時(shí),隱含層單元與輸出層之間的權(quán)矢量[wi=A(i)/B(i),i=1,2,...,M]。研究發(fā)現(xiàn),動(dòng)態(tài)自適應(yīng)RBF網(wǎng)絡(luò)的難易程度由r所決定,即聚類數(shù)目與r呈負(fù)相關(guān),即r越小,聚類數(shù)目越多,則計(jì)算量越大和精度越高,反之亦然。總之,最近鄰聚類法具有性能優(yōu)點(diǎn)、計(jì)算量小河學(xué)習(xí)時(shí)間短等優(yōu)點(diǎn),不僅可以通過確定隱含層來建立RBF神經(jīng)網(wǎng)絡(luò),還可以在動(dòng)態(tài)輸入模式在線學(xué)習(xí)中得到有效應(yīng)用。
綜上,RBF網(wǎng)絡(luò)是一種具有最佳擬合和全局逼近性能的前向型神經(jīng)網(wǎng)絡(luò),其無疑具有廣闊的應(yīng)用前景,但在實(shí)際應(yīng)用中,應(yīng)當(dāng)考慮到局部極小問題的存在,進(jìn)而保障其應(yīng)用效果。
參考文獻(xiàn):
[1] 儲(chǔ)兵,吳陳,楊習(xí)貝,等.基于RBF神經(jīng)網(wǎng)絡(luò)與粗糙集的數(shù)據(jù)挖掘算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(7):87-91.
[2] 宮曉曼,滕榮華.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘在煤礦選煤中的應(yīng)用[J].煤炭技術(shù),2013(9):127-128.
[3] 魏文軒.改進(jìn)型RBF神經(jīng)網(wǎng)絡(luò)在股票市場預(yù)測中的應(yīng)用[J].統(tǒng)計(jì)與決策,2013(15):70-72.
[4] 曹東方,王玉恒.數(shù)據(jù)挖掘在員工考評(píng)管理信息系統(tǒng)中的應(yīng)用[J].河北工業(yè)科技,2012,29(5):323-326.
[5] 姚應(yīng)水,葉明全.RBF神經(jīng)網(wǎng)絡(luò)與logistic回歸模型的對(duì)比研究[J].中國衛(wèi)生統(tǒng)計(jì),2011,28(4):397-399.
[6] 張會(huì)敏,葉明全,羅永錢等.基于RBF神經(jīng)網(wǎng)絡(luò)的老年癡呆癥智能診斷研究[J].中國數(shù)字醫(yī)學(xué),2015(6):38-41.
[7] 習(xí)勤,米帥軍.指標(biāo)篩選技術(shù)在神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘模型中的應(yīng)用[J].統(tǒng)計(jì)與決策,2011(10):163-165.
[8] 林濤,葛玉敏,安玳寧等.基于 RBF 神經(jīng)網(wǎng)絡(luò)的鋼構(gòu)件質(zhì)量追溯系統(tǒng)研究[J].計(jì)算技術(shù)與自動(dòng)化,2015(1):20-24.
摘要:常規(guī)PID控制器以其算法簡單、可靠性高等優(yōu)點(diǎn),在工業(yè)生產(chǎn)得到了廣泛應(yīng)用。但是,PID控制器存在控制參數(shù)不易在線實(shí)時(shí)整定、難于對(duì)復(fù)雜對(duì)象進(jìn)行有效控制等不足。利用神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自適應(yīng)和非線性映射等特點(diǎn),將神經(jīng)網(wǎng)絡(luò)和PID控制相結(jié)合,形成一種PID神經(jīng)網(wǎng)絡(luò)控制系統(tǒng),可對(duì)工業(yè)中使用的具有大時(shí)滯、慢時(shí)變、非線性特點(diǎn)的電爐系統(tǒng)進(jìn)行有效辨識(shí)與控制。
關(guān)鍵詞:PID神經(jīng)網(wǎng)絡(luò);智能控制器;滯后系統(tǒng);時(shí)變系統(tǒng);電爐控制系統(tǒng)
中圖分類號(hào):TP18文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)28-8028-03
Application of PID Neural Network in Electric Cooker Controlling Systems
REN Hui, WANG Wei-zhi
(Institute of Automation, Fuzhou University,Fuzhou 350002, China)
Abstract: General PID controller, because its algorithm is simple and high reliability,so has been widely used in industrial production. However, PID controller, there is not easy to line real-time control parameter tuning, is difficult for complex objects such as lack of effective control. Using neural network self-learning, adaptive and nonlinear mapping characteristics of neural network and PID control combined to form a PID neural network control system can be used in industry with a large time lag, slow time-varying, nonlinear characteristics of electric systems for effective identification and control.
Key words: PID neural network;intelligent controller;time lag system;time-varying system;electric cooker systems
近年來,隨著神經(jīng)網(wǎng)絡(luò)理論的發(fā)展,將控制中應(yīng)用最廣泛的PID的控制器與具有自學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)相結(jié)合,已成為智能控制研究的一個(gè)新方向。并且,在這個(gè)方向上已取得了一些研究成果 。其主要的結(jié)合方式是在常規(guī)PID控制器的基礎(chǔ)上增加一個(gè)神經(jīng)網(wǎng)絡(luò)模塊,利用神經(jīng)網(wǎng)絡(luò)來在線調(diào)節(jié) PID參數(shù),但缺點(diǎn)是結(jié)構(gòu)較復(fù)雜。本文介紹的PID神經(jīng)網(wǎng)絡(luò)是將PID控制規(guī)律融進(jìn)神經(jīng)網(wǎng)絡(luò)之中構(gòu)成的,實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)和PID控制規(guī)律的本質(zhì)結(jié)合。它屬于多層前向網(wǎng)絡(luò),但是它與一般的多層前向網(wǎng)絡(luò)又不完全相同,一般的多層前向網(wǎng)絡(luò)中的全部神經(jīng)元的輸入輸出特性都是相同的,而PID-NN的隱含層是由比例、積分、微分三個(gè)單元組成,是一種動(dòng)態(tài)前向網(wǎng)絡(luò),更適合于控制系統(tǒng)。各層神經(jīng)元個(gè)數(shù)、連接方式、連接權(quán)值是按控制規(guī)律的基本原則和已有的經(jīng)驗(yàn)確定的,保證了系統(tǒng)穩(wěn)定和快速收斂。由于PID神經(jīng)網(wǎng)絡(luò)控制器是將神經(jīng)網(wǎng)絡(luò)和PID控制規(guī)律融為一體,所以其既具有常規(guī)PID控制器結(jié)構(gòu)簡單、參數(shù)物理意義明確之優(yōu)點(diǎn),同時(shí)又具有神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、自適應(yīng)的功能,可將PID神經(jīng)網(wǎng)絡(luò)應(yīng)用于對(duì)工業(yè)控制領(lǐng)域的復(fù)雜非線性對(duì)象的控制。
本文提出一種基于PID神經(jīng)網(wǎng)絡(luò)的控制方案,用來對(duì)大時(shí)滯、慢時(shí)變、非線性的電爐系統(tǒng)進(jìn)行辨識(shí)與控制。
1 PID神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)
1.1 PID神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
PID神經(jīng)網(wǎng)絡(luò)是一個(gè) 3層的前向網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,其結(jié)構(gòu)如圖1所示。網(wǎng)絡(luò)的輸入層有2個(gè)神經(jīng)元,分別對(duì)應(yīng)系統(tǒng)的輸人和輸出;隱含層有3個(gè)神經(jīng)元,各神經(jīng)元的輸出函數(shù)互不相同,分別對(duì)應(yīng)比例(P)、積分(I)、微分(D)3個(gè)部分;網(wǎng)絡(luò)的輸出層完成PID-NN控制規(guī)律的綜合。網(wǎng)絡(luò)的前向計(jì)算實(shí)現(xiàn)PID神經(jīng)網(wǎng)絡(luò)的控制規(guī)律,網(wǎng)絡(luò)的反向算法實(shí)現(xiàn)PID神經(jīng)網(wǎng)絡(luò)參數(shù)的自適應(yīng)調(diào)整。
1.2 控制系統(tǒng)結(jié)構(gòu)及其工作原理
PID神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)結(jié)構(gòu)如圖2所示。控制系統(tǒng)包含PID神經(jīng)網(wǎng)絡(luò)辨識(shí)器(PID-NNI )和PID神經(jīng)網(wǎng)絡(luò)控制器((PID-NNC )。其中r(k)為系統(tǒng)的設(shè)定輸入,y(k)為被控對(duì)象的實(shí)際輸出,y~(k)為PID-NNI的輸出,u(k)為PID-NNC的輸出。系統(tǒng)的工作原理是:利用神經(jīng)網(wǎng)絡(luò)的非線性函數(shù)逼近能力和學(xué)習(xí)記憶功能,由PID-NNI在線對(duì)被控對(duì)象模型進(jìn)行辨識(shí)。它利用輸出偏差(e1(k)=y(k)-y~(k) ),修正網(wǎng)絡(luò)權(quán)值,使之逐步適應(yīng)被辨識(shí)對(duì)象的特性。當(dāng)它學(xué)習(xí)到與被控對(duì)象基本一致時(shí),PID-NNC利用系統(tǒng)偏差 (e2(k)=r(k)-y~(k)),通過反傳算法實(shí)時(shí)調(diào)整自身權(quán)值,以跟上系統(tǒng)的變化,達(dá)到有效控制的目的。
2 PID神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);遺傳算法;優(yōu)化理論
一、引言
在人類的歷史上,通過學(xué)習(xí)與模擬來增強(qiáng)自身適應(yīng)能力的例子不勝枚舉。模擬飛禽,人類可以翱游天空;模擬游魚,人類可以橫渡海洋;模擬昆蟲,人類可以縱觀千里;模擬大腦,人類創(chuàng)造了影響世界發(fā)展的計(jì)算機(jī)。人類的模擬能力并不僅僅局限于自然現(xiàn)象和其它生命體。自從20世紀(jì)后半葉以來,人類正在將其模擬的范圍延伸向人類自身。
神經(jīng)網(wǎng)絡(luò)是人類對(duì)其大腦信息處理機(jī)制的模擬,早期的自動(dòng)機(jī)理論假設(shè)機(jī)器是由類似于神經(jīng)元的基本元素組成,從而向人們展示了第一個(gè)自復(fù)制機(jī)模型。近年來諸如機(jī)器能否思維、基于規(guī)則的專家系統(tǒng)是否能勝任人類的工作、以及神經(jīng)網(wǎng)絡(luò)能否使機(jī)器具有生物功能已成為人工智能關(guān)注的焦點(diǎn)。
遺傳算法是一種更為宏觀意義下的仿生算法,它模仿的機(jī)制是一切生命與智能的產(chǎn)生與進(jìn)化過程。人類之所以能夠向其自身的演化學(xué)習(xí)以增強(qiáng)決策問題的能力,是因?yàn)樽匀谎莼^程本質(zhì)就是一個(gè)學(xué)習(xí)與優(yōu)化的過程。
神經(jīng)網(wǎng)絡(luò)和遺傳算法都是仿效生物處理模式以獲得智能信息處理功能的理論,二者雖然實(shí)施方法各異,但目標(biāo)相近,有很多特點(diǎn)相同,功能類似,對(duì)二者進(jìn)行深入地對(duì)比研究,并取長補(bǔ)短,將二者綜合運(yùn)用是非常有意義的課題。
二、神經(jīng)網(wǎng)絡(luò)與遺傳算法概述
自1943年第一個(gè)神經(jīng)網(wǎng)絡(luò)模型MP模型提出至今,神經(jīng)網(wǎng)絡(luò)的發(fā)展非常迅速,特別是1982年提出的Hopfield網(wǎng)絡(luò)模型和1985年提出的8P算法。使神經(jīng)網(wǎng)絡(luò)逐步發(fā)展成為用途廣泛的系統(tǒng)。神經(jīng)網(wǎng)絡(luò)是由大量神經(jīng)元廣泛互連。形成大規(guī)模并行處理和分布式的信息存儲(chǔ)的復(fù)雜網(wǎng)絡(luò)系統(tǒng)。單一神經(jīng)元可以有許多輸入、輸出。神經(jīng)元之間的相互作用通過連接的權(quán)重體現(xiàn)。神經(jīng)元的輸出是其輸入的函數(shù)。雖然每個(gè)神經(jīng)元的結(jié)構(gòu)和功能極其簡單和有限,但大量神經(jīng)元構(gòu)成的網(wǎng)絡(luò)系統(tǒng)的行為則是豐富多彩的。神經(jīng)網(wǎng)絡(luò)計(jì)算的基本特征是大規(guī)模并行處理、容錯(cuò)性、自適應(yīng)性和自組織性。大規(guī)模并行處理指能同時(shí)處理與決策有關(guān)的因素,雖然單個(gè)神經(jīng)元的動(dòng)作速度不快。但網(wǎng)絡(luò)的總體并行處理速度極快。容錯(cuò)性指由于神經(jīng)網(wǎng)絡(luò)包含的信息是分布存儲(chǔ)的,即使網(wǎng)絡(luò)某些單元和連接有缺陷,仍可以通過聯(lián)想得到全部或大部分信息。自適應(yīng)性和自組織性指它可以通過學(xué)習(xí),不斷適應(yīng)環(huán)境,增加知識(shí)的容量。
遺傳算法最早由美國密執(zhí)安大學(xué)的Holland教授在1975年發(fā)表的論文“自然和人工系統(tǒng)的適配”一文中提出。它是一種借鑒生物界自然選擇思想和遺傳機(jī)制的全局隨機(jī)搜索算法,其實(shí)現(xiàn)方法是,從一個(gè)初始種群出發(fā),不斷重復(fù)執(zhí)行選擇、雜交和變異的過程,使種群進(jìn)化越來越接近某一目標(biāo)。它的基本特征是大規(guī)模并行處理、通用性、魯棒性。大規(guī)模并行處理指遺傳算法的操作對(duì)象是一組可行解而非單個(gè)解。搜索路徑有多條而非單條,因而具有良好的并行性。通用性指只需利用目標(biāo)的取值信息,而無需梯度等高價(jià)值信息,因而適用于任何大規(guī)模、高度非線性的不連續(xù)多峰函數(shù)的優(yōu)化以及無解析表達(dá)式的目標(biāo)函數(shù)的優(yōu)化,具有很強(qiáng)的通用性。魯棒性指算法的擇優(yōu)機(jī)制是一種軟選擇,再加上其良好的并行性,使它具有很好的全局優(yōu)化性和穩(wěn)定性。
三、神經(jīng)網(wǎng)絡(luò)與遺傳算法在優(yōu)點(diǎn)上的相似性
(一)二者都可對(duì)問題進(jìn)行大規(guī)模的并行處理。整體上極大提高了運(yùn)算速度。這是神經(jīng)網(wǎng)絡(luò)和遺傳算法優(yōu)于傳統(tǒng)算法的最重要的特征。
對(duì)于神經(jīng)網(wǎng)絡(luò)來說,雖然每個(gè)神經(jīng)元都要計(jì)算連接函數(shù)和傳遞函數(shù)(也稱作用函數(shù)),但神經(jīng)元的計(jì)算可以分布式地并行進(jìn)行。對(duì)于遺傳算法來說,每一個(gè)個(gè)體都需要根據(jù)適應(yīng)值函數(shù)計(jì)算適應(yīng)值,每一代都有很多個(gè)體,表面看來也有很大的計(jì)算量,但可同時(shí)對(duì)多個(gè)可行解進(jìn)行操作,所以整體上與傳統(tǒng)的計(jì)算方法相比,運(yùn)算時(shí)間很短。從這一點(diǎn)來看,神經(jīng)網(wǎng)絡(luò)和遺傳算法都需要發(fā)展分布式并行計(jì)算系統(tǒng)來替代傳統(tǒng)的計(jì)算機(jī),這種計(jì)算系統(tǒng)不再是傳統(tǒng)計(jì)算機(jī)順序執(zhí)行命令的運(yùn)行過程,而是希望對(duì)輸入進(jìn)行平行處理;這種計(jì)算系統(tǒng)不再是只包含一個(gè)或幾個(gè)復(fù)雜的計(jì)算設(shè)備,而是由眾多簡單設(shè)備有機(jī)組成在一起共同執(zhí)行相同的計(jì)算功能;一旦適合這種要求的硬件系統(tǒng)得到發(fā)展,神經(jīng)網(wǎng)絡(luò)和遺傳算法將能得到更加廣泛地應(yīng)用,更有效地解決更大規(guī)模的實(shí)際問題。
(二)二者都具有高度的適應(yīng)性和容錯(cuò)性
人工神經(jīng)網(wǎng)絡(luò)在解決某個(gè)具體問題時(shí),可以反復(fù)用示例來訓(xùn)練它,在訓(xùn)練的過程中自組織自學(xué)習(xí)來適應(yīng)新的情況。而且,由于神經(jīng)網(wǎng)絡(luò)中信息的分布式存貯,即使個(gè)別神經(jīng)元出錯(cuò),也不會(huì)導(dǎo)致網(wǎng)絡(luò)運(yùn)行的癱瘓,所以總體上具有較強(qiáng)的可靠性;而遺傳算法通過每一代的選擇過程來淘汰適應(yīng)值較小的個(gè)體,保留適應(yīng)值較大的個(gè)體,從而使收斂的結(jié)果趨于適應(yīng)目標(biāo)值,通過變異算子將每一代的種群空間擴(kuò)大到個(gè)體空間,使每一個(gè)個(gè)體都有被選進(jìn)種群的機(jī)會(huì),每一個(gè)解都有機(jī)會(huì)參與計(jì)算。
(三)二者都通過對(duì)有限個(gè)可行解進(jìn)行操作來獲取對(duì)整個(gè)解空間的求解,實(shí)踐證明對(duì)于其中已經(jīng)相對(duì)成熟的算法,二者具有較好的魯棒性。
神經(jīng)網(wǎng)絡(luò),如BP算法,通過對(duì)有限個(gè)模式的訓(xùn)練和學(xué)習(xí)來實(shí)現(xiàn)對(duì)所有模式的識(shí)別;事實(shí)證明效果很好。遺傳算法通過在個(gè)體空間中選擇有限數(shù)目的個(gè)體作為種群進(jìn)行代代操作來實(shí)現(xiàn)對(duì)個(gè)體空間中最優(yōu)解的搜索。兩種方法都選擇了較少的操作數(shù)目,但由于算法本身的優(yōu)越性,仍能取得較好的穩(wěn)定性和收斂性。
四、神經(jīng)網(wǎng)絡(luò)與遺傳算法在缺點(diǎn)上的相似性
(一)二者優(yōu)越性的理論分析有待完善。
神經(jīng)網(wǎng)絡(luò)與遺傳算法各自的種類繁多,神經(jīng)網(wǎng)絡(luò)主要有前饋(BP)神經(jīng)網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)、自組織特征映射網(wǎng)絡(luò)、波爾茲曼機(jī)等,其中最有影響的是BP網(wǎng)絡(luò)和Hopfleld網(wǎng)絡(luò);遺傳算法主要有簡單遺傳算法、統(tǒng)計(jì)遺傳算法、共同進(jìn)化遺傳算法及其它改進(jìn)后的遺傳算法;針對(duì)要解決問題的性質(zhì)可以選擇合適的網(wǎng)絡(luò)或算法。這些網(wǎng)絡(luò)或算法已經(jīng)被諸多實(shí)踐證明其優(yōu)越性。
目前神經(jīng)網(wǎng)絡(luò)和遺傳算法已經(jīng)在語音識(shí)別、模式識(shí)別、圖像處理和工業(yè)控制等領(lǐng)域取得了顯著成效。雖然實(shí)踐已證明了其無比的優(yōu)越性,但在理論分析上,兩者都略有不足。BP算法和Hopfield網(wǎng)絡(luò)雖然給出了算法的執(zhí)行原理及過程,但其優(yōu)越性的理論仍不嚴(yán)格,即并未對(duì)不同情況定量說明,為什么這種算法能夠快速收斂或快速求解。對(duì)遺傳算法來說,早在Holland提出遺傳算法之初就提出了著名的模式定理和穩(wěn)并行性分析來定量說明遺傳算法的優(yōu)越性,并長期以來被人們所接受。但是模式定理只對(duì)簡單遺傳算法有效,因?yàn)槠渥C明過程依賴于二進(jìn)制編碼,對(duì)非二進(jìn)制編碼收斂性的分析至今也未得出。除此之外,近年來,有很多著名學(xué)者也對(duì)模式定理的證明過程提出了質(zhì)疑。所以,找到神經(jīng)網(wǎng)絡(luò)和遺傳算法優(yōu)越性的理論基礎(chǔ)仍是一項(xiàng)艱巨的科研任務(wù)和課題。
(二)在算法的執(zhí)行過程中參數(shù)的確定都需要依賴于人的經(jīng)驗(yàn)。
建立一個(gè)神經(jīng)網(wǎng)絡(luò)需要首先確定它的基本結(jié)構(gòu)、學(xué)習(xí)規(guī)則以及工作方式(前饋式還是演化式),網(wǎng)絡(luò)結(jié)構(gòu)包括網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)即網(wǎng)絡(luò)中神經(jīng)元的連接方式和節(jié)點(diǎn)轉(zhuǎn)換函數(shù)兩部分。結(jié)構(gòu)的優(yōu)劣對(duì)網(wǎng)絡(luò)的處理能力有很大影響,一個(gè)好的結(jié)構(gòu)應(yīng)能圓滿解決問題,同時(shí)不出現(xiàn)冗余節(jié)點(diǎn)和冗余連接,但不幸的是,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)基本上還依賴于人的經(jīng)驗(yàn),尚沒有一個(gè)系統(tǒng)的方法來設(shè)計(jì)一個(gè)適當(dāng)?shù)木W(wǎng)絡(luò)結(jié)構(gòu)。目前,人們?cè)谠O(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)時(shí),只能或者預(yù)先指定。或者采用遞增或遞減的探測方法。
對(duì)遺傳算法來說,需要針對(duì)待解決的問題而設(shè)計(jì)出編碼方案、三個(gè)算子(選擇、雜交、變異)、進(jìn)化機(jī)制以及各個(gè)概率參數(shù),如雜交概率、變異概率等。參數(shù)的確定也沒有理論支持,只是人為地認(rèn)為雜交概率的值確定在(0.65,0,9)范圍內(nèi),變異概率的值確定在(0.001.0.01)比較好,目前,在遺傳算法的實(shí)際執(zhí)行過程中一般需要預(yù)先指定這兩個(gè)參數(shù),近來有學(xué)者提出在遺傳算法的執(zhí)行過程中動(dòng)態(tài)地改變這些參數(shù)的方法也取得了較好的效果。
隨著4G時(shí)代的到來,電信行業(yè)的得到了空前的發(fā)展,用戶數(shù)量快速增長,同時(shí),電信各運(yùn)營企業(yè)之間的競爭也日益激烈。面對(duì)激烈的電信市場競爭環(huán)境,以及日趨飽和的電信市場,獲取新客戶的成本比保持在網(wǎng)客戶要昂貴得多。加之電信技術(shù)、法律法規(guī)、攜號(hào)轉(zhuǎn)網(wǎng)以及競爭對(duì)手等動(dòng)態(tài)市場的變化,使客戶流失到對(duì)手運(yùn)營企業(yè)也更加容易。數(shù)據(jù)挖掘,作為一種新興技術(shù)手段,可以高效、低成本的實(shí)現(xiàn)客戶的流失預(yù)測,現(xiàn)已在電信、金融等行業(yè)得到了廣泛應(yīng)用。
【關(guān)鍵詞】
數(shù)據(jù)挖掘;客戶流失;算法
1、引言
流失客戶,即是不想或不再使用其服務(wù)的企業(yè)原有客戶。根據(jù)流失程度可分為兩類:離網(wǎng)流失和業(yè)務(wù)流失,或稱為顯性流失和隱性流失。在我國,電信行業(yè)競爭日益激烈,市場容量逐漸飽和,在終端產(chǎn)品以及通信資費(fèi)相對(duì)平穩(wěn)的情況下,用戶成為電信運(yùn)營商激烈競爭的焦點(diǎn)。如何有效地防止用戶流失、降低流失率成為各個(gè)運(yùn)營商急需解決的難題。客戶流失給運(yùn)營商帶來了巨大損失,而成功挽留一個(gè)即將流失的客戶比重新發(fā)展一個(gè)客戶節(jié)約大量成本。因此,利用數(shù)據(jù)挖掘技術(shù),預(yù)測客戶流失、減少客戶流失的發(fā)生成為當(dāng)下電信行業(yè)研究的重點(diǎn)。
2、客戶流失預(yù)測常用算法及比較
客戶流失預(yù)測常用算法。目前,常用的挖掘算法有很多,但客戶流失分析較為常用的有三種算法,分別是決策樹算法、支持向量機(jī)算法、神經(jīng)網(wǎng)絡(luò)算法。
(1)決策樹算法當(dāng)前最有影響的決策樹算法是Quinlan于1986年提出的ID3和1993年提出的C4.5。ID3只能處理離散型屬性,它選擇信息增益最大的屬性對(duì)訓(xùn)練樣本進(jìn)行劃分,目的是進(jìn)行分枝時(shí),使系統(tǒng)的熵最小,從而提高算法的精確度。C4.5是ID3算法的改進(jìn)算法,不僅可處理離散型屬性,還能處理連續(xù)性屬性。C4.5采用信息增益比作為選擇分枝屬性的標(biāo)準(zhǔn),彌補(bǔ)了ID3算法的不足。決策樹的優(yōu)點(diǎn)在于,它可以生成可以理解的規(guī)則,計(jì)算量相對(duì)較小,可以處理連續(xù)和種類字段,并且可以清晰地顯示哪些字段比較重要。但決策樹對(duì)連續(xù)性的字段比較難預(yù)測,這是決策樹的一個(gè)不足。
(2)支持向量機(jī)算法支持向量機(jī)(SupportVectorMachine,SVM)由Vapnik領(lǐng)導(dǎo)的AT&TBell實(shí)驗(yàn)室研究小組于1963年提出,當(dāng)時(shí)的研究尚不十分完善。直到90年代,統(tǒng)計(jì)學(xué)習(xí)理論的實(shí)現(xiàn)和由于神經(jīng)網(wǎng)絡(luò)等較新的機(jī)器學(xué)習(xí)方法的研究在如何確定網(wǎng)絡(luò)結(jié)構(gòu)、過學(xué)習(xí)與欠學(xué)習(xí)、局部極小點(diǎn)等問題時(shí)遇到一些重要困難,這個(gè)階段SVM的理論技術(shù)得到迅速發(fā)展與完善,它在解決小樣本、非線性以及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等問題中,是一項(xiàng)有潛力的分類與回歸技術(shù)。SVM也存在自身不足,SVM算法對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施,同時(shí),對(duì)于多分類問題存在困難。
(3)神經(jīng)網(wǎng)絡(luò)算法人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANN),也簡稱神經(jīng)網(wǎng)絡(luò),它是由大量簡單處理單元以某種方式互相連接而成,通過調(diào)整內(nèi)部這些大量處理單元之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元處理單元可表示為特征、字母、概念或某些有意義的抽象模式等不同的對(duì)象。神經(jīng)網(wǎng)絡(luò)中處理單元類型可以分為三類:輸入層單元、輸出層單元和隱藏層單元。輸入層單元負(fù)責(zé)接受外部世界的數(shù)據(jù)或信號(hào);輸出層單元實(shí)現(xiàn)網(wǎng)絡(luò)處理結(jié)果的輸出;隱藏層單元處于輸入層和輸出層單元之間,不能由系統(tǒng)外部觀察的單元。神經(jīng)元間的連接權(quán)值反映單元間的連接強(qiáng)度,信息的表示和處理體現(xiàn)在網(wǎng)絡(luò)處理單元的連接關(guān)系中,可對(duì)連續(xù)的或非連續(xù)的輸入做出狀態(tài)相應(yīng),能實(shí)現(xiàn)復(fù)雜的邏輯操作和非線性關(guān)系信息的動(dòng)態(tài)處理,因而神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的邏輯運(yùn)算和數(shù)值運(yùn)算能力。神經(jīng)元網(wǎng)絡(luò)的優(yōu)點(diǎn)在于有無指導(dǎo)的情況下都能夠進(jìn)行學(xué)習(xí);缺點(diǎn)是神經(jīng)網(wǎng)絡(luò)很難解釋而且會(huì)學(xué)習(xí)過度,另外神經(jīng)網(wǎng)絡(luò)建模通常較費(fèi)時(shí),需要的準(zhǔn)備工作量很大。神經(jīng)網(wǎng)絡(luò)的著名算法是基于誤差學(xué)習(xí)的后向傳播算法,即BP算法。
3、電信客戶流失預(yù)測研究展望
以下幾方面在未來的研究中值得考慮:(1)對(duì)現(xiàn)有指標(biāo)體系還需要進(jìn)一步研究與完善,尤其是隨著4G業(yè)務(wù)的發(fā)展,指標(biāo)應(yīng)該進(jìn)一步調(diào)整。(2)現(xiàn)在國內(nèi)的流失預(yù)測分析,大都以“月”為單位,如果能以“周”或者“日”為單位,可以更加及時(shí)的發(fā)現(xiàn)流失客戶。(3)用于流失預(yù)測的算法各有利弊,找出一個(gè)在各方面性能都很好的分類算法仍然需要進(jìn)一步研究。
【參考文獻(xiàn)】
[1]肖水清.基于CRM探討電信業(yè)的客戶流失問題[J].現(xiàn)代計(jì)算機(jī),2006(1)
[2]陳晉蘇,鄭惠莉.電信行業(yè)流失客戶挽留價(jià)值綜合評(píng)價(jià)研究[D].南京郵電大學(xué),2005
[3]仲繼.電信企業(yè)客戶流失預(yù)測模型研究[D].西安科技大學(xué),2014
神經(jīng)科研究 神經(jīng)內(nèi)科論文 神經(jīng)網(wǎng)絡(luò)論文 神經(jīng)外科論文 神經(jīng)網(wǎng)絡(luò)技術(shù) 紀(jì)律教育問題 新時(shí)代教育價(jià)值觀