前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經網絡實驗總結范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞 :GA-RBF神經網絡 預測模型 仿真
泵的性能預測研究就是根據泵的葉輪、蝸殼、導葉等過流部件的幾何參數,分析內部流動特征,以此預測泵的性能,是在泵產品設計中必不可少的重要環節,具有縮短研發周期、降低開發成本和提高產品設計質量等優點。針對離心泵的性能研究不但具有重要的學術價值和社會效益,而且對研究其他泵的性能提供了可資借鑒的依據。
一、GA-RBF神經網絡簡介
GA-RBF神經網絡是將遺傳算法引入到前饋式神經網絡(RBF)發展起來的一種神經網絡。作為三層前向網路的RBF神經網絡,由輸入層、徑向基層(RBF層)和輸出層構成,它利用RBF作為隱含單元的“基”構成隱含空間,輸入矢量不需要通過權連接直接進入隱含層,只要能夠確定RBF的中心點,就能夠確定其相應的映射關系,具有突出的最佳逼近性能和全局最有特性且構造簡單、訓練速度快,在非線性函數逼近及模式識別領域取得了很好的效果。
二、構建基于GA-RBF神經網絡性能預測模型
在利用GA-RBF神經網絡算法來實現對離心泵性能預測時可根據如圖1所示的流程圖進行。
因為在GA-RBF神經網絡中,輸入模式對于離心泵性能預測預測結果有比較大影響,因此我們選取對離心泵能量性能影響較大的離心泵幾何參數和設計流量()作為GA-RBF神經網絡的輸入變量。其中,主要的離心泵幾何參數包括:葉輪出口直徑()、葉片出口寬度()、葉片出口安放角()、渦殼的基圓直徑()、渦殼進口寬度()、蝸殼第八斷面面積()、葉片包角()以及葉片數()。根據輸入模式可以確定輸入層神經元數目為9。考慮到RBF神經網絡的隱含層神經元是徑向基函數,該特性使RBF神經網絡的擬合特性為局部性,于是本文將泵的揚程和效率預測設計為2個相類似結構的GA-RBF神經網絡預測模型,即為離心泵揚程GA-RBF神經網絡預測模型和離心泵效率GA-RBF神經網絡預測模型,如圖2所示。
三、仿真實驗
為了考察建立的離心泵揚程GA-RBF神經網絡預測模型和離心泵效率GA-RBF神經網絡預測模型的有效性,我們選取沈陽水泵研究所編撰的《全國優秀水力模型匯編》和江蘇大學關醒凡教授編撰的《現代泵技術手冊》選取57組單級單吸離心泵的設計參數和試驗參數作為訓練樣本數據和目標數據。
根據訓練樣本數據和目標數據輸入離心泵揚程GA-RBF神經網絡預測模型和離心泵效率GA-RBF神經網絡預測模型進行訓練,其訓練學習效果分別如圖3、圖4所示。
為了考察建立的離心泵揚程GA-RBF神經網絡預測模型和離心泵效率GA-RBF神經網絡預測模型的效果,本文也從沈陽水泵研究所編撰的《全國優秀水力模型匯編》和江蘇大學關醒凡教授編撰的《現代泵技術手冊》選取6組單級單吸離心泵的設計參數和試驗參數數據作為檢驗樣本,其具體數據如表1所示。
采用表1的數據和利用已經建立的離心泵揚程GA-RBF神經網絡預測模型和離心泵效率GA-RBF神經網絡預測模型分別進行預測離心泵的揚程、效率等性能指標,與談明高等人所做實驗和撰寫的文獻參數進行對比,其結果如表2所示。
分析表2的離心泵性能的GA-RBF神經網絡預測模型檢驗樣本預測結果發現:GA-RBF神經網絡預測的揚程最大相對誤差的絕對值為12.06% 、最小相對誤差的絕對值為2.34%、均方根相對誤差為6.56%;效率誤差最大相對誤差的絕對值為6.99% 、最小相對誤差的絕對值為0.67% 、均方根誤差為3.99%。RBF神經網絡預測的揚程最大相對誤差的絕對值為13.86% 、最小相對誤差的絕對值為2.29%、均方根相對誤差為7.56%;效率誤差最大相對誤差的絕對值為6.00% 、最小相對誤差的絕對值為1.78% 、均方根誤差為3.70%。
由圖3和圖4我們可以看到,RBF神經網絡及其改進的GA-RBF神經網絡在離心泵揚程預測精度方面都低于效率預測精度;雖然GA-RBF神經網絡在預測離心泵效率的精度雖然比RBF神經網絡略低,但在預測離心泵揚程的精度明顯要好得多。
四、總結
我們采用GA-RBF神經網絡算法建立離心泵性能GA-RBF神經網絡預測模型,在沈陽水泵研究所編撰的《全國優秀水力模型匯編》和江蘇大學關醒凡教授編撰的《現代泵技術手冊》選取57組單級單吸離心泵的設計參數和試驗參數進行建模和驗證,并通過闡述性能預測的實現過程,結果表明離心泵性能GA-RBF神經網絡預測模型與原有的離心泵性能RBF神經網絡預測模型通一樣有效,并且設置參數更簡單、更方便。
參考文獻:
[1]關醒凡.現代泵技術手冊[M].宇航出版社,1995.
[2]張頂學,劉新芝,關治洪.RBF神經網絡算法及其應用[J].石油化工高等學校學報,2007,(03).
摘要:本文利用神經網絡的強大的自學習能力和自適應性來提高安全審計系統的性能。在眾多神經網絡中,PNN概率神經網絡尤為適合運用到入侵行為模式的誤用檢測方面。因此本文將PNN概率神經網絡和入侵檢測技術結合起來,研究保護企業數據庫的安全技術,并構造出一套企業數據庫入侵誤用檢測模型。該模型主要用于檢測已知的入侵行為模式,并給系統及時處理入侵行為提供依據。
關鍵詞:數據庫安全 PNN概率神經網絡 入侵檢測
Abstract:The thesis uses the neural network's powerful self-learning and self-adaptive to improve the performance of the security audit system. In many neural networks, the Probabilistic Neural Network is particularly suitable for the misuse detection of intrusion mode. The thesis combines the method of the Probabilistic Neural Network with the technique of intrusion detection, and constructs a model of intrusion detection system applied to the corporation database. The mode can detect the known intrusion modes, in the same time, provides the basis for system to deal with the intrusions in time.
Key words: Database security Probabilistic Neural Network Intrusion detection
數據庫作為企業和部門信息系統的重要組成部分,存儲著大量的數據,其中某些數據可能是機密的重要數據,這些數據一旦遭到破壞,會給企業和部門造成不可挽回的損失,所以,這些數據的安全性在信息系統的安全中起著至關重要的作用。當前,數據庫安全技術的研究已經成為信息安全的重要課題,入侵檢測技術是新一代的動態安全保障技術,它用來檢測內部用戶的不合法操作和外部非法入侵者的惡意攻擊。檢測系統在檢測到攻擊的同時,還會采取適當的處理與保護措施,對有效保護數據庫安全提供了一種很好的解決思路,被稱為防火墻之后的第二道安全閘門。其本身也成為當今信息安全領域的一個研究熱點。
入侵檢測ID(Intrusion Detection)是近十年發展起來的一種預防、動態監測和抵御系統入侵行為的安全機制,彌補了傳統安全技術的不足。入侵檢測系統IDS(Intrusion Detection System)可以實時監控網絡和計算機主機,發現可疑事件,入侵行為一旦被檢測出來,系統就會采取報警、記錄和切斷連接等措施,在對系統安全產生的危害之前及時消除風險。
神經網絡技術具有自適應和自學習的能力,只要給系統提供所需的網絡數據包和審計數據,它就可以通過自學習構造出相對正常的用戶或系統活動模型,從而檢測出異常活動的攻擊模式,因此在檢測方法上,將神經網絡引入到入侵檢測的研究中,使得入侵檢測的智能性研究逐漸成為熱點。
PNN概率神經網絡在數據庫入侵的誤用檢測中,能夠對入侵行為模式進行快速準確的檢測及判斷,為系統及時采取相應的措施提供依據。誤用檢測是指運用已知的攻擊方法,根據定義好的異常模式,通過判斷這些異常模式是否出現來檢測。本文圍繞PNN神經網絡的運用,對整個數據處理過程進行了介紹,從數據采集,到網絡訓練,以及測試網絡性能,提出利用PNN概率神經網絡進行入侵行為模式判斷的優勢,進而總結出一種新型的企業數據庫入侵的誤用檢測模型。
一、PNN神經網絡算法模型
概率神經網絡PNN(Probabilistic Neural Network)是根據徑向基函數網絡發展而來的一種前饋型神經網絡,是徑向基網絡的一種變化形式,其理論依據是貝葉斯最小風險準則。PNN具有結構簡單、訓練快捷等優點,在分類問題中,它的優勢在于可以利用線性學習算法來完成非線性算法所做的工作,同時又可以保持非線性算法高精度的特點。其結構如圖1所示。
輸入層測試向量X(X1…Xn)通過傳遞機制傳遞到模式層,經過模式層的相應處理產生新的信息量依次經過該網絡的所有層,其神經元的數目由訓練數據的維數決定。模式層中各個類別組的輸出為:
其中Wi表示連接輸入層與模式層的權值,δ表示平滑因子。
求和層具有線性求和的功能,估計分類模式的各個類別的累計概率。概率密度函數為:
其中m為屬于類別A的訓練樣本數,XAi為樣本中屬于類別A的第i個訓練樣本,σ為平滑因子。訓練過程可以表示如下:首先通過輸入層輸入訓練樣本向量,然后在模式層中分別計算該向量與代表不同類別組的神經元之間的距離,再在求和層中求出每個類別模式的概率,最后在輸出層計算各個類別的概率估計,由閾值辨別器從中選擇并傳遞出后驗概率密度最大的神經元的輸出即1,而其他的輸出0。
二、數據采集
入侵檢測的數據采集可以收集系統、網絡、數據及用戶活動的狀態和行為,一般可以利用的信息主要來自以下三個方面。
1、系統和網絡日志文件
2、非正常的程序執行
3、非正常的目錄和文件改變
入侵檢測的準確性很大程度上依賴于收集信息的可靠性和正確性,因此很有必要只利用精確的軟件來報告這些信息。本文利用SQL Server的事件探查器(SQL Server Profiler)跟蹤各客戶端的數據庫調用。首先建立跟蹤文件,使用SQL Profile標準模板,將跟蹤的結果存儲到表。表1為SQL事件探查器監控的事件分類。
本文主要跟蹤企業數據庫,相應數據庫事件類主要為
1、TSQL分類中的SQL:BatchCompleted、SQL:StmtCompleted和SQL:StmtStarting
2、安全審核分類中的Audit Login和Audit LogOut
3、存儲過程中的RPC:Output Paramete、RPC:Completed、RPC:Starting、SP:CacheHit、SP:CacheInsert、SP:CacheMiss、SP:Cac-
heRemove、SP:Completed、SP:ExecContextHit和SP:Recompile
4、會話分類中的Existing Connection事件類。
相應的事件類數據為EventClass(捕獲的事件類類型)、LoginName(客戶數據庫登錄名)、CPU(CPU占用時間)、Reads(服務器代表事件執行的邏輯磁盤讀取數)、Writes(服務器代表事件執行的物理磁盤寫入數)、ClientProcessID(客戶端進程號)、SPID(SQL Server指派的與客戶端相關的服務器進程ID)和objectID(系統分配對象)。
SQL探查器將采集到的數據存儲在表中,為后續的神經網絡訓練與測試提供直接的數據源。
三、實驗
(一)實驗數據
本文選取實驗數據為從SQL事件探查器中采集到的具有入侵行為模式分類的入侵數據,有5類入侵模式,所以用1、2、3、4、5分別代表各類入侵模式。本文所采用的入侵數據的特征向量為上節所采集的各個數據列,在上述監控的八個數據列里面去掉LoginName數據列,選取EventClass、LoginName、CPU、Reads、Write、ClientProcessID、SPID和objectID七個數據列作為神經網絡的七個特征向量。一共有4500個入侵數據樣本,隨機選取其中的4000個入侵數據樣本作為PNN神經網絡的訓練集,其余的500個數據樣本作為測試集以測試PNN神經網絡的性能。此入侵數據集為4500×8維的矩陣,1到7列為七個特征向量,第8列為分類的輸出,也就是入侵類別。實驗采用MATLAB2012B軟件及其神經網絡工具箱。
(二)入侵檢測的實現
如圖1,在對入侵數據進行測試時,輸入層接收具有分類號的數據樣本(訓練樣本向量)的值,即1、2、3、4、5,將入侵數據樣本的屬性傳遞給網絡。模式層計算輸入特征向量(樣本屬性)與訓練集中各個模式的匹配關系,求和層將屬于某類的概率累計,按式(1)計算,從而得到各類的估計概率密度函數。模式層由5類入侵類型的數據樣本構成,將分類好的樣本向量填充到模式層,即可完成該PNN的構建。
測試時,輸入層把未分類的需要測試的入侵數據樣本向量Xn送至所有的模式層單元。每個模式層單元計算測試入侵數據樣本向量Xn和該單元訓練向量之間的距離,求和層各單元把模式層單元的輸出按類別號相加求和,獲得各分類對應的分布密度。輸出層從求和層中求得輸入測試數據相對于各類別號的分布密度最大值,并將其對應的類別號1、2、3、4、5作為PNN的輸出。
(三)PNN神經網絡性能分析
選取1530到1580這50個樣本來分析,在這50個樣本中有2個樣本判斷錯誤,如圖2所示。實際上在此次PNN網絡訓練過程中,4000個樣本只有5個樣本判斷錯誤,如圖3所示。并且,用預測樣本進行驗證的時候,選取150到200個這50個樣本,其中有1個樣本的入侵模式類別判斷錯誤,如圖4所示。而實際在此次PNN網絡檢測過程中,500個樣本只有2個樣本的入侵模式類別判斷錯誤,精度高達99.6%。將網絡重復運行10次,其平均精度為99.64%。
(四)PNN神經網絡優勢
1、PNN過程簡單,收斂速度快。PNN神經網絡網絡結構簡單,需要調節的參數很少,其處理數據的時間與其他神經網絡相比有較大優勢。
2、PNN網絡基于貝葉斯最小風險分類準則,能夠最大限度地考慮樣本數據的先驗信息,即使分類問題異常復雜,只要用于學習的樣本向量足夠多,就能夠得到Bayes判別準則下的最優解。
3、樣本的追加能力強,且可以容忍個別錯誤樣本,即使訓練樣本改變也不需要花費較多時間重新訓練網絡。由于PNN神經網絡考慮的是訓練樣本屬于各個類別的概率,在估計出各個類別的概率密度函數(PDF, Probability Density Function)之后,即使根據實際問題有新的入侵行為模式的加入,只需要相應改變模式層神經元數目,而無需重新訓練網絡。
4、PNN在異常與否分類問題應用中,通過線性學習算法來完成非線性學習算法所做的工作,同時能保持非線性算法的高精度等特性。
5、PNN網絡不需要訓練,因而能夠滿足數據庫入侵檢測實時處理的要求。
四、企業數據庫入侵檢測的系統模型
該模型主要由以下三個模塊組成:
1、數據采集模塊。該模塊主要利用SQL Server事件探查器采集相關數據。
2、特征數據庫模塊。該模塊為訓練好的PNN神經網絡,相當于事件數據庫,其征數據庫與被監控數據庫分離存儲。
3、報警單元模塊。該模塊對檢測到的異常事件進行處理,將數據損失降低到最小,提供報警的可視化界面,將報警信息反饋給系統管理員并記錄到相關文件,以便及時處理或進行事后分析。
該模型主要流程為:利用事件探查器實時跟蹤各客戶端調用,采集相關數據并進行處理,將數據直接導入特征數據庫,利用PNN神經網絡對誤用檢測的優勢,實現快速檢測及判斷各種數據是否為已知的異常調用,如有匹配則為某種入侵行為模式,將數據送入報警單元,不匹配的數據則為正常行為,不作處理。
總結:
隨著互聯網迅猛發展,企業數據庫的安全顯得非常重要。入侵檢測作為一種重要的安全保障手段,涉及到廣泛的技術領域。本文提出一種基于PNN概率神經網絡的算法,實驗結果表明將PNN概率神經網絡引入到入侵檢測中的具有快速、精準的優勢,由此結合PNN概率神經網絡與入侵檢測技術研究了一類企業數據庫的安全保護技術,實現了企業數據庫入侵檢測的系統模型,并詳細介紹了模型各個模塊的具體實現方法及流程。可以有效的防范到來自內部的越權操作、違規操作和惡意破壞等,并可以抵制外部的遠程非法入侵,是運用神經網絡技術解決企業數據庫安全保障的有效嘗試。基于企業數據庫的數據采集方法和神經網絡檢測技術為今后的工作打開了思路。
參考文獻:
[1]王小川,史峰等。《MATLAB神經網絡30個案例分析》.第一版.北京:北京航空航天大學出版社,2010:176-182.
[2]張德豐等.《MATLAB神經網絡應用設計》.第二版.北京:機械工業出版社,出版年2011:320-323.
[3]金波.入侵檢測智能方法的研究.上海:華東理工大學,2000:29-131.
[4]李鋼.基于神經網絡的入侵檢測研究與實現.南京:南京師范大學.2006.
[5]Sushil Jajodia.Database Security and Privacy.ACM Computing Surveys.1996.
關鍵詞:樹葉識別;支持向量機;卷積神經網絡
中圖分類號 TP18 文獻標識碼:A 文章編號:1009-3044(2016)10-0194-03
Abstract: In this paper, the convolution neural network recognition in the leaves, and the process by convolution of image visualization. Experiments show that the neural network application identification convolution leaves a 92% recognition rate. In addition , this neural network and support vector machine comparative study can be drawn from the study , convolutional neural network in either speed or accuracy better than support vector machines, visible, convolution neural network in the leaves aspect has good application prospects.
Key words recognition leaves; SVM; convolutional neural network
1 概述
樹葉識別與分類在對于區分樹葉的種類,探索樹葉的起源,對于人類自身發展、科普具有特別重要的意義。目前的樹葉識別與分類主要由人完成,但,樹葉種類成千上萬種,面對如此龐大的樹葉世界,任何一個植物學家都不可能知道所有,樹葉的種類,這給進一步研究樹葉帶來了困難。為了解決這一問題,一些模式識別方法諸如支持向量機(Support Vector Machine,SVM)[1],K最近鄰(k-NearestNeighbor, KNN)[2]等被引入,然而,隨著大數據時代的到來,這些傳統分類算法暴露出越來越多的不足,如訓練時間過長、特征不易提取等不足。
上世紀60年代開始,學者們相繼提出了各種人工神經網絡[3]模型,其中卷積神經網絡由于其對幾何、形變、光照具有一定程度的不變形,因此被廣泛應用于圖像領域。其主要特點有:1)輸入圖像不需要預處理;2)特征提取和識別可以同時進行;3)權值共享,大大減少了需要訓練的參數數目,是訓練變得更快,適應性更強。
卷積神經網絡在國內研究才剛剛起步。LeNet-5[4]就是一種卷積神經網絡,最初用于手寫數字識別,本文研究將卷積神經網絡LeNet-5模型改進并應用于樹葉識別中。本文首先介紹一下卷積神經網絡和LeNet-5的結構,進而將其應用于樹葉識別,設計了實驗方案,用卷積神經網絡與傳統的模式識別算法支持向量機(SVM)進行比較,得出了相關結論,并對進一步研究工作進行了展望。
2人工神經網絡
人工神經網絡方面的研究很早就已開展,現在的人工神經網絡已經發展成了多領域、多學科交叉的獨立的研究領域。神經網絡中最基本的單元是神經元模型。類比生物神經元,當它“興奮”時,就會向相連的神經元發送化學物質,從而改變這些神經元的狀態。人工神經元模型如圖1所示:
上述就是一個簡單的神經元模型。在這個模型中,神經元接收來自n個其他神經元傳遞過來的輸入信號,這些信號通過帶權重的w進行傳遞,神經元接收到的總輸入值將與神經元的閾值進行比較,然后通過“激活函數”來產生輸出。
一般采用的激活函數是Sigmoid函數,如式1所示:
[σz=11+e-z] (1)
該函數圖像圖2所示:
2.1多層神經網絡
將上述的神經元按一定的層次結構連接起來,就得到了如圖3所示的多層神經網絡:
多層神經網絡具有輸入層,隱藏層和輸出層。由于每一層之間都是全連接,因此每一層的權重對整個網絡的影響都是特別重要的。在這個網絡中,采用的訓練算法是隨機梯度下降算法[5],由于每一層之間都是全連接,當訓練樣本特別大的時候,訓練需要的時間就會大大增加,由此提出了另一種神經網絡―卷積神經網絡。
2.2卷積神經網絡
卷積神經網絡(CNN)由于在圖像分類任務上取得了非常好的表現而備受人們關注。發展到今天,CNN在深度學習領域已經成為了一種非常重要的人工神經網絡。卷積神經網絡的核心在于通過建立很多的特征提取層一層一層地從圖片像素中找出關系并抽象出來,從而達到分類的目的,CNN方面比較成熟的是LeNet-5模型,如圖4所示:
在該LeNet-5模型中,一共有6層。如上圖所示,網絡輸入是一個28x28的圖像,輸出的是其識別的結果。卷積神經網絡通過多個“卷積層”和“采樣層”對輸入信號進行處理,然后在連接層中實現與輸出目標之間的映射,通過每一層卷積濾波器提取輸入的特征。例如,LeNet-5中第一個卷積層由4個特征映射構成,每個特征映射是一個24x24的神經元陣列。采樣層是基于對卷積后的“平面”進行采樣,如圖所示,在第一個采樣層中又4的12x12的特征映射,其中每個神經元與上一層中對應的特征映射的2x2鄰域相連接,并計算輸出。可見,這種局部相關性的特征提取,由于都是連接著相同的連接權,從而大幅度減少了需要訓練的參數數目[6]。
3實驗研究
為了將LeNet-5卷積網絡用于樹葉識別并檢驗其性能,本文收集了8類樹葉的圖片,每一類有40張照片,如圖5所示的一張樹葉樣本:
本文在此基礎上改進了模型,使用了如圖6卷積神經網絡模型:
在此模型中,第一個卷積層是由6個特征映射構成,每個特征映射是一個28*28的神經元陣列,其中每個神經元負責從5*5的區域通過卷積濾波器提取局部特征,在這里我們進行了可視化分析,如圖7所示:
從圖中可以明顯地看出,卷積網絡可以很好地提取樹葉的特征。為了驗證卷積神經網絡與傳統分類算法之間的性能,本文基于Python語言,CUDA并行計算平臺,訓練同樣大小8類,一共320張的一批訓練樣本,采用交叉驗證的方法,得到了如表1所示的結論。
可見,無論是識別率上,還是訓練時間上,卷積網絡較傳統的支持向量機算法體現出更好地分類性能。
4 總結
本文從人工神經網絡出發,重點介紹了卷積神經網絡模型LeNet-5在樹葉識別上的各種研究并提取了特征且進行了可視化,并與傳統分類算法SVM進行比較。研究表明,該模型應用在樹葉識別上較傳統分類算法取得了較好的結果,對收集的樹葉達到了92%的準確率,并大大減少了訓練所需要的時間。由于卷積神經網絡有如此的優點,因此在人臉識別、語音識別、醫療識別、犯罪識別方面具有很廣泛的應用前景。
本文的研究可以歸納為探討了卷積神經網絡在樹葉識別上的效果,并對比了傳統經典圖像分類算法,取得了較好的分類精度。
然而,本文進行實驗的樣本過少,當數據集過多的時候,這個卷積神經網絡算法的可行性有待我們進一步的研究;另外,最近這幾年,又有很多不同的卷積神經網絡模型出現,我們會繼續試驗其他的神經網絡模型,力求找到更好的分類算法來解決樹葉識別的問題。
參考文獻:
[1]Bell A, Sejnowski T. An Information-Maximization Approach to Blind Separation and Blind Deconvolution[J]. Neural Computation, 1995, 7(6):1129-59.
[2]Altman N S. An Introduction to Kernel and Nearest-Neighbor Nonparametric Regression[J]. American Statistician, 1992, 46(3):175-185.
[3]Ripley B D, Hjort N L. Pattern Recognition and Neural Networks[M]. Pattern recognition and neural networks. Cambridge University Press,, 1996:233-234.
[4]Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.
【關鍵詞】模糊神經網絡;模糊控制;模糊辨識;規則抽取;學習算法
1 問題的提出
模糊邏輯和神經網絡都適于處理那些被控對象模型難以建立或存在大的不確定性和強非線性的系統. 由于神經網絡在分布式處理,學習能力,魯棒性,泛化能力方面具有明顯的優勢,而模糊系統的優勢在于良好的可讀性和可分析性,因此,將神經網絡的思想融合到模糊辨識和模糊控制模型中就可以實現兩者的優勢互補.模糊神經網絡控制針對雙方的特點相互借鑒和利用,比單獨的神經網絡控制或單獨的模糊控制具有更好的控制性能. 隨著智能控制理論的發展,模糊神經網絡控,難以實現系統的實時控制制受到控制界的廣泛關注,相繼提出了許多控制和辨識的方法.
本文總結了近期我國學者提出的幾種新的基于模糊神經網絡的系統辨識與控制方法,并通過仿真進行了各自特點的比較,希望可以通過這些比較,對這些研究加以改進和應用.
2 模糊神經網絡
2.1 仿射非線性系統
為了實現非線性系統的實時控制,基于徑向基函數網絡與TSK 型模糊推理系統的函數等價的特點,有學者提出了一種動態模糊神經網絡的在線自組織線性算法,從而實現了系統的結構和參數的同時在線自適應. 學習速度快是這種模糊神經網絡的突出特點.在此基礎上,針對未知仿射非線性SISO 系統提出了一種在線自適應模糊神經網絡辨識與控制方法. 該方法首先采用G2FNN 學習算法實時建模系統的逆動態,實現模糊神經網絡的結構和參數的同時在線學習. 然后,設計一個魯棒補償器與辨識好的模糊神經網絡組成復合控制器,并基于Lyapunov 穩定性理論設計自適應控制律進一步在線調整網絡的權值,實現系統的跟蹤控制.
控制目標是設計一個由G2FNN 控制器和魯棒控制器構成的模糊神經網絡自適應魯棒控制器, 使得系統的輸出y 跟蹤給定的參考輸入信號ym ,對于一個給定的干擾衰減水平常數ρ>0 ,獲得良好的H ∞跟蹤性能指標.
廣義模糊神經網絡G2FNN 由四層網絡結構組成,分別實現模糊邏輯的模糊化、模糊推理和解模糊化過程. 圖1 所示為單個輸出結點G2FNN 的結構.
圖1 G2FNN 的結構
G2FNN 中有兩類學習算法,即結構學習和參數學習. 結構學習是通過對每個新的訓練數據計算出G2FNN 的輸出與期望輸出之間的偏差來決定是否產生新的模糊規則或刪除多余的規則; 參數學習有兩個方面,一是當系統產生第N r+1條新的模糊規則時確定新規則前提參數ci ( N r+1) ,σi(N r+1),另一個是當不需要進行結構學習時對第三層與第四層網絡之間的權值向量W 的調節.
第一層直接將輸入語言變量xi(i =1,2,…Ni) 傳遞到下一層.
第二層計算輸入分量隸屬于各語言變量值模糊集合的隸屬度,隸屬度函數為高斯函數:
式中: cij ,σij (i =1 ,2 , …, N r) 分別是第i 個輸入語言變量xi的第j 條隸屬度函數的中心和寬度;N r 為系統產生的規則數.
第三層是規則層, 這一層的每個結點代表一條模糊規則,它的作用是用來匹配模糊規則的前提,每個結點的輸出可以表示為:
第四層是結點定義語言變量的輸出, 它的作用是用來匹配模糊規則的結論,實現TSK型模糊推理系統的解模糊化過程. 其輸出為:
這里, Wj 為第三層與第四層之間的權值.
使用倒立擺系統方程進行仿真研究, 倒立擺的動態方程為:
系統仿真結果如圖(圖2):
圖2 自適應模糊神經網絡控制系統跟蹤軌跡
由圖可知,所設計的控制器實現了模糊神經網絡的結構和參數的在線自適應,輸出跟蹤參考輸入信號,系統的誤差收斂速度快,魯棒性好.
由仿真可見,該方法不僅實現了模糊控制規則的自動產生和刪除,還保證了閉環系統的全局穩定,并使外部干擾和模糊神經網絡逼近誤差對系統跟蹤誤差的影響衰減到一個指定的水平.本方法不需要知道系統的控制增益,設計了一個魯棒補償器來抑制模糊神經網絡逼近誤差和外部干擾的影響. 系統魯棒性好,抗干擾能力強,所設計的控制器可用于系統的實時控制.
2.2 網絡參數自學習模糊控制
在模糊系統的許多應用中, 如模糊推理、模糊邏輯控制器、模糊分類器等, 提取模糊規則是一個重要步驟。在新興的研究領域――數據挖掘中, 提取模糊規則也起著重要作用。然而模糊控制規則的獲得通過由專家經驗給出, 這就存在諸如控制規則不夠客觀、專家經驗難以獲得等問題。因此研究模糊規則的自動生成有著重要的理論和應用價值。在許多問題中, 希望提取出來的模糊規則能夠用語言變量表示, 以便揭示模糊系統內部的規律, 同時這也是模糊系統的一個特色。為了提高抽取復雜系統模糊if- then 規則的質量, 將具有極好學習能力的神經網絡與模糊推理系統相結合, 產生了神經- 模糊建模方法, 這種方法綜合了兩種形式的特點, 提供了一種從數值數據集抽取模糊規則的有效框架。有關領域的研究者們提出了多種模糊邏輯與神經網絡結合的方法, 給出了各種用于提取模糊if- then 規則的神經網絡結構框架。
由于徑向基函數網絡(RBFN)以其結構簡單、良好的逼近能力、獨特點可分解性以及和模糊推理系統的函數等價性, 因此可應用于模糊系統。然而, 當一個模糊系統使用學習算法被訓練之后可能會影響其可解釋性, 也就是使得模糊系統的可理解性下降, 而可解釋性是模糊系統的一個突出特點。為了讓模糊系統在具有自學習和自組織性的同時也具有可解釋性這一突出特點, 以下提出了一種能夠有效表達模糊系統可解釋性RBF 網絡結構, 并進行了仿真實驗, 取得較好的仿真結果。
根據測量數據采用各種神經網絡自動提取模糊規則的方法, 在輸入輸出空間劃分部分運用的是聚類的思想, 而大多數其輸入輸出空間劃分數( 聚類數) 是預先給定, 這不免帶有一定的盲目性, 直接影響規則的提取質量。為此, 本文關于初始聚類中心及聚類中心個數的確定方法采用文獻7 提出的一種聚類神經網絡初始聚類中心的確定方法。利用這種基于密度和基于網格的聚類方法, 能自動地進行樣本空間的劃分, 針對樣本空間劃分過程中不同階段的特點, 采用了不同的處理手段, 使得該方法在樣本空間劃分數、聚類學習時間等方面都具有比較明顯的優越性(圖3)。
圖3 仿真實驗結果
下面針對每個仿真曲面分別給出一組訓練樣本點為500 個, 評價樣本點為100 個的仿真結果圖, 如圖4所示:
圖4
從圖中, 可見各樣本數據的預測值與實際值吻合的比較好, 只有個別的點誤差較大, 這與訓練樣本點的選取有關。另外, 在系統模型建立好后, 為了檢驗模型的效果, 筆者另外又抽取幾組數據樣本作為評價樣本, 結果發現預測值與實際值相比, 誤差也在允許范圍內, 效果比較令人滿意。
本方法的創新點是提出了一種能夠有效表達模糊系統可解釋性RBF 網絡結構, 并給出了一種有效的提取模糊規則的算法, 這就使模糊系統在具有自學習和自組織性的同時也具有可解釋性這一突出特點。利用這種網絡結構和算法進行控制器設計, 至少有以下的優點:
(1)模糊系統具有很好的可解釋性。
(2)該算法克服了RBF 中心個數選擇的隨機性,較好地解決了樣本聚類。
(3)提出的增量數據處理方法保證了網絡結構能適應不斷擴大的數據集。
綜上所述, 這種RBF 模糊神經網絡控制算法,對于研究非線性, 時變的多變量系統, 提供了一種新的思路, 具有一定的理論意義和工程應用價值。
2.3 其他一些方法
其他的一些最近被提出的,如基于神經模糊網絡的方法,基于模糊推理網絡的方法(見圖5), 基于非線性自回歸滑動平均模型等,都取得了很好的控制和辨識效果,具有有良好的發展和應用前景.
圖5 6層神經模糊推理網絡
3 總結
本文系統地敘述了目前研究比較熱門的近期我國學者提出的幾種新的基于模糊神經網絡的系統辨識與控制方法的研究成果,并簡要分析了各種方法的優缺點. 限于篇幅,除本文介紹的幾種方法外, 還有一些研究成果沒有列出. 本文的目的是為在這方面進行研究的學者提供一個系統的參考和建議.
【參考文獻】
[1]李佳寧,易建強,等.一種新的基于神經模糊推理網絡的復雜系統模糊辨識方法[J].自動化學報,2006,Vol.32,No.5.
[2]王鍇,王占林,付永領,祁曉野. 基于PNN與FNN模型神經網絡控制器設計與分析[J].北京航空航天大學學報,Vol.32, No.9,2006.
[3]李曉秀,劉國榮,沈細群.仿射非線性系統的在線自適應模糊神經網絡辨識與控制[J].湖南大學學報(自然科學版),2006,8,33(4).
[4]李延新,李光宇,孫輝,李文.基于RBF 網絡的參數自學習模糊控制的研究[J].微計算機信息,2006,8,22(8).
[關鍵詞] 藥品;神經網絡;組合預測;需求預測
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051
[中圖分類號] TP183 [文獻標識碼] A [文章編號] 1673 - 0194(2014)08- 0084- 05
0 引 言
隨著人工智能技術的發展,人工神經網絡得到了廣泛研究和應用。由于神經網絡具有良好的學習能力和較強的非線性處理能力、不依賴于特定數學模型等優勢,其作為一種預測方法已被廣泛應用于許多領域。
在醫藥企業、醫藥衛生管理領域,藥品需求預測一直是管理部門關心的熱點問題。藥品需求除了受由藥品自身屬性影響外,還受國家政策或醫藥行業規定等因素的影響,如藥品在某地區是否中標、是否為處方藥等;同時,制藥企業自身制定的定價、渠道以及促銷等營銷策略和銷售團隊的組建制度也對藥品需求產生不同程度的影響。藥品需求特征的多樣性,決定了藥品需求預測本質上是一個復雜的非線性系統建模問題。
國內外眾多學者對藥品需求預測進行了深入的研究,產生了一批有價值的研究成果。目前,藥品需求預測的主要方法包括:回歸分析法、時間序列分析法、神經網絡、遺傳算法等。這些方法從不同角度出發建模,均取得一定效果,尤其是BP神經網絡,已經在藥品預測研究中取得了眾多應用。盡管相關討論和研究不斷增多,但是目前常用的神經網絡預測方法普遍存在以下問題:由于藥品需求特征頗為復雜的特殊性,運用單項預測方法對其進行預測無法涵蓋其較多的特征信息,通常表現為對某類特定的藥品預測效果良好,而對其他藥品則預測性能較差,從一定程度上限制了預測模型的適用范圍。
本文采用基于神經網絡的組合預測模型來解決上述問題。組合預測方法(combined forecasting)是指通過一定數學方法將不同的單項預測模型組合起來,綜合利用各種單項預測方法所提供的信息,從而達到提高預測精度的目的。組合預測方法最早由Bates和Granger[1]于1969年提出,他們認為對于一個包含系統獨立信息的單項預測方法,與預測精度較小的預測方法進行組合預測完全可以增強系統的預測性能。
考慮到各種神經網絡預測方法的特點及其適用范圍,本文選擇BP神經網絡預測方法、RBF神經網絡預測方法和基于廣義回歸神經網絡(GRNN)3種常用的神經網絡預測方法作為組合預測模型中的單項預測方法。在此基礎上,用平均絕對相對誤差(MAPE)和方差為衡量標準,并根據設置的閾值對單項預測方法進行篩選,最后選取了MAPE作為最優準則計算得到權重,從而建立組合預測模型,在提高組合預測模型精度的同時,使得組合預測模型具有現實意義。實驗結果表明,本文提出的模型的預測精度高于傳統的線性組合模型的預測精度。
1 相關工作
基于神經網絡的預測方法具有很多其他預測方法所不具備的優點,近年來越來越被人們所關注。吳正佳 等(2010)[2]針對某備貨型企業的產品需求量,建立了基于良好學習能力的BP神經網絡預測模型,并通過實證分析與簡單移動平滑法和加權移動平滑法的預測結果相比較,結果表明BP神經網絡預測結果比其他兩種更為有效果。童明榮 等(2007)[3]提出一種季節性RBF神經網絡預測模型,對具有季節性的產品月度市場需求進行預測,最后利用構建好的RBF神經網絡模型進行仿真實驗,并與ARIMA模型、分組回歸模型等常用季節預測模型做對比分析,結果表明前者的預測誤差均方差最小,預測精度較高。Maria Cleofé(2005)[4]利用人工神經網絡(ANN)對圣保羅地區的降雨量進行預測,并通過實證分析與其他線性回歸模型作對比評價,實驗結果表明人工神經網絡有著更好地預測效果。此外還有其他很多學者在交通、航運、氣候等多個領域運用神經網絡進行了預測[5-7],不在此贅述。
針對藥品銷量預測這一特定問題,國內外部分學者也做了一定的研究工作,試圖尋找合適的預測方法對藥品需求做出較為準確的預測。馬新強 等(2008)[8]提出了一種基于BP神經網絡的藥品需求預測模型,該文先利用數據倉庫及數據挖掘技術分析提取了相關有效的藥品銷售信息作為研究對象,在此基礎上利用BP神經網絡對其進行預測,最后在較為精確銷售量的基礎上提出了一種優化的生產決策系統方法。王憲慶 等(2009)[9]利用BP神經網絡模型對藥品超市的藥品銷售情況進行預測并做了相關實證分析,該文通過觀察藥品預測的顯著性差異評價模型的性能,最終取得了良好的效果,支持了其BP神經網絡非常適用于資金有限、倉儲量不大的藥品超市的結論。劉德玲(2012)[10]提出了一種針對大范圍內的藥品銷售的預測方法。該文利用遺產算法優化支持向量機藥品銷售預測方式進行預測,提高了藥品銷售預測的精確度,得到了較為滿意的結果。
盡管有關研究不斷增多,但由于藥品需求特征頗為復雜的特殊性,運用單項預測方法對其進行預測無法涵蓋其較多的特征信息,從一定程度上限制了預測模型的適用范圍。本文根據藥品需求高度非線性的特點選取了3種不同特性神經網絡模型作為單項預測方法,每種神經網絡都有其所針對的藥品需求特征,并在此基礎上建立組合預測模型,擴大了藥品預測模型的適應范圍,對于提高藥品預測精度和預測穩定性具有重要意義。
2 基于神經網絡的藥品需求組合預測模型的建立
基于神經網絡的藥品需求組合預測模型的具體步驟如下:
(1)數據異常點預處理。為提高組合預測模型的適用范圍和預測精度,本文運用基于距離的異常點檢測方法對存在異常點的藥品需求數據進行異常點修復,得到正常的需求數據。
(2)單項預測方法的選取。針對藥品需求的不同特征,選取3種不同特性的神經網絡模型作為單項預測方法,以此作為組合預測模型單項預測方法的篩選基礎。
(3)單項預測方法的篩選與變權重的計算。因為不同藥品具備不同需求特征,在進行組合預測時仍需要在已選取單項預測方法的基礎上再次篩選合適的單項預測方法進行組合,以相對誤差為最優準則,通過求解二次規劃問題得到權重并按照一定的變權規則進行變權。
(4)根據權重建立組合模型進行預測。
2.1 藥品數據異常點預處理
在藥品銷售數據中,由于特殊事件(如鋪貨)等原因,個別數據會表現出明顯突變,導致藥品歷史數據存在異常點,掩蓋了數據本身的規律。本文通過基于距離的異常點檢測方法和多項式擬合方法對藥品數據做預處理,具體處理步驟如下:
首先,選擇一個較大的數(如1010)將缺失數據補足,然后運用基于距離的異常點檢測方法進行檢測。第一步,對藥品需求數據進行歸一化處理并計算出各個數據之間的距離,得到距離矩陣P。計算公式如下:
Pij=|xi-xj|,i,j=1,…,n(1)
式中,xi表示時間序列中第i期的數據,Pij表示時間序列中i期數據與j期數據之差的絕對值。距離矩陣P的第i列表示時間序列第i期數據與長度為n的時間序列中所有數據(包括第i期數據本身)的距離。
P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)
通過設置距離閾值d,計算出所有滿足Pij>d的距離個數,記di,得到判別矩陣D。
D=[d1,d2,d3,…,dn](3)
將di與閾值f進行比較,若大于f,則識別該點為異常點,否則為正常值。最后利用多項式擬合方法,將檢測出來的異常點作擬合處理,得到建模需要的正常數據。
2.2 單項預測方法的選取
藥品需求預測是一個復雜的非線性系統建模問題,相對于傳統分析方法(如指數平滑方法、ARMA模型、MTV模型),神經網絡依據數據本身的內在聯系建模,具有良好的自組織、自適應性,以及抗干擾能力以及非線性映射能力,能夠較好地解決非線性數據擬合問題。
本文選取3種具有不同特征的神經網絡模型,即BP神經網絡、RBF神經網絡和GRNN廣義回歸神經網絡,綜合其各自優勢建立組合預測模型,提升整個預測模型的泛化能力,提高預測精度與預測穩定性。
2.2.1 基于BP神經網絡的藥品需求預測方法
BP神經網絡由Rumelhard和McClelland于1986年提出,它是一種典型的多層前向型神經網絡。藥品銷售記錄作為BP神經網絡輸入值,藥品需求預測即為BP神經網絡輸出值。當輸入節點數為m,輸出節點數為n時,BP神經網絡就表達了從m個自變量到n個因變量的非線性函數映射關系。
BP神經網絡側重對全樣本的學習,因此適合對樣本整體特征相近的時間序列進行預測,即適應受某一特定因素影響顯著,且該影響因素相對穩定的藥品預測。
2.2.2 基于RBF神經網絡的藥品需求預測方法
徑向基函數(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一種三層前饋網絡,即輸入層、隱含層和輸出層。從輸入層到隱含層是一個非線性到線性的變換過程,從隱含層到輸出層是一個線性處理過程。RBF神經網絡在處理非線性問題時,引入RBF核函數將非線性空間映射到線性空間,極大地提高了非線性處理能力,且RBF神經網絡采用自組織有監督的學習算法進行訓練,其訓練收斂速度具有顯著的優勢。
RBF神經網絡具有很好的非線性處理能力,其學習算法屬于局部激活性較高的高斯函數,對于相似的樣本有著較高的逼近能力,因此適用于受會隨時間變化而較為顯著變化的因素影響的藥品需求預測。
2.2.3 基于GRNN的藥品需求預測方法
廣義回歸神經網絡(GRNN,Generalized Regression Neural Network)由美國學者Donald F. Specht在1991年提出,它是徑向基神經網絡的一種。GRNN具有很強的非線性映射能力和柔性網絡結構以及高度的容錯性和魯棒性,適用于解決非線性問題。
GRNN在逼近能力和學習速度上較RBF網絡有更強的優勢,網絡最后收斂于樣本量積聚較多的優化回歸面,并且在樣本數據較少時,預測效果也較好。此外,網絡還可以處理不穩定數據。因此GRNN適用于數據不全、異常點較多的藥品。
綜上所述,3種神經網絡都具有良好的非線性處理及預測能力,因為學習算法的不同有著各自側重的學習方向,皆為應用廣泛的預測方法,且對各自適應范圍內有著較好的預測效果。因此本文選擇BP神經網絡、RBF神經網絡以及廣義回歸神經網絡作為單項預測方法,并在此基礎上建立組合預測模型。
2.3 單項預測方法的篩選與變權系數的計算
本文在已選取3種單項預測方法的基礎上,再根據合適的MAPE和誤差方差篩選出組合模型中的單項預測方法,計算出變權系數。假設藥品需求的實際時間序列為y(t),t=1,2,…,N,N+1,…,N+T,其中t表示預測區間,T表示預測步長。
(1)單項方法篩選
單項方法進一步篩選的具體步驟為:
①預先設置選擇單項方法MAPE閾值m 和誤差方差閥值ε
②進行逐期單步預測,預測序列為:
{i(t),i=1,2,…,n;t=N+1,…,N+T}
③計算n種單項方法的相對誤差ei(t)、誤差方差εi(t)和MAPE。其中,單項預測方法的相對誤差序列為:
ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)
單項預測方法的誤差方差為:
εi(t)=(5)
單項預測方法的MAPE為:
MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)
④若MAPEi(t)
(2)變權系數的計算
本文考慮預測效果,選用基于相對誤差為最優準則的最優加權法進行計算。
假設從n中方法中篩選出p(p≤n)種單項預測方法,則組合模型第t+1期的權系數w(t+1)由相對誤差ei(1),…,ei(t)決定,其中i=1,…,p。變權規則如表1所示。
權系數具體計算過程如下:
①設組合權重wi為方法mi在組合預測方法中權重,則組合預測方法第t期相對誤差為:
e(t)=wi*ei(t),i=1,2,…,p(7)
②組合模型前t期的相對誤差平方和為:
e2=e(1)2+e(2)2+…+e(t)2(8)
令w=[w1,w2,…,wP]T,
E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t)
建立如下目標規劃:
min P=e2=wT*ET*E*w
s.t. wi=1(9)
③求解該目標規劃得到變權系數w。
2.4 建立組合模型進行預測
組合預測模型可表示為:
式中, wi(t)表示第t期單項方法mi的變權系數,(t)表示第t期組合預測方法的預測值。根據該模型對藥品進行預測。
3 實驗與分析
本文以上海市某制藥企業月度銷售額為藥品需求預測的實證數據,根據銷售地區的不同抽取有代表性的藥品銷售數據,其中選取上海地區10種藥品,北京地區4種藥品及全區域銷售數據12種藥品,數據長度皆為30(2009-1至2011-6)。
數據選擇依據如下:①藥品銷售有一定的連續性,為公司主推或在某地區主推藥品,具有代表性及預測意義;②在考慮異常點和數據缺失時,選取異常點和缺失數據較少的藥品。
3.1 單項方法篩選和變權系數計算
根據不同銷售區域藥品需求的具體情況,設定單一省市藥品的MAPE閾值和方差閾值分別為20%和0.1;設定公司的MAPE閾值和方差閾值分別為30%和0.1。shy03和all03的單項預測方法選取結果如表2 所示。
利用單項預測方法的6期預測結果計算組合預測模型的3期權重,選相對誤差最優準則進行權重計算,運用MATLAB的二次規劃函數quadprog求解。變權規則及權重計算結果如表3所示。
3.2 預測模型的精度比較
本文選取平均絕對相對誤差(MAPE)和預測有效度兩個指標來綜合評價模型的預測精度。當MAPE越小時,說明預測精度越高。然而當實際值非常小時,即使是預測值與真實值之差較小,其平均絕對相對誤差也會很大,而預測有效度能很好地避免此類問題,故我們引入預測有效度來綜合評價預測精度,預測有效度越大,預測精度越高。
用單項預測方法BP、RBF、GRNN與組合預測方法單一省市和全區域藥品銷售預測值的MAPE和有效度,對MAPE和有效度的情況進行統計并且計算MAPE和有效度的平均值,比較結果如表4所示。
可以看出,運用組合預測方法對單一省市的14種藥品進行需求預測時,MAPE小于標準值20%的有8個,占藥品總數的57.14%,優于BP(7)、RBF(4)、GRNN(6)方法;14種藥品的MAPE平均值為19.81%,優于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。預測有效度大于標準值0.5的有11個,占藥品總數的78.57%,優于BP(8)、RBF(10)、GRNN(8)方法;14種藥品的預測有效度平均值為0.62,優于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。
此外,運用組合預測方法對全區域銷售的12種藥品進行需求預測時,MAPE小于標準值30%的有7個,占藥品總數的58.33%,優于BP(4)、RBF(6)、GRNN(3)方法;12種藥品的MAPE平均值為25.22%,優于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。預測有效度大于標準值0.45的有10個,占藥品總數的83.33%,優于BP(7)、RBF(9)、GRNN(5)方法;12種藥品的預測有效度平均值為0.58,優于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。
通過上述實證結果,從整體上看,組合預測方法的預測精度優于單項預測方法,而且模型的適用范圍較廣。
3.3 預測模型的穩定性比較
本文選擇預測誤差的方差作為評價模型穩定性的指標。將單項預測方法BP、RBF、GRNN與組合預測方法的誤差方差進行比較,單一省市和全區域的比較結果如表5所示。
可以看出,運用組合預測方法對單一省市的14種藥品進行需求預測時,誤差方差小于標準值0.1的有12種,占藥品總數的85.71%,優于BP(10)、RBF(11)、GRNN(10)方法;此外,14種藥品誤差方差平均值為0.0263,優于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。運用組合預測方法對全區域銷售的12種藥品進行需求預測時,誤差方差小于標準值0.1的有11個,占總數的91.67%,優于BP(9)、RBF(10)、GRNN(8)方法,此外,14種藥品的誤差方差平均值為0.031 0,優于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此從整體上看,組合預測方法的預測穩定性優于單項預測方法。
4 總結及展望
本文選擇3種具有不同適應特征的神經網絡模型作為單項預測方法,建立了基于神經網絡的藥品需求組合預測模型,以上海市某藥企的實際銷售數據作為實證對象,驗證了該模型在預測精度和預測穩定性上均優于單項預測方法。當然,雖然建立的神經網絡組合模型在一定程度上彌補了現有方法的不足,擴大了預測方法的適用范圍,但在研究過程中依然存在亟待解決的問題:
(1)單項預測方法的參數優化有待進一步研究。本文在參數優化時,大部分采用遍歷法和經驗法進行設置,缺乏相應理論依據和方法指導。如何采用合適參數尋優方法進行參數確定是下一步亟待解決的問題。
(2)進行組合預測時,選擇合適的最優準則有待于進一步研究。本文選取相對誤差作為最優準則進行需求預測,該準則的選取忽視了量綱統一性,未來的研究應該綜合考慮量綱統一、預測誤差和預測穩定性,使組合預測方法更科學、更合理。
主要參考文獻
[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.
[2]吳正佳,王文,周進.BP神經網絡在備貨型企業銷售預測中的應用[J].工業工程,2010(1):105-108.
[3]童明榮,薛恒新,劉路冰.基于季節性RBF神經網絡的月度市場需求預測研究[J].運籌與管理,2007(3),146-150.
[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.
[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.
[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.
[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.
[8]馬新強,黃羿.基于BP神經網絡的藥品銷售預測模型設計[J].重慶文理學院學報,2008(2):64-66.