前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經網絡范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞 人工;神經網絡;機器學習方法
中圖分類號Q1 文獻標識碼A 文章編號 1674-6708(2011)40-0111-02
0 引言
機器學習方法經常被應用到解決醫學和生物信息學的問題。在這個報告中我列舉了一些把機器學習方法應用到生物信息學領域的實例。比如:組建多重神經網絡,運用該神經網絡對4種不同形勢的腫瘤患者進行分類。
1 介紹
人工神經網絡屬于機器學習領域。關于人工神經網絡的概念最早提出于1940年代。后來在1980年代后被推廣應用,尤其是在醫學領域。
其中一個非常有用的用途是對疾病進行分類,達到診斷的目的,或者對基因表達進行分類。在這類神經網絡里面,k點最近鄰居算法是最常被采用的算法。
人工神經網絡的優點是:不需要人們蛆關注神經網絡里面的細節信息;人工神經網絡可以很容易地被重新訓練來應對不同地分類數據。人工神經網絡可以用來解決有監督學習和無監督學習,比如:自組織特征映射(self-organized feature map)就可以用來解決無監督學習的問題。
它的不足之處在于:人工神經網絡往往需要大量的訓練數據,而這些訓練數據往往不是很容易獲得。人工神經網絡可以被看作是一個黑盒,它的細節隱藏在點點之間的權值里面。這些權值的意義是人類無法理解的。同時,人工神經網絡需要被仔細的訓練以避免過擬合的情況出現。我們常常需也要降低高維數據的維度。下面,我將分析介紹人工神經網絡的具體應用。
人工神經網絡的結構如圖1所示:
X1 ,X2 ,X3是該神經網絡的輸入值,w0 ,w1 ,w2 ,w3 是該神經網絡的輸入結點到內部節點的路徑權值,每個神經元的激活函數是如上圖右側所示的函數圖像。
這個函數被稱作為sigmoid函數,表達式如下:
多重神經網絡通常有3層,事實上,3層神經網絡以能進行很好的分類效果。這三個層包括輸入層,隱藏層,輸出層。在每個神經元內部我們可以選擇sigmoid激活函數或其他種類的激活函數。
如圖2所示:
單個神經元僅能提供線性的分割面,所以多層神經網絡可以提供非線性的分類函數(即:若干個線性分割面的復雜組合)。這并不意味著4層神經網絡就一定比3層神經網絡能一共更好的分類效果,因為層數越多,需要的訓練集就越龐大,得到的效果也不會提高。
既然有訓練問題,就會涉及到訓練算法。較為早的和著名的訓練算法是delta 規則。它于20世紀60年代被提出。它的原理是計算理論輸出值和世紀輸出值的均方差。tp 為理論輸出值,yp為實際輸出值,表示為:
訓練的開始階段,我們通常設定一個隨機選取值,令該值等于:
該公式里,α是學習速率,學習速率越大,學習的過程就越快,完成學習的時間短。但如果學習的速率過大,可能導致網絡的理想權值在合理結果的附近游擺而永遠無法獲得理想的權值。
神經網絡被訓練好了以后,它就被用到解決目標問題。原始的數據集可以被分為兩部分:一部分用來訓練,一部分用來測試。
有時候神經網絡會把訓練數據集里面的噪音點的特征納入自己的權值表達里,從而該神經網絡無法真正體現該點集的真實特征。我們把這種情況叫做過擬合。過擬合是由于網絡比待估函數復雜造成的。比如一個可以同3層網絡解決的問題,我們用4層網絡或者由更多神經元的三層網絡去解決該問題,就容易造成過擬合。為了更好的明確訓練時所采用的神經網絡的隱藏層的層數,Livingstone 和 Manalack 提出了如下計算公式:
D = m*o/w
該公式里m是訓練樣本的數目,o是該網絡的輸出值,w是網絡權值的數目,D就是隱藏層的數目。
得到了隱藏層的數目之后,我們可以以這個數目創建神經網絡,邊訓練邊削減,直到我們獲得一個一半化的網絡。對于沒有隱藏網絡層或只有一個隱藏網絡層的神經網絡,我們需要先確定它要解決的問題是否是線性的。
適當的訓練方案是能也可以使網絡的復雜性和數據的復雜性得到合適的匹配。一個合適的訓練方案應該是如下步驟:首先選擇一個很大的網絡并且把它的每個權值都設到一個很小的值上。通過訓練,這些權值可以逐漸游擺到一個合理的值。
由于初始數據集通常要被分為訓練集和測試集。在醫學領域,我們能獲得的數據集往往很小,比如某種病的病人數目不會很大。所以我門需要采用交叉驗證的技巧來是較小的數據集在被分為訓練集和測試集之后能較好的訓練神經網絡。
關鍵詞:神經網絡;智能;計算;應用研究
中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2008)20-30326-02
Application of Neural Network Forefront
LI Bing-fu1,2
(1.Zhanjiang Normal College, Zhanjiang 524048, China; 2.Chongqing University, Master of the Computer College, Chongqing 400030, China)
Abstract: The rise of neural networks, has been on the cognitive and intellectual nature of the computer industry and basic research has produced an unprecedented excitement and great role. Therefore, in all fields has greatly applied research.
Key words: Neural Networks; Intelligent; Computing; Applied Research
1 引言
神經網絡是一門模仿人類神經中樞――大腦構造與功能的智能科學,利用物理器件來模擬生物神經網絡的某些結構和功能,即由許多功能簡單的神經元互聯起來,形成一種能夠模擬人的學習、決策和識別等功能的網絡系統。他具有快速反映能力,便于對事物進行適時控制與處理;善于在復雜的環境下,充分逼近任意非線形系統,快速獲得滿足多種約束條件問題的最優化答案;具有高度的魯棒性和容錯能力等優越性能。
神經網絡的崛起,已對認知和智力的本質的基礎研究乃至計算機產業都產生了空前的刺激和極大的推動作用。因此在各個領域都有很大的應用研究。
2 神經網絡(ANN)的研究內容
1) 理論研究:ANN模型及其學習算法,試圖從數學上描述ANN的動力學過程,建立相應的ANN模型,在該模型的基礎上,對于給定的學習樣本,找出一種能以較快的速度和較高的精度調整神經元間互連權值,使系統達到穩定狀態,滿足學習要求的算法;2) 實現技術的研究:探討利用電子、光學、生物等技術實現神經計算機的途徑;3) 應用的研究:探討如何應用ANN解決實際問題,如模式識別、故障檢測、智能機器人等。
3 神經網絡在各領域的應用研究
3.1 智能機器領域的應用研究
智能機器領域的應用研究主要是進一步研究調節多層感知器的算法,使建立的模型和學習算法成為適應性神經網絡的有力工具,構建多層感知器與自組織特征圖級聯想的復合網絡,是增強網絡解決實際問題能力的一個有效途徑。重視聯結的可編程性問題和通用性問題的研究,從而促進智能科學的發展。通過不斷探索人類智能的本質以及聯結機制,并用人工系統復現或部分復現,制造各種智能機器,可使人類有更多的時間和機會從事更為復雜、更富創造性的工作。
智能的產生和變化經過了漫長的進化過程,我們對智能處理的新方法的靈感主要來自神經科學,例如學習、記憶實質上是突觸的功能,人類大腦的前額葉高度發育,它幾乎占了30%大腦的表面積,在其附近形成了人類才出現的語言運動區,它與智能發育密切相關,使神經系統的發育同環境的關系更加密切,腦的可塑性很大,能主動適應環境還能主動改造環境,人類向制造智能工具方向邁進正是這種主動性的反映。腦的可塑期越長,經驗對腦的影響就越大,而人類的認知過程很大程度上不僅受經驗主義的影響,而且還接受理性主義的模型和解釋。因此,對于智能和機器的關系,應該從進化的角度,把智能活動看成動態發展的過程,并合理的發揮經驗的作用。同時還應該從環境與社會約束以及歷史文化約束的角度加深對它的理解與分析。
神經網絡是由大量處理單元組成的非線性、自適應、自組織系統,它是在現代神經科學研究成果的基礎上提出的,試圖模擬神經網絡加工、記憶信息的方式,設計一種新的機器,使之具有人腦風格的信息處理能力。智能理論所面對的課題來自“環境-問題-目的”,有極大的誘惑力與壓力,它的發展方向就將是,把基于聯結主義的神經網絡理論、基于符號主義的人工智能專家系統理論和基于進化論的人工生命這三大研究領域,在共同追求的總目標下,自發而有機的結合起來。在21世紀初,智能的機器實現問題的研究將有新的進展和突破。
3.2 神經計算和進化計算的應用研究
計算和算法是人類自古以來十分重視的研究領域,本世紀30年代,符號邏輯方面的研究非常活躍。例如Church、Kleene、Godel、Post、Turing等數學家都給出了可計算性算法的精確數學定義,對后來的計算和算法的發展影響很大。50年代數學家Markov發展了Post系統。80年代以后,神經網絡理論在計算理論方面取得了引人注目的成果,形成了神經計算和進化計算新概念,激起了許多理論家的強烈興趣,大規模平行計算是對基于Turing機的離散符號理論的根本性的沖擊,但90年代人們更多的是批評的接受它,并將兩者結合起來,近年來,神經計算和進化計算領域很活躍,有新的發展動向,在從系統層次向細胞層次轉化里,正在建立數學理論基礎。隨著人們不斷探索新的計算和算法,將推動計算理論向計算智能化方向發展,在21世紀人類將全面進入信息社會,對信息的獲取、處理和傳輸問題;對網絡路由優化問題;對數據安全和保密問題等等將有新的要求,這些將成為社會運行的首要任務,因此,神經計算和進化計算與高速信息網絡理論聯系將更加密切,并在計算機網絡領域中發揮巨大的作用,建立具有計算復雜性、網絡容錯性和堅韌性的計算理論。
基于人類的思維方式的轉變:線性思維轉到非線性思維。神經元、神經網絡都具有非線性、非局域性、非定常性、非凸性和混沌等特性,故此在計算智能的層次上進行非線性動力系統、 混沌神經網絡以及對神經網絡的數理研究。從而進一步研究自適應性子波、非線性神經場的興奮模式、神經集團的宏觀力學等。因為,非線性問題的研究是神經網絡理論發展的一個最大動力,也是它面臨的最大挑戰。此外,神經網絡與各種控制方法有機結合具有很大發展前景,建模算法和控制系統的穩定性等研究仍為熱點問題,而容忍控制、可塑性研究可能成為新的熱點問題。開展進化并行算法的穩定性分析及誤差估計方面的研究將會促進進化計算的發展。把學習性并行算法與計算復雜性聯系起來,分析這些網絡模型的計算復雜性以及正確性,從而確定計算是否經濟合理。因而關注神經信息處理和腦能量兩個方面以及它們的綜合分析研究的最新動態,吸收當代腦構象等各種新技術和新方法是十分重要的。
離散符號計算、神經計算和進化計算相互促進或者最終導致這3種計算統一起來,這算得上是我們回避不了的一個重大難題。預計在21世紀初,關于這個領域的研究會產生新的概念和方法。尤其是視覺計算方面會得到充分地發展。我們應當抓住這個機會,力求取得重大意義的理論和應用成果。
3.3 神經網絡結構和神經元芯片的應用研究
神經網絡結構的研究是神經網絡的實現以及成功地實現應用的前提,又是優越的物理前提。它體現了算法和結構的統一,是硬件和軟件的混合體,這種硬軟混合結構模型可以為意識的作用和基本機制提供解釋。未來的研究主要是針對信息處理功能體,將系統、結構、電路、 器件和材料等方面的知識有機結合起來,建構有關的新概念和新技術,如結晶功能體、最子效應功能體、高分子功能體等。在硬件實現上,研究材料的結構和組織,使它具有自然地進行信息處理的能力,如神經元系統、自組織系統等。神經計算機的主要特征是具有并行分布式處理、學習功能,這是一種提高計算性能的有效途徑,使計算機的功能向智能化發展,與人的大腦的功能相似,并具有專家的特點,比普通人的反應更敏捷,思考更周密。光學神經計算機具有神經元之間的連接不僅數量巨大而且結合強度可以動態控制,因為光波的傳播無交叉失真,傳播容量大,并可能實現超高速運算,這是一個重要的發展領域,其基礎科學涉及到激光物理學、非線性光學、光紊亂現象分析等,這些與神經網絡之間在數學構造上存在著類似性。近年來,人們采用交叉光互連技術,保證了它們之間沒有串擾,它有著廣闊的發展前景。在技術上主要有超高速、大規模的光連接問題和學習的收斂以及穩定性問題,可望使之得到突破性進展;另一種是采用LSI技術制作硅神經芯片,以及二維VLSI技術用于處理具有局部和規則連接問題。在未來一、二十年里半導體神經網絡 芯片仍將是智能計算機硬件的主要載體,而大量的神經元器件,如何實現互不干擾的高密度、高交叉互連,這個問題可望盡早得到解決。此外,生物器件的研究正處于探索之中,研究這種模型的理論根據是當硅集成塊和元件間的距離如果接近0.01微米時,電子從鄰近元件逸入的概率將很有限,便產生“隧道效應”的現象,它是高集成電路塊工作不可靠的原因之一。而生物芯片由于元件是分子大小的,其包裝密度可成數量級增加,它的信號傳播方式是孤電子,將不會有損耗,并且幾乎不產生熱。因此,它有更誘人的前景。隨著大量神經計算機和神經元芯片應用于高科技領域,給神經網絡理論和方法賦予新的內容,同時也會提出一些新的理論課題,這是神經網絡迅速發展的一個動力。
4 結束語
近年來,我國“863”計劃、攻關計劃、“攀登”計劃和國家自然科學基金等,都對神經網絡的研究給予了資助,吸引了大量的優秀青年人才從事神經網絡領域的研究工作,并促進我國能在這個領域取得世界上的領先地位。在21世紀科學技術發展征程中,神經網絡理論的發展將與日俱增。
參考文獻:
[1] 閻平凡.人工神經網絡的容量、學習與計算復雜性[J]. 電子學報,1995,23.
關鍵詞:期貨;主成分分析;RBF神經網絡;預測
1引言
在對實際問題進行描述和處理中,為了能夠獲得更加全面的信息,我們經常需要統計多個變量的數據。但是這些多個變量之間經常存在一定的相關性,并不是每個變量都是我們所需要的,或者說它們攜帶的信息可能是重復的。因此我們希望用少數幾個變量來代替原有的多個變量。主成份分析法的基本思想就是通過對原始數據的降維,將多個相互關聯的變量轉化為少數幾個互不相干的變量的統計方法。
由于期貨價格的變化是一個非線性的時間序列,利用傳統的統計方法對期貨的價格直接進行預測,所得到的結果不是很理想。而神經網絡在非線性模式中具有優勢,因而它不需要建立復雜的數學模型就可以完成期貨價格預測。基于BP網絡和RBF網絡的預測都有較好的結果,但是相對BP網絡而言,利用RBF神經網絡不僅解決了常用BP網絡易陷入局部最小的問題,而且訓練時間更短,預測的精度也比BP網絡高得多。本文提出使用基于主成分分析法的RBF神經網絡方法對期貨價格進行預測。通過主成分分析法對原始數據降維,然后,再用這些個數較少的新輸入變量作為RBF神經網絡的輸入進行模擬預測。由于主成分之間是相互獨立的,所以由各主成分組成的輸入空間不存在自相關性,從而有效地簡化了RBF網絡在高維時難以尋找網絡中心的問題,提高了預測精度。
2主成分分析法簡介及RBF神經網絡算法概述
2.1主成分分析法
主成分分析法的步驟如下:
(1)原始數據的標準化處理。
主成分分析法的目的就是使用較少的變量代替并綜合反映原來較多的信息,綜合后的變量就是原來多變量的主要成分,利用這些綜合后的主要成分去代替原來的變量去解決實際問題。這里首先利用以下公式對原始變量進行標準化處理。其中原變量為xij,其含義為第j個變量的第i個值,則處理后的變量值為yij,
(3)計算矩陣R的特征根和特征向量。
利用R的特征方程|R-λi|=0求出其特征根,其對應的特征向量利用|R-λi|A=0和AA''''=1求得。然后對所求得的特征根按照大小順序進行排列。
(4)計算方差貢獻率與累計方差貢獻率。
利用公式Ki=λi/∑ni=1代入所求的特征根λi,求出各個主成分的貢獻率Ki,其貢獻率就代表了原數據信息量的百分比。
(5)確定主成分計算其得分值。
主成分的確定方法主要有兩種:(1)當前K個主成分的累計貢獻率達到某一特定值的時,則保留前K個主成分。一般采用超過85%以上。(2)選取特征值大于1的主成分。這兩種可視情況進行選取,一般前者取得主成分要多,后者要少,通常情況下是將兩者結合一起來進行使用。
2.2RBF神經網絡算法概述
徑向基(RBF)網絡是以函數逼近理論為基礎構造的一類向前網絡。其網絡結構為三層,隱含層采用高斯函數為激勵函數,理論上,只要隱含層中有足夠的徑向基神經元,徑向基函數網絡就可以逼近任何非線性函數。輸出層為簡單的線性加權函數,其網絡結構如圖所示。
其中W1i為每個隱含層神經元與輸入層相連的權值向量,Xq為輸入矢量,b1i為閾值。則隱含層的第i個神經元的輸入為:
kqi=j(w1ji-xqj)2×b1i
輸出為:
rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)
輸出層的輸入則為各隱含層神經元的加權求和。由于激勵函數為線性函數,因此輸出為:
yq=∑ni=1ri×w22
RBF網絡首先通過無教師學習確定訓練輸入層與隱含層間的權值w2。再通過有教師學習,確定訓練隱含層與輸出層間的權值w1i。在RBF網絡訓練中,隱含神經元的數量確定是一個關鍵的問題。其基本原理是從0個神經元開始訓練,通過檢查輸出誤差使網絡自動增加神經元。每次循環使用,使網絡產生的最大誤差所對應的輸入向量作為權值向量w1i,產生一個新的隱含層神經元,然后檢查新網絡的誤差,重復此過程直到達到誤差要求或最大隱含層神經元為止。由此可見,徑向基函數網絡具有結構自適應確定、輸出與初始權值無關等特點。
3改進的RBF神經網絡對期貨價格的實例預測
3.1主成分分析
期貨的價格是受很多因素影響,如國家政策、季節氣候、供求關系、戰爭等,所以其價格會上下波動,呈現出一個非線性時間序列。其交易價格本文選取2007年6月7日至8月29日燃油0801每個交易日的開盤價、最高價、最低價、收盤價、交易量、持倉量、前5日均價、前10日均價為初始變量,每個變量60個數據,前59個為訓練樣本,最后一個為檢測樣本。考慮到期貨交易與股票交易的不同,其交易方式是雙向交易,從投資者獲利的角度考慮,其并不像股票市場一樣單純的考慮股票價格增長,加上每個星期正常的期貨交易日僅為5天,所以在這里我們考慮選取后5日均價作為預測目標,這樣的選擇更有實際意義。在這里本文直接利用SPSS軟件包,選擇數據降維,再選用主成分分析,可以直接得到各個主成分的方差累計貢獻率,如表1所示:
從表中我們可以看出,第一個主成分主要包含了開盤價、最高價、最低價、收盤價、以及前5日均價共五個變量的信息,第二個主成分主要包含了成交量和持倉量兩個變量的信息,而第三個主成分則主要包含了前十日均價一個變量的信息。由此可以看出,通過數據降維,將原來的8個變量,轉化為現在的3個變量了。
3.2神經網絡的設計及訓練
現設計一個三層的神經網絡,輸入層有3個神經元,輸出層神經元為1個。利用下式對輸入、輸出值進行標準化,可使得輸入、輸出值其均落在[-1,1]區間。
xn=2*(x-minx)/(maxx-minx)-1
在matlab的神經網絡工具箱中用newrb函數設計這個徑向基函數網絡,用其作函數逼近時,可自動增加隱含層神經元,直到達到均方誤差為止,利用語句:net=newrb(P,T,GOAL,SPREAD)進行網絡設計,其中GOAL為均方誤差,這里取值為0.0001,SPREAD為徑向基函數的擴展速度,其值越大,函數的擬合就越平滑。經過試驗,當其取0.058時,其預測效果最好。把2007年6月7日至8月28日的燃油0801選定的主成分作為輸入的訓練樣本,標準化的后5日均價的值作為輸出的訓練樣本,8月29日的數據作為測試樣本,計算結果如下:
4結語
由此可看出基于主成分分析法的徑向基神經網絡較一般的徑向基網絡有更簡潔的網絡結構,對于相對比較復雜的期貨價格預測,基于主成分分析法的徑向基神經網絡得到的結果也更加精確。不過徑向基神經網絡本身對擴展速度的選擇沒有一個固定的標準,不同的值得到的結果有較大的偏差,這是該網絡的一個缺陷,也是今后研究的一個方向。
參考文獻
[1]黃穎,白玫,李自珍.基于主成分-BP神經網絡的期貨市場預測[J].數學的實踐與認識.2007,(7):23-26.
[2]劉興彬,萬發祥.RBF神經網絡主成分分析法在交通量預測中的應用[J].山西科技,2001,(1):54-56.
關鍵詞:網絡輿情;BP神經網絡;預警
中圖分類號:C915 文獻標識碼:A 文章編號:1009-3044(2014)22-5283-04
互聯網這些年來在我國的快速的發展,我國網民人數較之前有了大幅的提升。網絡的開放性和靈活性讓其成為反映社會輿情的主要載體之一。而近兩三年網絡輿情引發的事件激增,引起了政府的高度重視,網絡儼然已成為政府部門了解民意的又一理想窗口。顯然,能夠直觀表達網絡輿情的光定性的解讀遠遠不夠,對于決策者更希望得到一個輿論事件過程中所處的量化等級。由于輿情危機產生具有模糊性和隨機性是非線性的,因此通過建立預警指標,再利用容錯能力高,通過學習復雜數據發現規律進行識別的人工神經網絡是不二選擇。故本文的核心在于BP神經網絡[1]。
1 網絡輿情危機預警指標體系
網絡輿情危機的發生,受到多種隨機因素的影響,而且每個因素對結果所起的效果大小也是不一樣的。因此網絡輿情危機預警的關鍵是建立科學、系統的預警指標體系。依據近些年來網絡輿情方面專家的調查匯總和政府機構對輿情監督部門的考察,并結合網絡輿情與危機預警機制方面的資料,經過多次地調試整理匯總制定出,對網絡輿情信息從五個具體的指標構建了網絡輿情危機預警指標體系[2]。
1.1 輿情預警指標
1.1.1 輿情信息的敏感度
網絡上有各式各樣的信息,而這些各式各樣的信息其敏感度也是不同的,對于可能造成社會動蕩的網絡信息則是政府最為關注的。顯然各條信息所引起的社會敏感度是不同的,敏感度越高說明產生輿論危機的可能性就越高。這種指標的量化標準采用專家打分的方法得到。得分設定的范圍為[0,1],0、0.5、0.7、1表示的意義依次為“具有敏感性”、“敏感”、“很敏感”、“相當敏感”。
1.1.2 輿情信息的流通量
輿情信息的流通量反映出輿情信息在網絡上傳播情況和討論熱度。而這些網絡上的流通信息會被搜索引擎例如Google、百度等抓取。因此通過限定時間段搜索引擎搜索關鍵詞得到的搜索量可以作為流通量使用。
1.2.3 輿情觀點傾向度
輿情觀點傾向度主要量化網民對于某個輿論信息觀點傾向度。分別由1,0,-1表示正面、中立、反面觀點,用[f(x)][f(x)]表示各個觀點面傾向度,n表示發表觀點的總觀點數,此指標用[μ]表示:
其實就是求各個觀點總和的均值,其取值范圍在(-1,1)。這部分則是通過統計事件討論最熱的貼吧的跟帖信息或者微博評論進行打分得到的。
1.2.4 輿情影響范圍
輿情影響范圍是指在某一時刻或時間段內,輿情信息所影響的區域性范圍。對于這部分的評分依照我國的行政地域劃分進行評分。即村\社區、鄉\鎮\街道、縣\區、市、省、國家。其取值范圍為[0,1]。這部分的取值則是通過新聞報道中時間的發展態勢進行取值。地域對應的取值見下表:
1.2.5 網絡輿情媒體曝光度
網絡輿情信息被媒體曝光之后則將網絡信息的討論引到現實社會中,而現實中媒體的報道是有著比網絡更為嚴格的審查制度。媒體的報道無疑對網絡輿情有著更為影響力的宣傳進而推動著輿論的發展。而這部分的數據則采用Google news中通過對時間段的設定搜索關鍵詞得到相應的搜索到的新聞條數進行量化評價媒體的曝光度。
1.2.6 輿情指標
而結果評級依照《國家突發公共事件總體應急預案》將預警等級設為四個等級:特別嚴重、嚴重、較重和一般。而根據網絡輿情危機的嚴重程度、經濟程度、可控性等方面將預警設為5個等級:安全、輕警、中警、重警、急警[7]。
2 數據獲取與處理
2.1 事件的選取和回顧
在實證分析中以“寧波PX事件”為預警模型的最終目標,而選擇了“廈門PX事件”和“昆明PX事件”為學習樣本進行學習。這一連串關于PX事件其危害的對象不僅僅是政府形象更是對整個社會和諧穩定造成了較大的影響。尤其是寧波PX事件中,甚至出現了不理智的因受謠言的蠱惑沖擊政府機關掀翻執勤警車的情況。倘若能及時且準確地對此類事件進行預警并作出相應的預防措施就能對事件進行有效的控制。
2.2 指標數據的獲取
對于所建立的模型而言其關鍵不僅僅在于預警模型的指標的建立和神經網絡的識別。其數據的獲取亦是十分關鍵的一步。根據各個數據的特點,整理各個指標數據獲取方式如下。
將廈門PX事件和昆明PX事件作為一個學習樣本,其數據清單如表3所示。
同樣將模型的預警目標――“寧波PX事件”作為目標數據,其數據清單如表4所示。
2.3 輸入數據的標準化處理
網絡輿情危機預警指標體系中有5個預警指標,其中存在定性指標和定量指標兩大類,并且對各個指標的數據進行了量化處理,然而各個指標的單位的量綱是不同的,為了能夠對各個指標進行對比評分 ,需要將它們進行標準化得到[0,1]無量綱指標。
量化的指標均有正負方向均有正負方向之分,自然這些數據的標注化方法均有不同:
1)正向指標處理:正向指標表示值越大越安全,危機等級越小無量綱化以最小值為基準,正向無量綱化處理方程:
2) 負向指標處理:負向指標在文章中表示指標值越小越安全,危機等級越小。無量綱化以最大值為基準,負向的無量綱化處理方程:
其中,X 表示量化后的指標值, [xmin]表示指標的最小值, [xi] 表示指標的實際值, [xmax]表示指標的最大值。
3 輿情預警模型的建立及結果
3.1 模型的建立
神經網絡模型是一個典型的“輸入-處理-輸出”的過程。輸入是采集到的指標的實際值,輸出是模型識別的結果,即預警的敏感度,而中間過稱則采用BP神經網絡模型進行學習計算,這部分相當于“黑匣子”。在處理的時候,該文采用三層BP網絡(一個輸入層、一個隱含層、一個輸出層)的網絡結構,那么輸入、輸出節點數分別是5和1[8]。
在設置完參數之后用第四章所講述的利用Matlab軟件完成模型的建立。
3.2 結果及檢驗
通過搜集得到的數據匯編成的學習樣本,并將其中的70%作為樣本,30%作為檢驗樣本進行。
通過計算可以得到該表,從該表中容易得到,學習過程中準確率達到了91.76%。并在測過程中抽取了5項進行預測,得到的準確率為92.31%,其較高的準確率。因此有理由認為該模型在未來的預測過程中其準確率應該達到90%以上。
4 研究結論
本文的研究結果表明:基于輿情量化指標的BP神經網絡能夠對網絡輿情信息進行較為準確的預警,無論是學習還是最后實踐的識別準確率都達到了80%以上。這種預警方法通過輿情信息的預警指標利用量化評價方法可以降低人為的主管臆斷,而實驗結果也表明了其擁有較高的識別準確率。并且利用Matlab進行編程得到的預警模型具有廣泛的應用前景和使用價值。模型可以為政府提供網絡輿情的預警,也為企業的網絡聲譽進行預警為企業的公關提供預警參考。
參考文獻:
[1] 薛圈圈.基于BP神經網絡的網絡輿情危機預警研究[D].江西:江西財經大學,2010:25-30.
[2] 戴媛.我國網絡輿情安全評估指標體系研究[D].北京:北京化工大學,2008:13-22.
[3] 袁越.廈門PX時間[OL].http://.cn/c/2007-09-27/165713986641.shtml.
[4] 王秀娟.昆明PX事件[N].中國石油石化,2013.
[5] 大公網.鎮海PX項目引發[OL].http:///mainland/node_13226.htm.
[6] 周子健.基于網絡搜索量的上海世博會國際影響力研究[J].藝海,2011(5):80-82.
美格是一家高端顯示器品牌,自1996年進入國內市場以來,依靠索尼的顯像管技術和華旗資訊等渠道的本土優勢在國內市場節節勝利,但是2001年上半年美格跟索尼的合作關系卻意外地破裂了,產品停頓,中國公司高層集體辭職,渠道陷于癱瘓,迫使美格不得不進行一系列大刀闊斧的改革。
2001年6月,美格現任執行副總裁俞翠薇走馬上任,8月15日,俞翠薇完成了對美格方向的思考,宣布啟動"美格啟程光電時代"計劃。目標有兩個:稀釋對上游技術提供商的過度依賴;重建渠道,增強對渠道的控制和把握能力。而渠道建設,是美格的重中之重,俞翠薇說:"如果一家企業沒有有效的神經網絡,就如同一個植物人,即便有人割下他身上的肉,鮮血淋漓,他也感覺不到。這是很危險的!"
斷線的風箏
日前,記者來到了美格北京事業平臺,赫然在目的LOGO卻是"北京廣深美科技有限公司"。據進進出出忙碌不已的廣深美員工介紹,作為廠商派駐的美格北京科技事業平臺一直就跟他們一起辦公,該派駐機構的總經理鄧偉同時就是廣深美的實際總經理。廠商派駐高管兼任渠道的總經理,渠道和企業派駐機構合一,倒是件新鮮事。
據美格北京事業平臺有關人員介紹,過去美格顯示器渠道推廣全權由總負責,美格自己幾乎不介入,結果帶來了一些意想不到的問題。俞翠薇認為以往的渠道在信息傳遞上存在著兩個致命的缺點:其一,信息傳遞過程中每多一個環節,畸變程度就會大幅度提高,結果廠商獲得的消息往往難以準確地反映市場狀況。同時,由于不同地區的總對美格的理解不同,他們在各自的區域市場上樹立了不同的品牌形象,處于一種諸侯割據的分散狀態,不利于建立統一的品牌形象。
其二,市場信息傳遞途徑的不可控和環節過多導致信息反饋很慢。作為一個顯示器廠商,之前美格并沒有直接接觸市場,除了通過媒體和其他一些渠道獲得市場信息外,渠道并不能反饋實時有效的市場信息。結果整個渠道體系就像是一個斷線的風箏,貨到渠道里后到底市場反應如何,貨物積壓多少,美格難以及時清楚了解。
美格怎樣才能最終做到跟商及用戶三者的一體化?并形成快速的市場反應能力--就如同人體的任何一部分碰到火時,不用等大腦知道皮膚被燒痛,就已經形成反射弧,并采取相應的動作?
美格公司的高層意識到,要形成這種快速的反應能力,公司就需要做出前所未有的創新。經過醞釀,美格首先推出了事業平臺的概念"事業平臺不是一個企業法人,是由美格各地的區域總與美格派駐的人員共同構成的一個業務和市場推廣平臺。"通過美格的常駐人員,美格可以統一其品牌形象,總也將獲得美格更大的支持。
事業平臺概念首先于2001年8月開始在廣東和華東地區試點。其由渠道方出資并擔任董事長、美格方介入具體經營管理、在保證渠道商最低利潤基礎上風險共擔的做法,贏得了有力的支持。現為北京事業平臺負責人的鄧偉,早在2002年1月被派往華東地區,開始做美格事業平臺的試點工作,經過短短4個月時間,華東地區就做到了美格產品全國銷量第一位。至今美格已經在全國擁有12個事業平臺。在渠道競爭最為激烈的北京,廣深美事業平臺建設進展不慢。
渠道創新
在顯示器行業,大多數企業直到今天仍沿襲著3層(甚至更多)的渠道體系(如圖1所示)。渠道體系層次越多,產品的渠道成本就會越高。
美格渠道改造的第一步是砍掉作為中間商的分銷商層次,要求各地區總直接面對裝機商,開始嘗試"連鎖直營+區域"的模式(如圖2所示)。
連鎖直營主要是由全國的美格專賣店和遍布全國的加盟店組成的。美格現在全國一共有150多家專賣店,店面統一的風格、產品價格、服務標準,對用戶產生了很強的視覺沖擊力,同時也能夠不折不扣地執行美格的活動計劃和渠道政策,不會出現原有渠道體系中渠道商執行力度不一的弊病。專賣店以及1500家加盟店,直接展示產品給消費者,是美格面對用戶的窗口,已經成為美格事業平臺與用戶之間的最佳通路。
專賣店之上的是稱為"事業平臺"的渠道管理機構。美格的事業平臺兼顧分公司與區域總的雙重色彩。在美格的事業平臺中,業務實施、渠道管理、物流體系、包括人員等各方面都有美格的人員親自參與。當地的合作伙伴在事業平臺中更多的是扮演投資方和企業行政管理者的角色。美格承諾的長遠利益和一定的投資回報率,獲得了合作方的信任;而美格則獲得了對渠道的絕對控制權,達到了廠商管理和渠道管理的統一。
跟傳統的顯示器渠道模式相比,美格的優點顯而易見:1.廠商與用戶之間的層次減少,大大加強了渠道反應能力和反饋速度。2.提高了商的利潤率。3.專賣店統一的形象促進了產品的銷售,加強了服務的力量。
在新的渠道體系中,美格派駐各地的人員被要求每天去各個賣場的專賣店和加盟店了解情況,并把數據發回給總部。通過他們,美格隨時可以了解到最新的市場狀況,包括實際銷售量、庫存、市場反應等。