前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經網絡的主要思想范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞: 計算機視覺; D像理解; 卷積神經網絡; 多層感知器
中圖分類號: TN915.63?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2017)14?0170?04
Abstract: The optical network is a lightweight, versatile and purely Matlab?based deep learning framework. The idea underlying its design is to provide an easy?to?understand, easy?to?use and efficient computational platform for deep learning research. The framework supports major deep learning architectures such as multilayer perceptron(MLP) networks, convolutional neural networks (CNN) and recurrent neural networks (RNN). The framework also supports the straightforward switch between both CPU and GPU for computation. The experiment result indicates that the framework has different applications in computer vision, natural language processing and robotic technology.
Keywords: computer vision; image understanding; convolutional neural network; multilayer perceptron
0 引 言
深層神經網絡[1]已經給出了許多機器智能問題的主要進展,最新的神經網絡模型的實現主要強調效率。這些框架可以由20萬~50萬行代碼組成,并經常涉及多個編程語言[2?4]。它需要付出巨大的努力來徹底理解和改進模型。一個簡單的和自我解釋的深層學習框架是高度預期的且加快深層神經網絡模型的理解和應用。
在此提出的光網絡是一個輕便的、通用的和純基于Matlab的深層神經網絡模型。簡潔、高效的Matlab編程技術已被用來實現所有的計算模塊。許多神經網絡流行的類型,如多層感知器、卷積神經網絡、神經網絡都在光網絡中得以實現,是結合隨機梯度下降的幾個變化(SDG)為基礎的優化算法。
自從光網絡僅用Matlab實現,主要的計算用幾百行代碼來矢量化和執行,數量級比現有的框架更簡潔。所有基本操作都可以輕松定制,只需有Matlab編程基本知識。數學化研究人員可以專注于數學建模的一部分而不是工程部分。
應用程序的用戶可以很容易地理解和修改任何部分的框架,開發新的網絡架構,使他們適應新的應用。除了簡單,光網絡還具有以下特點:光網絡包含最現代的網絡架構;計算機視覺中的應用、自然語言處理和強化學習已被證明;光網絡提供了一個綜合的優化算法的收集;光網絡支持在CPU和GPU之間計算的簡單切換;快速傅里葉變換來有效地計算卷積,從而使大卷積核被支持;光網絡自動化的超參數優化了新型選擇性的SGD算法。
1 模 塊
主要的計算模塊包括前饋過程和向后/反向傳播過程。前饋過程評估模型,反向傳播報告網絡梯度。隨機梯度下降算法是用來優化模型參數。
1.1 核心計算模塊
光網絡能夠專注于數學部分而不是低層次的工程細節。為了使本文更完備,在此說明光網絡中的主要計算模塊。本文的所有網絡和相關實驗都是建立在這些模塊的基礎之上。
1.1.1 線性感知器層
一個線性感知器層可以表示為y=Wx+b。在這里,x表示input_dim×1大小的輸入數據,W表示output_dim× input_dim大小的權重矩陣,b是一個output_dim× 1大小的偏置向量,y表示output_dim× 1大小的線性層輸出。
從線性感知器輸入映射到最終的網絡輸出可以表示為z=f(y)=f(Wx+b),f是一個非線性函數,它表示在更深層次的網絡的計算;z是網絡輸出,通常是一個損失值。
1.1.2 卷積層
卷積層由一個多維濾波器組kio將輸入特征圖Nmap_in映射到輸出特征圖Nmap_out。每個輸入特征圖xi與相對應的濾波器組kio進行卷積,卷積的結果是求和并添加偏置值Bo生成o?th輸出圖: 。允許使用大的卷積核,快速傅里葉變換(FFT)是用來計算卷積(及相關)。根據卷積定理[5],在空間域卷積等價于在頻域的逐點乘法。因此,ki*xi可以用傅里葉變換計算:ki*xi=F-1{F{ki}?F{xi}}。在這里,F表示傅里葉變換,“”表示逐點乘法運算,卷積層支持填充和跨越。
從o?th輸出特征圖到網絡輸出的映射可以表示為z=f(yo)。這里f是從o?th輸出特征圖yo到最終的網絡輸出的非線性映射。與第1.1.1節類似,,,需要在反向的過程中計算。
1.1.3 Max?pooling層
最大pooling層計算在窗口中的最大元素與步幅大小,一個定制的im2col_ln功能是實現轉換pooling補丁為列向量,來矢量化在Matlab中的pooling計算。內置的最大功能是這些列向量可以返回pooling結果和這些最大值的指數,然后,在原來的批量數據恢復相應指數。此外,零填充可應用于輸入數據。
不失一般性,從Max?pooling層輸入到最終的網絡輸出的映射可以表示為z=f(y)=f(Sx),其中S是選擇矩陣,x是一個列向量,它表示輸入數據到這層。
在反向的過程中,被計算并傳遞給淺層:。
當pooling范圍小于或等于該步長大小時,可以用Matlab中簡單的矩陣索引技術計算出。具體來說,與輸入數據相同大小的一個空的張量dzdx被創建。dzdx(from)=dzdy,from是pooling指數,dzdy是一個記錄pooling結果的張量。當pooling范圍大于步長大小時,x中的每一個條目都可以被匯集多次,并且反向傳播梯度需要為這些多個匯集條目積累。在這種情況下,計算可以利用Matlab自帶的功能accumarray()。
1.1.4 修正線性單元
修正線性單元(ReLU)作為一個主要的非線性映射函數被實現,一些其他的函數包括sigmoid和tanh這里的討論就省略了。ReLU函數是很獨特的函數,如果輸入大于0,則輸出0,否則y=ReLU(x)=x?ind(x>0)。在反向的過程中,如果輸入數據是非負的,則梯度傳遞到較淺層,否則,梯度被忽略。
1.2 損失函數
通常,一個損失函數會和最深核心計算模塊的輸出相連。目前,為了達到分類任務光網絡還支持softmax 中的LogLoss函數。
1.3 優化算法
隨機梯度下降(SGD)為基礎的優化算法是訓練深層神經網絡的主要工具。標準的SGD算法和它的一些流行的變型如adagrad[6],rmsprop[7], Adam[8],同樣實現了深度學習的研究。值得一提的是,在此實現了一個新的選擇性的SGD算法便于參數尤其是學習速率的選擇。
2 實 驗
2.1 多層感知器網絡
在MNIST數據上[9]構造一個多層感知器網絡來測試光網絡的性能。網絡從MNIST圖像數據集取得28×28輸入,在接下來的兩層分別有128個節點。然后,128維特征連接10個節點來計算softmax輸出。實驗結果見圖1。
和測試階段的損失和錯誤率
2.2 卷積神經網絡
在cifar?10數據[10]上由4個卷積層構建一個卷積網絡來測試光網絡的性能。此結構與來自MatConvNet的一個報告相同[3]。32,32,64,64在前三層有5×5大小的卷積核,最后一層有4 × 4大小的內核。ReLU函數應用到每一個卷積層之后作為非線性映射函數。光網絡自動選擇和調整學習速率并可以達到非常精確。與有固定的學習速率的SGD標準比較,選擇性SGD具有更好的精度。最重要的是,使用選擇性SGD避免手動調諧的學習速率。圖2為實驗結果。計算在一個Intel i5 6600K CPU和Nvidia Titan X GPU(12 GB內存)的臺式電腦上進行。當前版本的光網絡用這種網絡結構在GPU上每秒可以處理750個圖像,大約比使用的CPU速度快5倍。
2.3 LSTM網絡
長短期記憶(LSTM)[11]是一個流行的遞歸神經網絡模型。由于光網絡的通用性,LSTM網絡作為一個特定的應用程序可以在光網絡包中實現。值得注意的是,在光網絡中的核心計算模塊用于執行時域前向過程和反向傳播為LSTM。
在一個LSTM模型中的前向過程可以用公式表示為:
和測試階段的損失和錯誤率
優化LSTM模型,在LSTM中通過時間的反向傳播實現和計算最關鍵值:
采用一個關鍵的迭代屬性來計算上述值:
一些其他的梯度可以通過使用上述計算輸出的鏈規則計算:
LSTM網絡測試一個字符語言建模任務,該數據集由選自莎士比亞作品的20 000個句子組成,每個句子斷成67字(和標點符號),LSTM模型可以根據前一個字符預測下一個字符。網絡模型中使用30個隱含節點并且RMSProp用于訓練。在后10次訓練,下一個字符的預測精度提高到70%。
2.4 Q?網絡
作為強化學習中的應用,創建一個和MLP網絡一致的Q?network[12]。然后將Q?network應用到經典的Cart?Pole的問題中[13]。Cart?Pole系統的動力學可以在一個兩層網絡數百次迭代中學習到。對Q?network更新過程的一次迭代為:
式中,act是由概率ε隨機選擇的。所需的網絡輸出值Qnew是利用觀測到的reward和由此產生的狀態的貼現值γV(statenew)計算出來的,通過均衡器預測當前的網絡。通過使用最小平方損失函數:
3 結 論
為了深層神經網絡模型的理解與發展,光網絡提供了一個易于擴展的生態系統。在Matlab環境下,整個計算過程可以很容易地跟蹤和可視化。這些設置的主要功能可以對深度學習研究界提供獨特的便利。
⒖嘉南
[1] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks [J]. Advances in neural information processing systems, 2012, 25(2): 1097?1105.
[2] JIA Y, SHELHAMER E, DONAHUE J, et al. Caffe: Convolutional architecture for fast feature embedding [C]// Proceedings of the ACM International Conference on Multimedia. [S.l.]: ACM, 2014: 675?678.
[3] VEDALDI A, LENC K. Matconvnet: Convolutional neural networks for Matlab [C]// Proceedings of the 23rd Annual ACM Conference on Multimedia. [S.l.]: ACM, 2015: 689?692.
[4] BASTIEN F, LAMBLIN P, PASCANU R, et al. Theano: new features and speed improvements [J]. arXiv preprint arXiv, 2012, 20: 42?51.
[5] MALLAT S G. A wavelet tour of signal processing: the sparse way [J]. Academic press, 1998 , 31 (3) :83?85.
[6] DUCHI J, HAZAN E, SINGER Y. Adaptive subgradient methods for online learning and stochastic optimization [J]. The journal of machine learning research, 2011 (12): 2121?2159.
[7] TIELEMAN T, HINTON G. Lecture 6.5?rmsprop: Divide the gradient by a running average of its recent magnitude [J]. Neural networks for machine learning, 2012, 4 (2): 20?26.
[8] KINGMA D, BA J. Adam: A method for stochastic optimization [C]// Proceedings of the 3rd International Conference for Learning Representations. San Diego: [s.n.], 2015: 1412?1418.
[9] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [J]. Proceedings of the IEEE, 1998, 86(11): 2278?2324.
[10] KRIZHEVSKY A, HINTON G. Learning multiple layers of features from tiny images [M]. [S.l.: s.n.], 2009.
[11] HOCHREITER S, SCHMIDHUBER J. Long short?term memory [J]. Neural computation , 1997, 9(8): 1735?1780.
【關鍵詞】人工智能 醫學領域
1 引言
人工智能(AI)是上世紀50年展起來的新興學科,主要內容包括:知識表示、自然語言理解、機器學習和知識獲取、知識處理系統、計算機視覺、自動推理和搜索方法、智能機器人、自動程序設計等方面。在過去的幾十年里人工智能涌現出了大量的方法,大致可分為兩大類:第一類是基于Newell和Simon的物理符號系統假說的符號處理方法。這種方法大多采用從知識階段向下到符號和實施階段的自上而下的設計方法,第二類是采用自下而上設計的“字符號”方法。
2 人工智能的發展
全球對人工智能的研發經歷了已經有70年的發展,從上個世紀的50年代開始一直到今天,歷經了兩次大起大落,但伴隨著深度學習的重燃、龐大的大數據支撐以及計算能力的不斷提升和成本的不斷下降這些因素的出現,尤其是在摩爾定律、大數據、互聯網和云計算、新方法這些人工智能進步的催化劑作用下,將迎來人工智能新的春天。
3 人工智能在醫學領域上的應用
3.1 在神經網絡中人工智能的應用
在醫學診斷中人工智能的應用會出現一些難題,例如知識獲取比較難、推理速度慢、自主學習以及自適應變化能力弱。研究人腦連接發現了以人工神經為特點可以解決在獲取知識中所出現的瓶頸和知識種類繁瑣問題,能夠提高對知識的推理能力,包括自主學習,自組織等方面的能力,促進了神經網絡在醫學專家系統中的快速發展。
人工智能領域ANN,有不同于其他人工智能的方法,在傳統的結構上,它只是AI分支中的一個,只能通過邏輯符號來模擬人腦的思維方式,進一步來實現人工智能,與之相比,不同的ANN是學習和訓練為一體來達到智能的。ANN具有學習的能力及特殊方法,用戶不用編寫復雜的程序來解決所遇到的問題,只用提供有效的數據就可以完成。迄今為止,醫學領域中對大部分的病理原因無法解釋,無法確定病理原因,加上各種疾病的表現種類復雜多變。在醫學的日常實踐中,疾病相應的治療只能以經驗為基礎來判斷。所以,ANN有著記憶,學習和歸納總結為一體的人工智能服務,在醫學領域有很好的應用發展趨勢。
3.2 在中醫學中人工神經網絡的應用
在中醫學中,所提出的“辨證論治”中的“證”具有模棚性、不確定性的特點,主觀性比較強,因此中醫的診斷方法和治療手段與醫師的經驗水平有很大聯系。數年來在實驗研究,臨床觀察,文章整理,經驗總結上,都有著對“證”的研究思想的深入調查。一部分“辨證”的過程可以用人工神經網絡來替換使用。恰當的中醫癥狀可以作為基本輸入和適當人工神經網絡模型,人工神經網絡能夠根據以往的學習“經驗”來進行綜合分析,從而提出中醫診斷方法。
由神經元結構模型、網絡連接模型、網絡學習算法等幾個要素組成了人工神經網絡。具有某些智能系統的功能。 按照網絡結構來劃分,人工神經網絡有很多不同的種類,例如感知器、BP網絡、Hopfield網絡等,目前應用最為廣泛的神經網絡就是其中的BP網絡。這種前沿網絡非 BP網絡所屬,網絡的結構與權值能夠表達復雜的非線性 I/0映射關系。憑借 BP網絡優良的自主學習功能,既可以通過誤差的反向傳播方法,對照已知樣本反復進行訓練,也可以調整網絡的權值,直到網絡的 I/0關系在某一塊訓練指標下最接近樣本為止。
3.3 人工智能在臨床醫療診斷中的應用
計算機編寫的程序主要根據專家系統的設計原理和方法來模擬醫生的醫學診斷,以及通常治療手段的思維過程來進行。醫療專家系統是臨床醫療診斷中人工智能的很好體現,不僅能夠處理較為復雜的醫學治療問題,還能當做醫生診斷疾病的重要工具,更重要的是傳承了專家們的寶貴醫學治療經驗。
3.4 人工智能技術在醫學影像診斷中的應用
目前,在醫學影像中存在著的問題,比如:誤診率高、缺口大。這些問題需要通過人工智能的方法來解決。在醫學影像技術領域人工智能的應用包括主要的兩個方面,分別是:第一個方面為圖像識別,第二個方面為深度學習,其中人工智能應用最核心的部分實深度學習。這兩個部分都是基于醫學影像大數據所進行的數據上的挖掘和應用。這兩個方面所進行的數據挖掘及其應用都是依據醫學影像大數據來完成的。
Geoffrey Hinton教授是神經網絡領域的大師,2006年,他與其博士生在《Science》和相關的期刊上發表了論文,第一次提出了“深度信念網絡”的概念。2012年,由斯坦福大學Fei-Fei Li教授舉辦的ImageNet ILSVRC大規模圖像識別評測任務是由Hinton教授的研究團隊參加的。這個任務包括了120萬張高分辨率圖片,1000個類比。Hinton教授團隊使用了全新的黑科技多層卷積神經網絡結構,將圖像識別錯誤率突破性地從26.2%降低到了15.3%。 這個革命性的技術,讓神經網絡深度學習以迅速的速度進入了醫療和工業的領域范圍,隨后這一技術被陸續出現的醫療影像公司使用。例如:國際知名的醫學影像公司Enlitic和國內剛剛獲得有峰瑞資本600萬天使輪融資的DeepCare。都是不斷積累大量影像數據和診斷數據,繼續對神經元網絡進行深度的學習訓練,從而有效的提高了醫生診斷的準確率。
人工智能不僅能使患者的健康檢查快速進行,包括X光、B超、核磁共振等。另外還能大量減少醫生的讀片時間,提升了醫生的工作效率,降低誤診率。
4 總結
人工智能軟件工作效率遠遠超過了人類大腦,不僅能夠更快速的找到數據的模式和相似性,還能有效幫助醫生和科學家提取重要的信息。隨著人工智能的發展及其在醫學領域的逐漸普及和應用,兩者的互相融合在未來必定成為醫學發展的重要方向。
參考文獻
[1]馮伍,張俊蘭.人工智能在醫學上的應用[J].電子設計工程,2010(01).
[2]楊琴,陳家榮.人工智能在醫學領域中的應用[J].科技風,2012(12),100-101.
[3]王宇飛,孫欣.人工智能的研究與應用[J].信息與電腦,2016(05).
[4]鉛筆道.人工智能與影像診斷相結合的醫生界阿爾法狗,2016(03).
關鍵詞:計算機工程;視覺領域;深度學習技術
引言
計算機視覺簡言之即是依靠電子設備成像來代替生物視覺系統,隨后依靠提前寫好的程序對獲取的圖像信息實施處理。該技術的短期應用目的在于完成相對簡單的智能視覺工作,而深度學習技術在計算機視覺領域的應用,在很大程度上豐富了其功能,提高了識別效率,讓其能夠在更多行業發揮出自身價值。
1計算機視覺領域的深度學習技術
1.1圖像分類中的深度學習技術
基于深度學習技術,卷積神經網絡得到了進一步的發展,其應用范圍也更為寬泛,例如說在圖像分類中的運用。圖像分析需要對圖像實施掃描分析,隨后對其具體類別予以劃分,更加注重其整體語義。目前相對普遍進行圖像分類的數據集為ImageNet,其中囊括了非常豐富的內容,存儲了近1500萬個圖像的URL并將圖像劃分為數萬余個類型。ImageNet每年組織開展的大規模視覺識別挑戰賽(ILSVRC)中,圖像分類算法與技術也不斷創新,圖像分類的準確性也持續提升。ImageNet數據集表現出規模大、類型多的突出特點,所以更加適用于遷移學習,即是把部分核心技術或結構拓展應用到各個領域,對于視覺領域的深度模型來說,能夠把模型內的網絡結構和參數直接共享到其他數據集,從而對數據實施微調。圖像分類屬于計算機視覺領域最為基礎的環節,對于圖像分類模型創建和數據分析處理經驗也能夠遷移應用到其他領域中。
1.2目標檢測中的深度學習技術
目標檢測相對于圖像分類而言表現出更多的復雜性,主要任務是在囊括多種不同類型物體的圖像內精確定位和識別某一物體,恰恰是出于這一目的,深度學習技術在目標檢測中的應用更為復雜,要實現更加精準的效果也相對更難。近年來針對目標檢測的算法日益更新,如優化后的R-CNN算法,是借助于卷積神經網絡思想,對物體進行分類,提取物體特征。而SelectiveSearch算法的出現有了進一步的創新和突破,有效促進了檢測準確性的提高,這也給通過卷積神經網絡進行目標檢測帶來了更多可能性,隨后的FastR-CNN算法極大地促進了目標檢測效率的提升,該算法對提取候選區的問題予以優化,大大減少了候選區提取和目標檢測過程的時間。目標檢測網絡以FastR-CNN算法作為支撐,于輸出位置設置滑動窗同時和候選區域網絡實施連接,目標檢測的關鍵在于卷積神經網絡,依靠它把各個點的特征進行提取,再借助回歸算法獲得對應范圍出現目標的概率[1]。
1.3人臉識別中的深度學習技術
人臉識別主要是借助相應算法對人臉特征實施提取,因為其建立的人臉模型表現出一定的不穩定性,因此模型建立往往也表現出一定的難度,相對于建立剛體模型而言更為困難。人臉識別通常來說涉及人臉檢測定位以及特征提取兩個方面,人臉檢測定位是基于背景圖像中將人臉目標分割出來,實施歸一化處理,而人臉特征提取算法不變。前者存在的技術難點是人臉目標具有多樣性以及背景圖像具有復雜性,所以對背景情境實施合理假設并予以簡化是十分關鍵的。與此同時,高維空間人臉模型的建立較為復雜,精確度估算難度較大,人臉特征提取的技術難度是因為人臉屬于彈性模型,其難度超過剛體模型。一般來說,較為常見對人臉特征實施提取與識別的方法有幾何特征法、特征臉算法以及彈性模型法,CNN算法和過去的特征提取算法比起來表現出更高的穩定性和適用性,同時能夠有效抵抗外部干擾,促進人臉識別技術的推廣應用。
2應用實例
2.1安防領域的應用
深度學習技術在計算機視覺領域中的應用可以為安防行業提供更佳的解決方案,比如說人臉識別技術的應用,很多大型企業如Facebook、騰訊、阿里巴巴等都將非常關注和重視。作為深度學習技術在計算機視覺領域應用的重要內容,人臉識別在安檢以及反恐等領域中也能夠發揮出很好的效果。與此同時,對行人角度的REID技術實施研究,依托于深度學習強化目標檢測,對目標特征實施提取和刻畫,能夠為異常行為監控和跟蹤帶來支持[2]。
2.2無人駕駛領域的應用
對于無人駕駛領域來說,選擇激光或雷達這類傳感器的成本更高,基于深度學習的計算機視覺技術也能夠提供新的解決方案。依靠攝像機對視頻畫面進行采集,對獲取到的圖像實施分析,提供類似于前車碰撞預警等功能。在這一過程中,計算機視覺技術可以實現對目標的檢測識別、對目標車輛的跟蹤分析、對車道線是否偏離進行檢測等。基于深度學習技術的檢測識別表現出更加強大的優勢,現階段深度學習芯片日益增多,對于無人駕駛技術的發展也帶來了更加有力的支持。
2.3智能家居領域的應用
過去的很多智能家居產品一般都是依靠智能手機藍牙或者WiFi等途徑來實現對家居產品的控制,這一方案即便能夠做到家居智能化,但其水平依舊有待提高。基于深度學習技術,能夠有效促進智能家居行業的更新發展,除開語言、語音識別之外,還能夠利用計算機視覺技術實現人際交流與互動,比如說手勢識別控制。2.4教育領域和圖片搜索領域的應用基于深度學習的計算機視覺技術也能夠在智慧教育中得以普及應用,如近年來很多新的拍照解題App,使用者只需要利用手機相機拍照上傳即可獲得相關題目的分析解答,促進學習者學習效率的提升。此時視覺技術包括了對文字的檢測與識別,另外針對個人簡歷識別、文檔識別等方面也能夠進行拓展應用。同時計算機視覺技術還可以在圖片搜索領域中得以應用,使用者通過拍攝上傳相應的圖片,即可從數據庫中找出與原圖相似的圖片,深度學習屬于一種非常高效的技術手段,能夠提供更加快速高效的圖像檢測功能,結合圖像搜索引擎,為用戶帶來更加便捷的服務[3-5]。
2.5醫療影像數據中的應用
醫學影像直接關系到對患者疾病診斷的準確性,對于放射科的醫務人員來說,依靠醫學影像能夠促進診斷效率的提升。現階段國內外諸多醫學專家隊伍,在心血管、腫瘤、神經內科以及五官科等都建立了精準深度學習模型,極大地推動醫療水平的提升,為廣大患者帶來了更加便捷和高效的醫療服務。基于深度學習技術的計算機視覺在醫療影像數據中的應用主要集中在如下幾個方面:(1)能夠提供臨床診斷輔助等醫療服務;(2)依靠數據分析技術,能夠在很大程度上促進醫療機構經營管理水平的提升;(3)在醫學影像中的應用,能夠讓醫務工作者更加直觀便捷地獲取患者影像;(4)深度學習技術能夠為醫療大數據的可視化帶來便利;(5)在藥企研發工作中的應用,可以處理好過去一直以來藥物研發周期長和成本居高不下的問題;(6)在健康管理領域中的應用,借助于可穿戴設備來對個人健康數據實施監測,進而對疾病風險予以提前預測。
關鍵詞:諧波電流;電力系統;檢測
一、引言
近年來,隨著電力電子技術的迅速發展,各種新型電力電子器件相繼進入市場,隨之而來的諧波污染日益嚴重,由電網諧波引起的電能質量問題也日益受到重視,采用有源電力濾波器已成為諧波補償的一種重要趨勢。其基本原理是從補償對象中檢測出諧波電流,由補償裝置產生一個與該諧波電流大小相等,極性相反的補償電流與其相抵消,其中,諧波電流的正確檢測是決定補償效果的重要環節。下面就分別論述一下目前這幾種諧波電流檢測方法。
二、諧波電流的檢測方法
(一)模擬濾波器
模擬濾波器的實現方法是:當信號不含低于基頻的次諧波時采用低通濾波器,當信號含有次諧波時采用帶通濾波器來獲得基波分量,用減法從信號中減去基波分量就得到分量。該方法具有簡單快速的優點,但是這種檢測方式有很多缺陷:對環境的依賴較高,當,電網頻率波動或濾波器的元件參數變化時效果變差:無法分離出基波中的有功與無功分量;當諧波頻率與基波接近時,濾波器的歸一化截止頻率很小,波動特性很差;特別是當基波頻率不固定而在較大范圍波動時,濾波器設計非常困難。
(二)Fryze有功電流檢測
其原理是將負載電流分解為與電壓波形一致的分量,將其余分量為廣義無功電流(包括諧波電流)。它的缺點是:因為Fryze的功率定義是建立在平均功率基礎上的,需要一個周期的積分,有至少一個周期的延時,不適于負載變化頻繁的場合。而且只能同時檢測出諧波及無功電流,不能只檢測諧波電流或只檢測無功電流,有很大的局限性。
(三)基于FFT的諧波電流檢測
離散傅立葉變換DFT(DiscreteFourierTransform)在實際中非常重要,利用它可以計算信號的頻譜、功率譜和線性卷積等。但是當N很大時,DFT的計算量太大,這樣使DFT的應用受到限制。1965年J.W.Colley和J.W.Tukey提出快速傅立葉變換,大大減少了計算量。FFT并不是DFT的另一種變換,而是為了減少DFT計算次數的一種有效的快速算法。基于FFTDE 的諧波電流檢測,是一種建立在傅立葉分析基礎上的數字化分析方法。其工作原理如圖1—2所示。其中i1表示負載電流,ic表示檢測所的諧波電流。
圖1的工作原理是:在同步脈沖作用下將模擬信號進行離散化處理,通過模擬轉換器變為數字量,再用數字分析的方法,快速傅立葉變換(FFT)進行處理,最后得到各次諧波幅值和相位系數,經過低通濾波器(LPF)檢測出所需要的信號,對于檢測出的信號作FFT反變換即得補償電流信號。如果需要得到其模擬量,需要用到
數摸轉換器再把數字量轉化為模擬量。采用這種方法需要有高精度的數摸轉換器,同時要求輸入信號有較高的信噪比。基于傅立葉的數學化分析方法,要求被補償的波形是周期變化,否則會帶來較大的誤差。這種方法的優點是可以選擇擬消除的諧波次數,缺點是具有較長的時間延遲,實時性差,存在柵欄效應和泄漏現象,使得算出的信號參數:頻率、幅值和相位不準,尤其是相位誤差很大,無法滿足準確的諧波測量要求。
(四)同步檢測法
對于同步檢測法用于不平衡三相系統中無功和諧波電流的補償,其基本思想是分別考慮各相情況,并把補償分量分配到三相中,統一確定各相補償電流。但是由于該檢測法實現根據總平均功率確定補償后電流,再計算出補償指令電流,而在計算補償后電流時,不僅需要知道三相電路的平均功率,還需要知道每個相電壓的幅值,因此檢測過程中的延遲較大,也僅適用于三相電壓均為正弦波的情況,若電壓波形存在畸變,必將影響檢測精度。
(五)基于瞬時無功補償理論的檢測方法
(1)瞬時無功功率的基礎理論。三相電路瞬時無功功率理論首次于1983年由赤木泰文提出,以后該理論經過不斷研究逐漸完善。赤木泰文最初提出的理論亦稱pq理論,是以瞬時實功率p和瞬時虛功率q的定義為基礎,其主要一點不足是未對有關的電流量進行定義。下面介紹以瞬時電流ip和iq為基礎的理論體系。設三相電路各相電壓和電流的瞬時值分別為 va、vb、vc和ia、ib、ic。分別為分析問題方便,把它們變換到α-β兩相正交的坐標系上研究。由下面的變換可以得到α、β兩相瞬時電壓vα、vβ和α、β兩相瞬時電流iα、iβ。嚴格地講,基于瞬時無功功率理論的諧波電流檢測法僅適用于三相三線制、電源電壓為三相對稱無畸變、三相負荷平衡的負載諧波電流的檢測。所以,在有源電力諧波濾波器設計中必須針對具體電網和負載的特點采取相應措施來消除或減小各種不利因數的影響:①變流器盡可能采用三相三線制接法的橋式電路,從而避免零序電流的存在。②如果只需要諧波電流的檢測,則只要一組與電源同頻率的三相對稱正弦電壓,此電壓不必是負荷的實際供電電源電壓。因此,為了避免變流器網側電源電壓波形畸變嚴重,可采取下列措施之一:A、三相電源電壓經過低通濾波器濾除高次諧波后再參與諧波電流的檢測運算,此時要求三相所用的低通濾波器特性一致;B、運用鎖相技術產生三相正弦電壓,再參與瞬時諧波電流的檢測運算。
二、結語
本文從理論上對有源電力濾波器的實現技術和控制策略進行研究,提出了以上幾種有源電力濾波器諧波電流的檢測方法。由于這幾種檢測方法在應用中都有其局限性,因此,針對有源電力濾波器的檢測技術和控制策略還需要做進一步的探索。隨著計算機運算速度的提高和高速微處理器(DSP)的出現,為控制系統的數字化奠定了基礎。有源電力濾波器要求其控制電路必須能完成實時檢測、計算并做出決策,這就為計算機開辟了嶄新的應用領域,必將為有源電力濾波器的實用化發揮越來越重要的作用。
參考文獻:
[1] 吳競昌.供電系統諧波.北京: 中國電力出版社,1998
[2] IEC1000-3-2, Electromagnetic Compatibility-Part 3: Linits-section 2:Limits for harmonic crrentemissions (equipmentinputcurrent <16A per phase)[s].March,1995
[3] 中國國家標準GB/T14549-93. 電能質量公用電網諧波 . 中國標準出版社 ,1994
[4] 肖國春等. 電能質量控制技術的發展. 江蘇機械制造與自動化,2001年第1期
論文摘要:當點擴展函數未知或不確知的情況下,從觀察到的退化圖像中恢復原始圖像的過程稱為圖像盲復原。近年來,圖像盲復原算法得到了廣泛的研究。本文在介紹了盲圖像恢復算法的現狀的基礎上進一步研究其的發展方向。
一、引言
圖像恢復是圖像處理中的一大領域,有著廣泛的應用,正成為當前研究的熱點。圖像恢復的主要目的是使退化圖像經過一定的加工處理,去掉退化因素,以最大的保真度恢復成原來的圖像。傳統的圖像恢復假設圖像的降質模型是己知的。而許多情況下,圖像的降質模型未知或具有較少的先驗知識,必須進行所謂的盲恢復。其重要性和艱巨性而成為一個研究熱點。目前所能獲取的觀測圖像是真實圖像經過觀測系統成像的結果。由于觀測系統本身物理特性的限制,同時受觀測環境的影響,觀測圖像和真實圖像之間不可避免地存在著偏差和失真,稱觀測系統對真實圖像產生了降質。圖像恢復的目的就是根據降質的觀測圖像分析和計算得出真實圖像。
二、圖像盲恢復算法的現狀
總體來說,圖像盲復原方法主要分為以下兩類:一是首先利用真實圖像的特別特征估計PSF,然后借助估計得到的PSF,采用經典的圖像復原方法進行圖像的復原。這類方法將PSF的估計與圖像的復原過程分為2個不同的過程,因而具有較少計算量的特點;二是PSF辨識和真實圖像估計相結合,同時辨識PSF和真實圖像。這類算法較為復雜,計算量較大。另外,對于點擴展函數也考慮了空間變化的復雜情況。針對目前的盲復原算法的現狀,根據退化模型的特點,重新將算法分為空間不變的單通道盲復原算法、空間不變多通道盲復原算法和空間變化圖像盲復原算法3類。
(一)單通道空間不變圖像盲復原算法
在這類算法中,最為常用的是參數法和迭代法。
1)參數法。所謂參數法,即模型參數法,就是將PSF和真實圖像用某一類模型加以描述,但模型的參數需要進行辨識。在參數法中,典型的有先驗模糊辨識法和ARMA參數估計法,前者先辨識PSF的模型參數,后辨識真實圖像,屬于第1種類型的圖像盲復原算法,因而計算量較小;后者同時辨識PSF和真實圖像模型參數,屬于第2種類型圖像盲復原算法。
2)迭代法。所謂的迭代法,不是通過建立模型而是通過算法的迭代過程,加上有關真實圖像和PSF的約束來同時辨識PSF和真實圖像的方法。迭代法是單通道
圖像盲復原算法中應用最廣泛的一類算法,它不需建立模型,也不要求PSF為最小相位系統,因而跟實際更為接近。在這類算法中,迭代盲復原算法(IBD),基于非負性和決策域的遞歸逆濾波器算法(NAR2RIF),基于高階統計特性的最小
熵算法等最為典型。
(二)多通道二維圖像盲復原
多通道二維圖像盲復原,這類方法將數字通訊領域應用的一維多通道盲原分離算法擴展到二維情況并用于圖像的盲恢復。這類算法中有兩種代數方法,一種是先辨識模糊函數,再采用常規的恢復算法進行復原;另一種是直接對逆濾波器進行估計。此類算法的優點在于不需對初始圖像進行估計,也不存在穩定性和收斂性問題,對圖像以及模糊函數的約束是松弛的,算法具有一般性。但是第1種算法要求采用復原算法具有收斂性;第2種算法對噪聲敏感。
(三)空間改變的圖像盲復原方法
在許多實際的應用中,模糊往往是空間變化的,但由于處理工作的難度,目前的研究較少,基本有相關轉換恢復和直接法兩類。
相關轉換恢復的基本思想是區域分割,即將整幅圖像分為若干局部區域,然后假設在各個局部區域模糊是空間不變的,利用空間不變的圖像復原有關算法進行復原。這類方法都是基于窗口的模糊辨識技術,圖像的估計取決于窗口的大小,由于模糊參數是連續變化的,在范圍較大時空間不變的假設是不成立的,因而模糊的估計精度較差,而且這種方法只能針對部分空間變化的模糊進行處理,缺乏通用性;其次在區域的邊上存在振鈴現象。
直接法的基本思想是直接對圖像進行處理。如采用簡化的二維遞推卡爾曼濾波器進行圖像模型和模糊模型的直接轉換方法,其缺點是只能針對有限的模型,而且模型數增加,計算量會顯著增大;采用共軛梯度迭代算法,但只見到一個31×31的文本圖像處理的結果報道,對于大圖像處理效果尚需進一步的研究;將空間變化圖像系統建立成馬爾苛夫隨機模型,對復原過程,采用模擬退火算法進行最大后驗估計的方法,這種方法避免了圖像的窗口化,并能克服模糊參數不連續性造成的影響,但這種方法只能局限于將模糊過程建立成單參數的馬爾苛夫隨機模型的情況,而且計算量也較大。
三、圖像盲恢復的應用前景
(1)現有算法的改進以及新的算法研究。現有各種算法還存在許多不足,有必要對算法進一步改進。如IBD算法中,如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復的質量;如何選擇濾波器中的噪聲參數才能減少噪聲的影響。又如NAR2RIF算法中,如何進一步解決噪聲敏感問題,支持域的確定以及如何將算法擴展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復原問題,也是今后研究的熱點。
(2)基于非線性退化模型的圖像盲復原算法。在實際應用中,嚴格來講,所有的退化模型都是非線性的。對模型采用線性化的方法進行近似處理,雖然算法簡單,但對非線性嚴重的情況處理效果并不理想。基于多項式以及神經網絡兩種參數模型處理非線性信號盲分離算法,算法擴展到二維圖像情況需要進一步研究。研究基于非線性退化模型的圖像盲復原算法也是下一步研究方向之一。
(3)去噪處理算法研究。加性噪聲的存在,使圖像的復原問題變成了一個病態問題,而且由于一般假設只知道噪聲的統計特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復的效果并不理想,結合降噪的圖像盲恢復的算法研究有很現實的意義,這方面也進行了部分工作。為克服噪聲的影響,一般采用先進行降噪,后進行復原;二是將降噪和復原同時進行這兩類方法。目前,大多數算法中將噪聲描述成高斯噪聲進行研究,在實際應用時有較大局限性。對于非高斯情況的研究采用基于噪聲的高階統計特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進行降噪,利用自組織映射的非線性獨立組件分析方法進行圖像降噪處理算法。
(4)實時處理算法。算法的的復雜性是制約算法應用的一個重要方面。可采用正則化的離散周期Radon變換的方法將二維的卷積轉化為一維進行處理,以提高算法的速度;也可采用神經網絡的實時處理算法。算法的實時性是算法實際應用的先決條件。
(5)應用研究。算法的應用是推動算法研究的動力。雖然圖像盲復原算法在天文學、醫學、遙感等方面獲得了較大的應用,但將算法應用到一般的工業圖像實時檢測、機器視覺、網絡環境下的圖像傳輸恢復、刑事偵破等方面還有大量的工作要做。
參考文獻:
[1]薛梅,楊綠溪.用于含噪二值圖像的改進NAS-RIF圖像盲復原算[J].數據處理.2006.17.(2).