1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁 > 文章中心 > 卷積神經網絡實現過程

卷積神經網絡實現過程

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇卷積神經網絡實現過程范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

卷積神經網絡實現過程

卷積神經網絡實現過程范文第1篇

關鍵詞:手寫數字識別;卷積神經網絡;應用

手寫體數字識別在郵政、金融等領域應用廣泛。對于數字識別,人們往往要求識別器有很高的識別可靠性,數字識別的錯誤所帶來的影響比文字識別等其他識別所帶來的影響更大,特別是有關金融方面的數字識別錯誤所帶來的后果是無法想象的,識別錯一個數字,這其中的差距可能是幾的差距,也可能是幾十、幾百的差距,這些都還是小問題;但更有可能這一個數字代表的差距是幾萬、幾千萬甚至幾億乃至更多,那么這個錯誤造成的損失就無法估量了。因此,O計出有著高可靠性與高識別率的數字識別系統已經成為了字符識別領域一個非常重要的環節。

1 網絡模型和數據庫及學習算法的選擇

1.1 關于Mnist數據庫的介紹

首先,Mnist是NIST數據庫的一個優化子集。它是一個有著60000個訓練樣本集與10000個測試樣本集的手寫體數字數據庫。此數字庫一共有4個文件。

此數字庫的所有樣本集都有圖像文件以及標簽文件。標簽文件的作用是用來儲存樣本集中的每個樣本的數值標簽,而每一個樣本的圖像數據信息則是由圖像文件存儲著。此數據庫的圖像數據均保存在二進制文件之中,且每個樣本圖像的大小均為28*28。

1.2 數字識別的模型選擇

手寫體數字雖然只有0~9十個數字,但由于寫法因人而異,不同地域同樣一個數字有多種不同的寫法,每個人都有自己的書寫習慣。且一些紙質差異、筆畫粗細、光線問題、位置、尺度大小等等多種因素都能對輸入產生影響。考慮到這些因素,為讓網絡有良好的識別能力,我們這里采用在圖像識別領域有著優秀表現的卷積神經網絡作為此數字識別系統的訓練模型。

1.3 學習算法的選擇

一個優秀的網絡模型必須具備良好的學習算法,每個學習網絡都有著相對來說較為合適自己的學習算法,而并不是說越高端的算法就越好。在此文中,我選擇的學習算法是較為成熟的BP算法。此算法在文字前面有些許介紹,此處不再多做說明。

2 基于卷積神經網絡的數字識別系統的設計

2.1 輸入層以及輸出層設定

根據樣本的特征與此網絡的網絡結構,可以大概判斷出輸入層與輸出層該如何設置。隱含層的個數可以是一個,也可以是多個,這與要分類的問題有關。

前文提及到在mnist數據庫中,所有的圖像都是28*28大小的,且以整個圖片的像素形式存儲在數據文件之中。每張圖像大小為28*28,故一個圖片像素點個數為784個。這里,卷積神經網絡的輸入即為這784個像素點。

因為數字識別需要識別的是0~9這十個數字,即需要識別十種字符類別,所以將這個神經網絡輸出層的神經元節點數設置為10。

2.2 網絡的中間層設置

卷積神經網絡的中間層有兩個部分,即卷積層(特征提取層)與下采樣層(特征映射層),由第二章中圖2-1所示,C1、C3為卷積層,S2、S4為降采樣層。

1)激活函數選擇

激活函數選擇sigmoid函數。同樣,在第二章有所提及。Sigmoid函數是嚴格遞增函數,能較好的平衡線性與非線性之間的行為,比較貼近生物神經元的工作。相比于其他函數,sigmoid函數還存在著許多優勢,比如光滑性、魯棒性以及它的導數可以用它自身來表示。

sigmoid函數為:

(1)

其中,x為神經元凈輸入。

激活函數導數為:

(2)

2)卷積層設計

圖像經過卷積核對特征圖進行卷積,之后再經過sigmoid函數處理在卷積層得到特征映射圖。特征映射圖相比于原圖像,其特征更為明顯突出。

卷積運算其實就是一個加權求和的過程。離散卷積是本文所選取的方法,規定卷積核在水平和豎直兩個方向每次都是移動一個像素,即卷積的步長為1。

3)下采樣層的設計

根據圖像局部相關性這一原理,為了降低網絡的學習維度、減少需要處理的數據量且保留圖像的有用信息,可以對卷積后的圖像進行下采樣。這里,我們采取的是取卷積層4個像素點平均值為下采樣層的一個像素點的方法。這樣可以降低網絡規模。

2.3 網絡總體結構CNN-0

根據LeNet-5結構,再結合上文中的對輸入層、輸出層、中間層的設計,完成了如圖3-1所示的基本網絡結構:

相比于LeNet-5,CNN-0做了一些修改,并非完全按照LeNet-5網絡結構模型。Sigmoid函數是本網絡中的激活函數,選擇這個函數的好處在于可以讓所有層得到的輸出都在區間[-1,1]之內。網絡訓練的學習率固定值為1或者是衰減的學習速率。經過卷積后的一維向量與輸出層沒有沿用LeNet-5的徑向基函數網絡,而是采取全連接方式,省去了F6層。

3.3 卷積神經網絡訓練過程

在模式識別中,學習網絡有無指導學習網絡與有指導學習網絡兩個類別。無指導學習網絡一般是用來進行聚類分析,本文采取的是有指導學習網絡。

卷積神經網絡其實就是從輸入到輸出的一種映射,它可以學量的映射關系,只需要用現有的模式對網絡進行訓練,網絡就能具備映射能力。而不需要輸入與輸出之間的精確的關系。

訓練算法與傳統的BP算法相差無幾(BP算法在第二章有做概述),主要可分為四個步驟,而這四個步驟可以歸為向前傳播階段與向后傳播階段:相前傳播:

1)隨機的從樣本集中獲取一個樣本(A, ),然后將A輸入至網絡中;

2)根據公式(3)計算出實際輸出:

(3)

向后傳播:

1)計算和理想輸出之間的差;

2)根據極小化誤差方法調整權值矩陣。

結語

在手寫數字識別這一塊,相對來說比較有難度的應該就是脫機自由手寫字符識別了,不過本文所研究的并不是這一系統,本設計是一個基于卷積神經網絡的手寫數字識別系統,因卷積神經網絡的局部感受野和降采樣以及權值共享、隱性特征提取等優點,它在圖像識別領域得到了非常廣泛的應用。此程序是在Caffe這個框架上進行運行的,操作系統為Linux系統ubuntu14.04版本。Caffe是一個開源的深度學習框架,也可以說是一個編程框架或者模板框架,它提供一套編程機制。因此,本文所需要實際的卷積神經網絡就可以根據這個框架來進行構建。

參考文獻:

[1]張偉,王克儉,秦臻.基于神經網絡的數字識別的研究[J].微電子學與計算,2006年第23卷第8期.

卷積神經網絡實現過程范文第2篇

【關鍵詞】視頻 行為識別 檢測

近年來,各種視頻監控越來越深入我們的生活中。因其實時性、直觀性以及設備成本日益降低在各行各業中而倍受青睞。但視頻監控系統還是依靠人工來控制,沒有進入數字化的全天實時監測、智能分析圖像數據。要實現完全數字化的監控的關鍵在于人體行為的智能識別。

早些時候有人提出并且應用了智能圖像識別的卷積神經網絡,它是在原始的輸入中應用可訓練的濾波器和局部鄰域池化操作,來得到一個分級的且逐漸復雜的特征表示。實踐表示,采用合適的規則化項來訓練,它可以達到非常好的效果。比較好的地方是對姿勢、光照和復雜背景存在不變性,單只受限在2D輸入的舞臺。本文文章提出了一個新的3D卷積神經網絡模型,用于運動識別。該模型可以從空間和時間的維度提取特征,然后進行3D卷積,以捕捉從多個連續幀得到的運動信息。為了有效的綜合運動信息,文中通過在卷積神經網絡的卷積層進行3D卷積,以捕捉空間上、時間上的維度,讓其都具有區分性的特征。

3D卷積是通過堆疊多個連續的幀組成一個立方體,然后在立方體中運用3D卷積核。在其中,卷積層中每一個特征map都會與上一層中多個鄰近的連續幀相連,以捕捉運動信息。一個卷積map的某一位置的值是通過卷積上一層的三個連續的幀的同一個位置的局部感受得到的。要強調的是:3D卷積核只能從cube中提取一種類型的特征,因為在整個cube中卷積核的權值都是一樣的,也就是共享權值,都是同一個卷積核。可以采用多種卷積核,以提取多種特征。有一個通用的設計規則就是:在后面的層(離輸出層近的)特征map的個數應該增加,這樣就可以從低級的特征maps組合產生更多類型的特征。本文中的3D 卷積神經網絡架構包含一個硬連線hardwired層、3個卷積層、2個下采樣層和一個全連接層。每個3D卷積核卷積的立方體是連續7幀,每幀patch大小是60x40。

在第一層,應用了一個固定的hardwired的核去對原始的幀進行處理,產生多個通道的信息,然后對多個通道分別處理。最后再將所有通道的信息組合起來得到最終的特征描述。這個實線層實際上是編碼對特征的先驗知識,這比隨機初始化性能要好。

每幀提取五個通道的信息,分別是:灰度、x和y方向的梯度,x和y方向的光流。其中,前面三個都可以每幀都計算。然后水平和垂直方向的光流場需要兩個連續幀才確定。所以是7x3 + (7-1)x2=33個特征maps。然后用一個7x7x3的3D卷積核(7x7在空間,3是時間維)在五個通道的每一個通道分別進行卷積。為了增加特征map的個數(實際上就是提取不同的特征),在每一個位置都采用兩個不同的卷積核,這樣在C2層的兩個特征maps組中,每組都包含23個特征maps。23是(7-3+1)x3+(6-3+1)x2前面那個是:七個連續幀,其灰度、x和y方向的梯度這三個通道都分別有7幀,然后水平和垂直方向的光流場都只有6幀。54x34是(60-7+1)x(40-7+1)。

在緊接著的下采樣層S3層max pooling,在C2層的特征maps中用2x2窗口進行下采樣,這樣就會得到相同數目但是空間分辨率降低的特征maps。下采樣后,就是27x17=(52/2)*(34/2)。 C4是在5個通道中分別采用7x6x3的3D卷積核。為了增加特征maps個數,在每個位置都采用3個不同的卷積核,這樣就可以得到6組不同的特征maps,每組有13個特征maps。13是((7-3+1)-3+1)x3+((6-3+1)-3+1)x2前面那個是:七個連續幀,其灰度、x和y方向的梯度這三個通道都分別有7幀,然后水平和垂直方向的光流場都只有6幀。21x12是(27-7+1)x(17-6+1)。

S5層用的是3x3的下采樣窗口,所以得到7x4. 到這個階段,時間維上幀的個數已經很小了。在這一層,只在空間維度上面卷積,這時候使用的核是7x4,然后輸出的特征maps就被減小到1x1的大小。而C6層就包含有128個特征map,每個特征map與S5層中所有78(13x6)個特征maps全連接,這樣每個特征map就是1x1,也就是一個值了,而這個就是最終的特征向量了。

經過多層的卷積和下采樣后,每連續7幀的輸入圖像都被轉化為一個128維的特征向量,這個特征向量捕捉了輸入幀的運動信息。輸出層的節點數與行為的類型數目一致,而且每個節點與C6中這128個節點是全連接的。采用一個線性分類器來對這128維的特征向量進行分類,實現行為識別。模型中所有可訓練的參數都是隨機初始化的,然后通過在線BP算法進行訓練。

3D 卷積神經網絡模型的輸入被限制為一個少的連續視頻幀,因為隨著輸入窗口大小的增加,模型需要訓練的參數也會增加。當然有些人的行為是跨越很多幀的,所以在3D 卷積神經網絡模型中,有必要捕捉這種高層的運動信息。需要用大量的幀來計算運動特征,然后把這些運動特征作為輔助輸出去規則化3D 卷積神經網絡模型。

對于每一個需要訓練的行為,提取其長時間的行為信息,作為其高級行為特征。這個運動信息因為時間夠長,所以要比卷積神經網絡的輸入幀的立方體包含的信息要豐富很多。然后我們就迫使卷積神經網絡學習一個非常接近這個特征的特征向量。這可以通過在卷積神經網絡的最后一個隱層再連接一系列的輔助輸出節點,然后訓練過程中,使提取的特征更好的逼近這個計算好的高層的行為運動特征向量。

試驗中,在原始的灰度圖像中計算稠密sift描述子,然后通過這些sift描述子和運動邊緣歷史圖像(MEHI)組合構造bag-of-words特征作為輔助特征。 因為灰度圖保留了外觀信息,運動邊緣歷史圖像只關心形狀和運動模式,所以可以提取這兩個互補的信息作為兩個連續幀的局部特征bag。先簡單的計算兩幀間的差分,這樣就可以保留運動信息,然后對其執行一次Canny邊緣檢測,這樣可以使得觀測圖像更加清楚簡潔。最總的運動邊緣圖像就是將歷史的這些圖像乘以一個遺忘因子再累加起來得到。

本文中,構造不同的3D 卷積神經網絡模型,它可以從輸入捕捉潛在的互補信息,然后在預測階段,每個模型都針對一個輸入得到對應的輸出,然后再組合這些輸出得到最終的結果。

作者簡介:

卷積神經網絡實現過程范文第3篇

關鍵詞:卷積神經網絡;反向傳播算法;仿射變換;sloth;python;theano

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2017)04-0096-02

隨著環保壓力的增大,各國已經開始利用攝像頭來監控漁船的捕撈活動,并運用機器學習技術來對漁船捕獲的魚類圖像進行自動的識別與分類從而扼制非法的捕撈。

目前計算機性能的飛速發展、圖像數據采集設備的廉價與普及促進了機器學習理論與方法的發展,數據科學家已經可以構建復雜的機器學習模型并利用從廉價的數碼攝像頭設備采集到大量的數據快速的訓練模型。吳一全等[1]采用了手動選擇特征的方法, 基于支持向量機對5種魚進行識別,各類魚的識別精度平均為83.33%。萬鵬等[2]計算魚的長軸方向各段的平均寬度與長度的比值并將其作為特征參數,利用3層BP(back propagation)神經網絡對鯽魚和鯉魚進行識別,識別精度為92.50%。但是這些方法都是基于手動選擇特征的機器學習方法,手動選擇特征的方法基于人的經驗選擇特征, 會導致遺漏重要的特征, 導致分類準確率低。深度學習中的卷積神經網絡能在訓練過程中自動學到“好”特征,避免了手動選擇特征。本次研究采用了基于VGG16的卷積神經網絡(CNN)來進行魚類分類,并運用了數據集擴增方法,dropout方法, batch normalization方法來降低模型的過擬合。但是原始數據集背景干擾很大,船上的人、物體和甲板上捕獲的魚類糅合在一起,直接采用原始數據集訓練會導致訓練出的模型穩定性不好。

基于上述分析,本文從原始數據出發,設計了一種目標檢測方法,即在原始訓練數據已經有魚類類別標簽的基礎上,再標注上一層表示魚類在圖片中坐標位置的標簽,然后利用這些二次標注過的數據訓練模型,就可得到一個既能預測魚在圖片中的坐標位置又能預測魚的分類的糅合模型。因為這兩種預測網絡在卷積層共同訓練一套濾波器,所以在訓練濾波器預測魚的坐標位置時,訓練完成的濾波器便能在另一方面輔助預測魚的分類,使特征提取只專注于魚的坐標區域,這樣就有效的排除了背景干擾。實驗結果顯示此模型具有很高的識別精度和魯棒性,能在背景干擾很強的圖片數據集上準確的完成魚類的識別和分類。

1 模型構建

實驗數據來源于某組織舉辦的圖像識別競賽。數據通過固定在漁船某個位置的攝像頭采集,通過采集甲板上捕獲的魚類照片,共采集到3777張共8個分類的照片作為訓練樣本,分別為長鰭金槍魚、大眼金槍魚、黃鰭金槍魚、鰍魚、月魚、鯊魚、其他、無魚類(表示沒有魚出現在照片里)。按一定比例做分層采樣,其中2984張用作訓練集,394張用作驗證集,399張用作測試集。訓練集用經過錯切幅度值為0.15的仿射變換作數據集擴增來降低過擬合,因為在從原始數據集上分層采樣得來的小樣本數據集上驗證顯示當錯切幅度值等于0.15時,模型在測試集上的分類精度最高。

在訓練集上采用sloth@款圖片標注工具手動標注魚類在圖片中的位置,并把這些標注結果和已有的魚類分類標注結果當做輸入數據和圖片數據一起傳給模型訓練。

本次研究的神經網絡模型結構如圖1所示。卷積層采用了被廣泛使用在圖像分類任務中的VGG模型的卷積濾波器的權重[3],并在其模型上作微調來實現本次研究的目標。

輸入層將不同尺寸的圖片統一轉換成244*244大小。

匯合層(max pooling)是指取一小塊像素區域的像素最大值,作用是可減少數據量,控制過擬合。

全連接層的權重采用反向傳播算法(back propagation)訓練,參數尋優采用隨機梯度下降方法。動態學習率設定方法采用了 Adam方法,可根據損失函數在迭代訓練中產生的信息自動調整學習率。

激活層函數采用RELU方法,公式為。最后一層預測魚類分類的激活曾需要把對應于各個分類的分數值轉換成總和為1的對應于各個分類的概率值,所以激活函數采用Softmax方法,公式如下

由于卷積神經網絡網絡強大的表示能力,為了降低模型的過擬合以及加快模型的訓練速度,本次工作在激活曾后面再依次加入一層dropout層和batch normalization層。dropout層是指隨機的舍棄一部分激活曾神經元的值,并將其置為0[4]。batch normalization層是指規范化每層激活層的輸出,并加入4個規范化參數來抑制模型訓練過程中的反規范化現象[5]。

2 程序實現

具體的軟件實現采用python編程語言和keras框架平臺。keras底層采用輕量易用的theano框架,并依賴計算機的顯卡來進行更快速的訓練工作。整個圖像分類的軟件框架主要由4部分組成,分別是輸入圖像數據處理、模型各個網絡層的實現及拼接、模型編譯、模型訓練及預測。下面按數據在模型中流動的順序具體的闡述各個部分的程序實現。

2.1 輸入圖像數據處理

卷積神經網絡實現過程范文第4篇

關鍵詞:人機大戰;人工智能;發展前景

中圖分類號:TP391 文獻標識碼:A

0.引言

2016年3月15日,備受矚目的“人機大戰”終于落下帷幕,最終Google公司開發的“AlphaGo”以4∶1戰勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認為,人工智能已經上升到了一個新的高度。

這次勝利與1997年IBM公司的“深藍”戰勝國際象棋世界冠軍卡斯帕羅不同。主要表現在兩個方面:

(1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數據庫取勝,而是AlphaGo已經擁有了深度學習的能力,能夠學習已經對弈過的棋盤,并在練習和實戰中不斷學習和積累經驗。

(2)圍棋比國際象棋更加復雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局數的所有可能性是冪為171的指數,這樣的計算量相當巨大。英國圍棋聯盟裁判托比表示:“圍棋是世界上最為復雜的智力游戲,它簡單的規則加深了棋局的復雜性”。因此,進入圍棋領域一直被認為是目前人工智能的最大挑戰。

簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學習”能力。深度學習是源于人工神經網絡的研究,得益于大數據和互聯網技術。本文就從人工智能的發展歷程與現狀入手,在此基礎上分析了人工智能的未來發展前景。

1.人工智能的發展歷程

AlphaGo的勝利表明,人工智能發展到今天,已經取得了很多卓越的成果。但是,其發展不是一帆風順的,人工智能是一個不斷進步,并且至今仍在取得不斷突破的學科。回顧人工智能的發展歷程,可大致分為孕育、形成、暗淡、知識應用和集成發展五大時期。

孕育期:1956年以前,數學、邏輯、計算機等理論和技術方面的研究為人工智能的出現奠定了基礎。德國數學家和哲學家萊布尼茨把形式邏輯符號化,奠定了數理邏輯的基礎。英國數學家圖靈在1936年創立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”。總之,這些人為人工智能的孕育和產生做出了巨大的貢獻。

形成期:1956年夏季,在美國達特茅斯大學舉辦了長達2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術語。這是人類歷史上第一次人工智能研討會,標志著人工智能學科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學家的努力下,人工智能取得了矚目的突破,也在當時形成了廣泛的樂觀思潮。

暗淡期:20世紀70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復雜的問題。隨著AI遭遇批評,對AI提供資助的機構也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

知識應用期:在80年代,“專家系統”(Expect System)成為了人工智能中一個非常主流的分支。“專家系統”是一種程序,為計算機提供特定領域的專門知識和經驗,計算機就能夠依據一組從專門知識中推演出的邏輯規則在某一特定領域回答或解決問題。不同領域的專家系統基本都是由知識庫、數據庫、推理機、解釋機制、知識獲取等部分組成。

集成發展期:得益于互聯網的蓬勃發展、計算機性能的突飛猛進、分布式系統的廣泛應用以及人工智能多分支的協同發展,人工智能在這一階段飛速發展。尤其是隨著深度學習和人工神經網絡研究的不斷深入,人工智能在近幾十年中取得了長足的進步,取得了令人矚目的成就。

人工智能發展到今天,出現了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當前人工智能的研究熱點主要集中在自然語言處理、機器學習、人工神經網絡等領域。

2.人工智能l展現狀與前景

人工智能當前有很多重要的研究領域和分支。目前,越來越多的AI項目依賴于分布式系統,而當前研究的普遍熱點則集中于自然語言處理、機器學習和人工神經網絡等領域。

自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學與人工智能的交叉學科,其主要功能就是實現讓機器明白人類的語言,這需要將人類的自然語言轉化為計算機能夠處理的機器語言。

自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結構、語法進行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態度。

當前自然語言的處理主要有兩大方向。一種是基于句法-語義規則的理性主義理論,該理論認為需要為計算機制定一系列的規則,計算機在規則下進行推理與判斷。因此其技術路線是一系列的人為的語料建設與規則制定。第二種是基于統計學習的經驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學習并進行統計推斷的方式不停地從數據中“學習”語言,試圖刻畫真實世界的語言現象,從數據中統計語言的規律。

機器學習:機器學習(Machine Learning)是近20年來興起的人工智能一大重要領域。其主要是指通過讓計算機在數據中自動分析獲得規律,從而獲取“自我學習”的能力,并利用規律對未知數據進行判斷和預測的方法。

機器學致可以分為有監督的學習和無監督的學習。有監督的學習是從給定的訓練數據集中練出一個函數和目標,當有新的數據到來時,可以由訓練得到函數預測目標。有監督的學習要求訓練集同時有輸入和輸出,也就是所謂的特征和目標。而依據預測的結果是離散的還是連續的,將有監督的學習分為兩大問題,即統計分類問題和回歸分析問題。統計分類的預測結果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標是連續的,如天氣、股價等的預測。

無監督學習的訓練集則沒有人為標注的結果,這就需要計算機去發現數據間的聯系并用來分類等。一種常見的無監督學習是聚類分析(Cluster Analysis),它是將相似的對象通過靜態分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數據對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數據對象進行分類。

機器學習還包括如半監督學習和增強學習等類別。總而言之,機器學習是研究如何使用機器來模擬人類學習活動的一門學科,而其應用隨著人工智能研究領域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領域越來越廣泛地應用到了機器學習中。

人工神經網絡:在腦神經科學領域,人們認為人類的意識及智能行為,都是通過巨大的神經網絡傳遞的,每個神經細胞通過突出與其他神經細胞連接,當通過突觸的信號強度超過某個閾值時,神經細胞便會進入激活狀態,向所連接的神經細胞一層層傳遞信號。于1943年提出的基于生物神經元的M-P模型的主要思想就是將神經元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數f對輸入x1,x2…,xn進行處理并模擬神經細胞的激活模式。主要的傳遞函數有階躍型、線性型和S型。

在此基礎上,對神經網絡算法的研究又有諸多進展。日本的福島教授于1983年基于視覺認知模型提出了卷積神經網絡計算模型。通過學習訓練獲取到卷積運算中所使用的卷積系數,并通過不同層次與自由度的變化,可以得到較為優化的計算結果。而AlphaGo也正是采用了這種深度卷積神經網絡(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。

3.人工智能的發展前景

總體來看,人工智能的應用經歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領域中,既是縱向發展的過程,也是橫向不斷改進的過程。

人工智能在博弈階段,主要是實現邏輯推理等功能,隨著計算機處理能力的進步以及深度學習等算法的改進,機器擁有了越來越強的邏輯與對弈能力。在感知領域,隨著自然語言處理的進步,機器已經基本能對人類的語音與語言進行感知,并且能夠已經對現實世界進行視覺上的感知。基于大數據的處理和機器學習的發展,機器已經能夠對周圍的環境進行認知,例如微軟的Kinect就能夠準確的對人的肢體動作進行判斷。該領域的主要實現還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環境進行感知并處理人類的語言等指令,利用所收集的信息進行最后的決策,比如操作方向盤、剎車等。

人工智能已經滲透到生活中的各個領域。機器已經能識別語音、人臉以及視頻內容等,從而實現各種人際交互的場景。在醫學領域,人工智能可以實現自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領域,機器也承擔了越來越多的輔助教育,智能交互的功能。在交通領域,一方面無人車的發展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領域也有非常廣闊的發展前景。總之,人工智能在一些具有重復性的和具備簡單決策的領域已經是一種非常重要的工具,用來幫助人們解決問題,創造價值。

參考文獻

[1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經濟導刊,2016 (6):69-74.

卷積神經網絡實現過程范文第5篇

人工智能的概念已提出60年,從原來的理論框架體系的搭建,到實驗室關鍵技術的準備,如今已開始進入全新的發展階段――產業化。

目前,從基本的算法到腦科學研究,人工智能都還沒有突破性進展的可能性。但是,以深度神經網絡為代表的人工智能,結合日新月異的大數據、云計算和移動互聯網,就可以在未來5到10年改變我們的世界。

人工智能+時代的兩大機遇

人工智能不僅將替代簡單重復的勞動,還將替代越來越多的復雜的高級腦力活動,創造一個個新的機會。可以說,任何一個行業、企業或今天的創業者,如果不用人工智能改變今天的生產和生活方式,5年后一定會出局。

第一個趨勢是以語音為主導、以鍵盤和觸摸為輔助的人機交互時代正在到來。如今越來越多的設備不再需要屏幕,越來越多的場景我們不用直接碰觸。比如,想把燈光調亮,想打開五米之外的設備,我們的手沒法直接觸碰。再如,開車時不方便用手、用眼做其他事情。這時,語音就成為最主要的一個交互方式。

第二個趨勢是人工智能正在全球范圍內掀起一股浪潮,“人工智能+”的時代到來,而且會比我們想象的還要快。為什么呢?麥肯錫分析認為,當前45%的工作可以被技術自動化,不只是簡單重復性的工作,CEO20%的工作也可以被機器取代。《科學》雜志預測,2045年人工智能會顛覆全球50%、中國77%的就業。也就是說,今天的我們3/4的工作30年后會被人工智能取代。埃森哲認為,到2035年人工智能會讓12個發達國家經濟增長率翻一倍。我國的增長率只有比這還高,才對得起今天的時代機遇。

從科大訊飛的情況可以看出,人工智能將迎來兩大產業機遇。

第一,未來3到5年,萬物互聯的時代到來,以語音為主、鍵盤觸摸為輔的人機交互將廣泛應用。第二,未來5到10年,人工智能會像水和電一樣進入各行各業,深刻改變我們的生活。

認知智能是最大技術瓶頸

人工智能技術有兩種分類方法。一種分為強人工智能和弱人工智能;另一種是訊飛研究院提出的、跟技術演進路徑相關的分類,分成計算智能、感知智能和認知智能。

計算智能就是機器能存會算。就像當年IBM的深藍電腦下象棋超過卡斯帕羅夫,典型的就是因為運算能力強,提前算到了所有的結果。

感知智能,比如語音合成技術,能夠讓機器開口說話。再如語音識別技術,就像今天的演講,后臺系統把它變成文字,準確率可達95%。

認知智能是讓機器具備能理解、會思考的能力。這是最大的挑戰,也是大家最熱切期待的技術突破。工業革命讓我們從繁重的體力勞動中解放出來,未來的認知智能會讓人從今天很多復雜的腦力勞動中解放出來。

科大訊飛選擇以語音為入口解決認知難題,進行認知革命。以人機交互為入口的目的,就是為了解決自然語言理解的技術難題。這個入口可以把人類的智慧最便捷地匯聚到后臺,供機器學習和訓練,也可以使后臺人工智能的成果最簡單直接地輸出,從社會不斷取得它學習需要的反饋信息,在此基礎上實現知識管理和推理學習。

科大訊飛承擔的科技部第一個人工智能重大專項――高考機器人。目標是為了“考大學”,但其核心技術正是語言理解、知識表達、聯想推理和自主學習。

人工智能技術正走向產業化

目前,科大訊飛的人工智能研究已經取得了階段性成果。

在教育行業,科大訊飛的機器人通過構建學生全過程的學習數據和老師上課的數據,提升了課堂效率,原來45分鐘的課堂,現在15分鐘就搞定。因為大量的內容學生都是知道的,老師只需向個別沒掌握的學生單獨講授。這樣,老師就有時間把課堂的重點放在大家都不了解的知識上,學生可以用大量時間進行啟發式學習。借助這些手段,學生的重復性訓練可以降低50%以上。

在醫療行業,科大訊飛利用語音解決門診電子病歷,利用人工智能輔助診療。學習最頂尖醫療專家知識后的人工智能產品,可以超過一線全科醫生的水平。當前,醫療行業一線最缺的是全科醫生和兒科醫生,引入人工智能技術就可以緩解醫療資源短缺壓力。

科大訊飛的人工智能技術還應用在汽車領域。在寶馬汽車去年的國際測試中,科大訊飛以86%的準確率名列第一。

在客服領域,機器已經替代掉了30%的人工服務。目前,安徽移動呼叫中心有75%的服務內容已被機器替代。

機器人還將從服務后臺走向前端。今年第四季度末或明年,服務機器人將開始在銀行和電信營業廳上崗工作,它們不僅好玩、有趣,吸引人氣,還能幫客戶解決實際問題。

主站蜘蛛池模板: 台中县| 星子县| 阿拉善右旗| 灌南县| 合阳县| 体育| 鄱阳县| 灵武市| 德庆县| 当涂县| 汽车| 大丰市| 鹿邑县| 贡觉县| 东辽县| 阿克陶县| 微山县| 始兴县| 金湖县| 昌吉市| 清新县| 西昌市| 奇台县| 潞西市| 西和县| 若羌县| 曲水县| 石景山区| 成安县| 新营市| 马尔康县| 玉门市| 江油市| 大竹县| 南岸区| 祁东县| 大余县| 桦甸市| 台湾省| 吐鲁番市| 祥云县|