【文章內(nèi)容簡介】
forward work cat dog …… Convolution Max Pooling Convolution Max Pooling Flatten Can repeat many times 13 經(jīng)典模型 CNN Convolution Max Pooling Convolution Max Pooling Flatten Can repeat many times ? Some patterns are much smaller than the whole image ?The same patterns appear in different regions. ?Subsampling the pixels will not change the object Property 1 Property 2 Property 3 13 經(jīng)典模型 CNN Fully Connected Feedforward work cat dog …… Convolution Max Pooling Convolution Max Pooling Flatten Can repeat many times 13 經(jīng)典模型 CNN 13 經(jīng)典模型 CNN Deep Dream ? Given a photo, machine adds what it sees …… CNN Modify image CNN exaggerates what it sees 13 經(jīng)典模型 CNN Deep Dream ? Given a photo, machine adds what it sees …… 13 經(jīng)典模型 CNN Deep Style ? Given a photo, make its style like famous paintings 13 經(jīng)典模型 CNN Deep Style ? Given a photo, make its style like famous paintings 13 經(jīng)典模型 CNN Deep Style CNN CNN content style CNN ? A Neural Algorithm of Artistic Style 13 經(jīng)典模型 CNN More Application: Speech Time Frequency Spectrogram CNN Image The filters move in the frequency direction. 13 經(jīng)典模型 CNN More Application: Text ? 13 經(jīng)典模型 CNN 深度學(xué)習(xí)應(yīng)用 第二 章 ? 機(jī)器視覺 ? 智能語音 ? ………………. 21 機(jī)器視覺 ( 1)機(jī)器視覺 ——用機(jī)器的眼睛理解世界 機(jī)器視覺是指通過用計(jì)算機(jī)或圖像處理器及相關(guān)設(shè)備來模擬人類視覺,以讓機(jī)器獲取相關(guān)的視覺并加以理解,它是將圖像轉(zhuǎn)換成數(shù)字信號(hào)進(jìn)行分析處理的技術(shù)。 機(jī)器視覺技術(shù)流程 圖像采集 目標(biāo)提取 目標(biāo)識(shí)別 目標(biāo)分析 圖像捕獲 圖像壓縮 圖像存儲(chǔ) 圖像預(yù)處理 圖像分割 特征提取 目標(biāo)分類 判斷匹配 模型建立 行為識(shí)別 21 機(jī)器視覺 關(guān)鍵技術(shù)與應(yīng)用 A)生物特征識(shí)別技術(shù) ——安全領(lǐng)域應(yīng)用廣泛 生物特征識(shí)別技術(shù)是一種通過對生物特征識(shí)別和檢測 ,對身傷實(shí)行鑒定的技術(shù)。從 統(tǒng)計(jì)意義上講人類的指紋、虹膜等生理特征存在唯一性,可以作為鑒另用戶身份 的依據(jù)。目前,生物特征識(shí)別技術(shù)主要用于身份識(shí)別,包括語音、指紋、人臉、 靜脈,虹膜識(shí)別等。 21 機(jī)器視覺 關(guān)鍵技術(shù)與應(yīng)用 B )光學(xué)字符文本識(shí)別一一智能物流的核心技術(shù) 光學(xué)字符文本識(shí)別技術(shù) ( Opical Character Reconrition),是指計(jì)算機(jī)通過光學(xué)設(shè)備檢 查紙上打印的字符 ,通過檢測暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形 狀翻澤成計(jì)算機(jī)文字的過程,從而完成計(jì)算機(jī)對文字的閱讀。 OCR技術(shù)具體到場 景就是通過掃描,將各類印刷體的文檔證件 (名片,銀行卡、財(cái)務(wù)單據(jù)等 )自動(dòng)識(shí) 別錄入電腦等終端,讓大量信息的高效錄入成為可能。 物品包裝檢