freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

智能語音行業(yè)發(fā)展分析報告終(參考版)

2024-07-31 01:44本頁面
  

【正文】 THANKS !!!致力為企業(yè)和個人提供合同協(xié)議,策劃案計劃書,學(xué)習(xí)課件等等打造全網(wǎng)一站式需求歡迎您的下載,資料僅供參考可修改編輯。此外,Siri其實(shí)是蘋果買來的,在蘋果買來之前,Siri本來是會推出Android版本的,可是,被蘋果購買后,Android版本的Siri取消了。不同的是,這個技術(shù)針對的是一些生活信息,這些信息的地域化程度很高,典型代表為Yelp。相比于知識計算技術(shù),這些技術(shù)需要人的參與,這有利也有弊,利就是,畢竟暫時人比機(jī)器聰明,編輯出來的知識更豐富,準(zhǔn)確;弊就是,人力有限,即使像維基那樣,發(fā)動社區(qū)的力量,也不能產(chǎn)生足夠的知識,而知識計算,理論上,只需要算法足夠精準(zhǔn),是可以產(chǎn)生“無限”的知識的。知識數(shù)據(jù)庫技術(shù)的代表是維基百科,以及各種專門的百科網(wǎng)站。想測試這項(xiàng)技術(shù)的請移步Wolfram|Alpha。和網(wǎng)頁搜索技術(shù)不同的是,在這個系統(tǒng)中,得到的答案結(jié)構(gòu)化程度很高,比如搜索China,能得到和中國相關(guān)的各種參數(shù)以及資料,并以接近表格的方式呈現(xiàn)。知識計算(搜索)技術(shù)(Computational Knowledge)這個技術(shù)的代表是Wolfram|Alpha。國外比較早的應(yīng)該是IBM ViaVoice。而語音識別,由于涉及到語義理解,難度大大加大,需要大量的知識庫,一般需要在云端完成。文字轉(zhuǎn)語音(texttospeech, TTS)系統(tǒng)則是將一般語言的文字轉(zhuǎn)換為語音,其他的系統(tǒng)可以描繪語言符號的表示方式,就像音標(biāo)轉(zhuǎn)換至語音一樣。語音合成是將人類語音用人工的方式所產(chǎn)生。與說話人識別及說話人確認(rèn)不同,后者嘗試識別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。這些后臺技術(shù)包括:以Google為代表的網(wǎng)頁搜索技術(shù);②以Wolfram Alpha為代表的知識搜索技術(shù)(或者知識計算技術(shù));③以Wikipedia為代表的知識庫(和Wolfram Alpha不同的是,這些知識來自人類的手工編輯)技術(shù)(包括其他百科,如電影百科等);④以Yelp為代表的問答以及推薦技術(shù)。而語音合成則是把返回的文字結(jié)果轉(zhuǎn)化成語音輸出,這個技術(shù)理論上本地就能完成。首先,在前端方面,即面向用戶,和用戶交互(User Interface,UI)的技術(shù),主要是語音識別以及語音合成技術(shù)?!盨iri是IOS上的個人助理應(yīng)用:此軟件使用到自然語言處理技術(shù),使用者可以使用自然的對話與手機(jī)進(jìn)行互動,完成搜尋資料、查詢天氣、設(shè)定手機(jī)日歷、設(shè)定鬧鈴等服務(wù)。整個CALO計劃的帶頭人名叫Adam Cheyer,他現(xiàn)在也是蘋果iPhone團(tuán)隊(duì)的工程總監(jiān)。 競爭產(chǎn)品舉例SIRI(IPHONE 4S) 2011年10月,Apple發(fā)布了iphone 4S with IOS 5,其中最大的亮點(diǎn)就是一個智能語音搜索軟件Siri。語音技術(shù)與具體語言的發(fā)音和語法特點(diǎn)具有密切相關(guān)性,因此語音市場具有較高的本土化特征,以Nuance為例,其74%的收入來源于美國市場,26%的收入來源于其他國家,其中包括通過收購歐洲公司所獲得的收入。Nuance以前對中國市場重視度不高,主要通過代理商進(jìn)行產(chǎn)品銷售,目前已開始加大對中國語音市場的開拓力度,其投入重點(diǎn)集中于企業(yè)級市場和導(dǎo)航設(shè)備市場。 2009年全球語音識別市場份額:國內(nèi)語音技術(shù)市場目前仍以語音合成為主,語音識別技術(shù)則處于市場導(dǎo)入期。我們預(yù)計隨著語音芯片成本的不斷下降和專業(yè)玩具設(shè)計廠商的加入,智能語音玩具市場有望出現(xiàn)快速增長。缺乏有吸引力的玩具設(shè)計與成本較高是目前制約智能語音玩具大規(guī)模推廣的主要原因。 我國玩具產(chǎn)業(yè)規(guī)模龐大 語音識別技術(shù)以嵌入式芯片的方式應(yīng)用于各類玩具,會有很大的發(fā)展前景。據(jù)中國玩具協(xié)會統(tǒng)計,約64%的成人消費(fèi)者表示有興趣購買適合自己的玩具,估計成人休閑益智玩具市場每年約值500億元人民幣。有34%的城市消費(fèi)者選購電子玩具,31%選擇智能型玩具,23%選擇高檔毛絨、布制玩具。大中城市的消費(fèi)者普遍可接受的玩具價格在100元以下,一些售價在1000元以上的高檔玩具同樣有市場??拼笥嶏w目前在語音教具市場和語音評測市場占據(jù)主導(dǎo)地位,面向中小學(xué)英語和普通話教學(xué)的“暢言智能有聲教具”業(yè)務(wù)穩(wěn)步拓展,并在多個省份開展試點(diǎn);其普通話口語評測業(yè)務(wù)已進(jìn)入20個省份,并在安徽、江蘇、上海等7省份全面實(shí)施了計算機(jī)測試。2005年9月,科大訊飛的計算機(jī)口語測試系統(tǒng)準(zhǔn)確程度已經(jīng)達(dá)到了省級測試員的測試水平。 語音評測技術(shù)是通過機(jī)器自動對語音進(jìn)行發(fā)音水平評價、檢錯,并給出糾正指導(dǎo)的技術(shù),主要應(yīng)用于普通話和英語的教學(xué)及測試。若語音教具進(jìn)一步擴(kuò)展至學(xué)生市場,根據(jù)教育部2009 年底公布的統(tǒng)計數(shù)據(jù),全國共有中小學(xué)校35 萬所、班級380萬個,按40%市場滲透率進(jìn)行估算,“暢言”智能課堂教學(xué)機(jī)和智能語言教學(xué)平臺的市場總潛力將超過22億元。根據(jù)國家統(tǒng)計局的數(shù)據(jù),截至2008年底,其中英語教師人數(shù)約為120萬人。未來移動終端語音市場的增長動力主要來自于兩方面:一是作為觸摸屏和鍵盤等輸入設(shè)備的補(bǔ)充和完善,由于設(shè)備尺寸和重量的限制,觸摸屏是目前智能手機(jī)和平板電腦的主要輸入設(shè)備,但觸摸屏也存在輸入精確度不高、容易產(chǎn)生觸摸漂移等缺點(diǎn),這為智能語音技術(shù)的應(yīng)用創(chuàng)造了空間;二是移動終端語音技術(shù)新應(yīng)用的不斷出現(xiàn),如語音秘書、語音播報、語音輸入法、語音聽寫系統(tǒng)等,國外市場上Nuance已推出了針對iPhone和iPad的語音識別軟件,Google也于2010年8月推出了基于Android系統(tǒng)的語音識別技術(shù),用戶可通過語音指令實(shí)現(xiàn)發(fā)送電子郵件、短信、撥打電話和獲得駕駛導(dǎo)航信息等功能,國內(nèi)市場上科大訊飛于2010年10月推出了基于Android系統(tǒng)的語音輸入法,近期有望進(jìn)一步推出基于云計算技術(shù)的語音短信輸入產(chǎn)品,新應(yīng)用的不斷出現(xiàn)有助于提升語音技術(shù)在移動終端市場的滲透率。2010年全球智能手機(jī)和平板電腦銷量同時啟動,未來3年仍將保持高速增長態(tài)勢。智能手機(jī)和平板電腦市場啟動提升語音技術(shù)滲透率。未來伴隨著前裝導(dǎo)航滲透率的大幅提高及語音識別技術(shù)的滲透率快速增長,車載語音市場規(guī)模有望顯著提升。 汽車前裝導(dǎo)航設(shè)備市場仍有較大增長空間圖 目前,語音合成技術(shù)在車載導(dǎo)航系統(tǒng)的使用已較為普遍,而語音識別技術(shù)的滲透率則相對較低。國內(nèi)前裝車載導(dǎo)航設(shè)備仍處于市場發(fā)展初期,從滲透率來看,2007年前裝車載導(dǎo)航系統(tǒng)的裝配率在日本已經(jīng)達(dá)到79%,在西歐約為13%,%,而在國內(nèi)2008 %,未來滲透率仍有較大提升空間。全球企業(yè)級語音識別市場規(guī)模保持平穩(wěn)增長圖: 車載語音市場規(guī)模大幅提升目前語音識別技術(shù)在車載語音市場主要應(yīng)用于汽車導(dǎo)航設(shè)備,可以通過避免手動操作導(dǎo)航設(shè)備而增強(qiáng)行駛過程中的安全性,未來語音技術(shù)可進(jìn)一步滲透至其他汽車輔助電子設(shè)備中,如對汽車空調(diào)、車窗、影音系統(tǒng)等進(jìn)行語音控制。從地域結(jié)構(gòu)來看增速則很不均衡,北美地區(qū)語音技術(shù)滲透率較高,目前約為30%,因此增速平穩(wěn);而中國市場幾乎是空白,仍處于市場培育和客戶習(xí)慣培養(yǎng)時期,未來將呈現(xiàn)快速增長態(tài)勢,主流廠商N(yùn)uance和科大訊飛均已開始加大這一市場的開拓力度。 根據(jù)Oppenheimer amp。呼叫中心投資明顯回暖,為智能語音技術(shù)的引入打下良好基礎(chǔ)。中國呼叫中心產(chǎn)業(yè)從2000年開始快速增長,截至2010年底,呼叫中心座席總數(shù)已超過50萬個,累計投資規(guī)模達(dá)超過500億元。呼叫中心又稱為客戶服務(wù)中心,是把計算機(jī)和電信技術(shù)集成在一起,形成的用電話與用戶溝通的手段。 綜合考慮目前的技術(shù)能力(語音技術(shù)核心算法和計算機(jī)芯片計算能力)和客戶接受度,我們認(rèn)為在未來幾年有望實(shí)現(xiàn)突破的主要有三大細(xì)分市場:企業(yè)級市場、車載語音市場及移動終端市場。從地域分布來看,北美一直是全球最大的智能語音技術(shù)市場,2009年占據(jù)全球超過70%的市場份額,北美語音技術(shù)的采用也遠(yuǎn)高于其他地區(qū),其中企業(yè)級語音市場約占語音市場79%的份額。 第五章 智能語音市場分析智能語音技術(shù)作為最自然的人機(jī)交互方法,其用途非常廣泛,從最終應(yīng)用前景來看,未來隨著技術(shù)進(jìn)步和機(jī)器對人工替代程度的提高,只要是需要機(jī)器與人進(jìn)行交互的場合均可運(yùn)用智能語音技術(shù)。隨著HMM語音合成技術(shù)的發(fā)展,嵌入式語音合成技術(shù)也逐步突破了對運(yùn)算和存儲要求苛刻的嵌入式使用門檻,目前已經(jīng)可以在小資源環(huán)境(1MB存儲資源和10MIPS運(yùn)算資源)下產(chǎn)生出清晰流暢的語音效果,從而使語音技術(shù)在車載導(dǎo)航、移動終端、教具等設(shè)備中的應(yīng)用門檻有效降低。 圖4 典型的語音合成流程圖: 語音合成技術(shù)的應(yīng)用 語音合成技術(shù)在2000年時已達(dá)到用戶基本可接受的準(zhǔn)實(shí)用水平,主要用于簡單信息(如時間、金額、航班等)的播報。后端則是通常意義上的合成器,負(fù)責(zé)將前端處理后的結(jié)果轉(zhuǎn)換成實(shí)際的聲音輸出,韻律處理可以作為其中一個模塊,集成到語音合成過程中。 語音合成的具體實(shí)現(xiàn)過程可以劃分為前端文本分析和后端語音合成兩個步驟。隨著聲學(xué)合成器性能的不斷提高,在原有訓(xùn)練方法的基礎(chǔ)上進(jìn)一步發(fā)展出了統(tǒng)計參數(shù)語音合成方法——基于HMM模型(Hidden Markov Model,隱馬爾可夫模型)的語音合成方法。 從二十世紀(jì)末開始,統(tǒng)計建模方法引入到語音合成技術(shù)的研究當(dāng)中,從而提出了可訓(xùn)練的語音合成方法。隨著計算機(jī)運(yùn)算能力和存儲能力的迅猛發(fā)展,利用計算機(jī)合成語音越來越普遍,波形拼接方法逐漸發(fā)展成為基于大語料庫的單元挑選與波形拼接合成方法,其基本思想是根據(jù)輸入的文本分析信息,根據(jù)相關(guān)信息從預(yù)先錄制好的語音庫中挑選合適的單元,進(jìn)行少量的調(diào)整后拼接得到最終的合成語音。這一階段主要的技術(shù)思路是從模仿人體發(fā)聲機(jī)理入手進(jìn)行語音合成,合成效果的清晰度和自然度都不高。1980年,D. Klatt設(shè)計出串/并聯(lián)混合型共振峰合成器,使用串聯(lián)通道產(chǎn)生元音和濁輔音,并聯(lián)通道產(chǎn)生清輔音,還可以對聲源做各種選擇和調(diào)整以模擬不同的嗓音,是早期較為先進(jìn)的語音合成系統(tǒng)。1960年,推動了語音合成技術(shù)的進(jìn)步。 圖3 語音合成技術(shù)發(fā)展的三階段:語音合成技術(shù)研究起步于二十世紀(jì)三十年代。狹義的語音合成技術(shù)則是指文本語音轉(zhuǎn)化技術(shù)(TTS),目前主流的語音合成技術(shù)主要是指TTS,我們在這里只針對狹義的語音合成技術(shù)進(jìn)行討論。由于語音合成技術(shù)和語音識別技術(shù)在技術(shù)原理和實(shí)現(xiàn)方法上存在較大差異,我們將分別針對這兩種技術(shù)進(jìn)行介紹。嵌入式芯片技術(shù)特別是SOC技術(shù)的發(fā)展及芯片價格的不斷下降,將有力推動智能語音技術(shù)在移動設(shè)備市場的應(yīng)用。隨著芯片運(yùn)算能力的不斷增長,更為復(fù)雜的語音技術(shù)算法不斷得以實(shí)現(xiàn)。摩爾定律是計算機(jī)芯片技術(shù)發(fā)展的經(jīng)驗(yàn)性規(guī)律,其主要內(nèi)容是:在相同面積集成電路上可容納的晶體管數(shù)目,約每隔18個月便會增加一倍,即芯片性能將提升一倍,而價格
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1