freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

智能語(yǔ)音行業(yè)發(fā)展分析報(bào)告終(編輯修改稿)

2024-08-16 01:44 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 么?”這樣的問(wèn)題時(shí),你可以訓(xùn)練它回答“我打算與朋友一起去看哈里波特,你也一起來(lái)吧。目前MyCyberTwin還是一項(xiàng)免費(fèi)的服務(wù),它是由澳大利亞悉尼的一家名為RelevanceNow的公司推出的,雖然現(xiàn)在它還處于測(cè)試階段。 當(dāng)然,這個(gè)概念還是一個(gè)全新的概念。你的cybertwin與Eliza一樣,其核心中并沒(méi)有真正的智能,如果你沒(méi)有設(shè)定好各種問(wèn)題的回答,它自己是不會(huì)回答的。 然而,MyCyberTwin網(wǎng)站還提供了許多擴(kuò)展工具來(lái)幫你預(yù)測(cè)各種可能的提問(wèn),比如人格測(cè)試、你對(duì)性、政治和宗教的觀點(diǎn)等。那些工具也都是免費(fèi)的。 RelevanceNow打算通過(guò)向會(huì)話使用量很大的用戶比如商業(yè)公司收取會(huì)話費(fèi)的方式來(lái)營(yíng)利,將MyCyberTwin授權(quán)給社群網(wǎng)站后,也許以后可以通過(guò)它為用戶提供有針對(duì)性的網(wǎng)絡(luò)廣告。 HCI人機(jī)交互 人機(jī)交互 CHI(Computer Human Interaction),國(guó)際上也稱(chēng)(HCI,Human Computer Interaction)是一門(mén)跨學(xué)科的研究,它的研究?jī)?nèi)容很廣,包括心理學(xué)領(lǐng)域的認(rèn)知科學(xué),心理學(xué);軟件工程領(lǐng)域的系統(tǒng)構(gòu)架技術(shù);信息處理領(lǐng)域的語(yǔ)音處理技術(shù)和圖像處理技術(shù);人工智能領(lǐng)域的智能控制技術(shù)等。總的來(lái)說(shuō),人機(jī)交互本質(zhì)上是認(rèn)知過(guò)程,人機(jī)交互理論是以認(rèn)知科學(xué)為理論基礎(chǔ);人機(jī)交互系統(tǒng)是一個(gè)閉環(huán)系統(tǒng),人機(jī)交互研究是以系統(tǒng)科學(xué)作為人機(jī)交互研究的框架的方法學(xué);同時(shí),人機(jī)交互是以信息技術(shù)作為用戶界面的技術(shù)基礎(chǔ),通過(guò)信息系統(tǒng)的建模、形式化描述、整合算法、評(píng)估方法以及軟件框架等信息技術(shù)最終實(shí)現(xiàn)和應(yīng)用人機(jī)交互理論。HCI主要包含五個(gè)方面的主題 :人機(jī)交互的特性;計(jì)算機(jī)的相關(guān)性;人的特性;計(jì)算機(jī)系統(tǒng)和界面架構(gòu);系統(tǒng)開(kāi)發(fā)的規(guī)范和過(guò)程。 第三章 語(yǔ)音識(shí)別行業(yè)概述 語(yǔ)音識(shí)別技術(shù)的發(fā)展史語(yǔ)音識(shí)別的研究工作大約開(kāi)始于20世紀(jì)50年代,當(dāng)時(shí)ATamp。T Bell實(shí)驗(yàn)室基于共振峰提取技術(shù)實(shí)現(xiàn)了第一個(gè)可識(shí)別十個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng)——Audry系統(tǒng)?! ?0年代,計(jì)算機(jī)的應(yīng)用推動(dòng)了語(yǔ)音識(shí)別的發(fā)展。這時(shí)期的重要成果是提出了動(dòng)態(tài)時(shí)間規(guī)劃(DP)和線性預(yù)測(cè)分析技術(shù)(LPC),其中后者較好地解決了語(yǔ)音信號(hào)產(chǎn)生模型的問(wèn)題,對(duì)語(yǔ)音識(shí)別的發(fā)展產(chǎn)生了深遠(yuǎn)影響?! ?0年代,語(yǔ)音識(shí)別領(lǐng)域取得了較大進(jìn)展。在理論上,LP技術(shù)得到進(jìn)一步發(fā)展,動(dòng)態(tài)時(shí)間歸正技術(shù)(DTW)基本成熟,特別是提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。在實(shí)踐上,實(shí)現(xiàn)了基于線性預(yù)測(cè)倒譜和DTW技術(shù)的特定人孤立語(yǔ)音識(shí)別系統(tǒng)?! ?0年代,MFCC的參數(shù)提取技術(shù)和HMM模型的深入使用使得語(yǔ)音識(shí)別技術(shù)得到進(jìn)一步的發(fā)展,語(yǔ)音識(shí)別的問(wèn)題逐步在理論體系上得到了比較完整和準(zhǔn)確的描述,同時(shí)在實(shí)踐上又逐步研發(fā)出效率較高的解決算法。進(jìn)入90年代后,語(yǔ)音識(shí)別技術(shù)進(jìn)一步成熟,并開(kāi)始向市場(chǎng)提供產(chǎn)品。許多發(fā)達(dá)國(guó)家如美國(guó)、日本、韓國(guó)以及IBM、Apple、ATamp。T、Microsoft等公司都為語(yǔ)音識(shí)別系統(tǒng)的實(shí)用化開(kāi)發(fā)研究投以巨資。同時(shí)漢語(yǔ)語(yǔ)音識(shí)別也越來(lái)越受到重視。IBM開(kāi)發(fā)的 ViaVoice和Microsoft開(kāi)發(fā)的中文識(shí)別引擎都具有了相當(dāng)高的漢語(yǔ)語(yǔ)音識(shí)別水平。進(jìn)入21世紀(jì),隨著消費(fèi)類(lèi)電子產(chǎn)品的普及,嵌入式語(yǔ)音處理技術(shù)發(fā)展迅速[2]。基于語(yǔ)音識(shí)別芯片的嵌入式產(chǎn)品也越來(lái)越多,如Sensory公司的RSC系列語(yǔ)音識(shí)別芯片、Infineon公司的Unispeech和Unilite語(yǔ)音芯片等,這些芯片在嵌入式硬件開(kāi)發(fā)中得到了廣泛的應(yīng)用。在軟件上,目前比較成功的語(yǔ)音識(shí)別軟件有:Nuance、IBM的Viavoice和Microsoft的SAPI以及開(kāi)源軟件HTK,這些軟件都是面向非特定人、大詞匯量的連續(xù)語(yǔ)音識(shí)別系統(tǒng)。我國(guó)語(yǔ)音識(shí)別研究一直緊跟國(guó)際水平,國(guó)家也很重視。國(guó)內(nèi)中科院的自動(dòng)化所、聲學(xué)所以及清華大學(xué)等科研機(jī)構(gòu)和高校都在從事語(yǔ)音識(shí)別領(lǐng)域的研究和開(kāi)發(fā)。國(guó)家863智能計(jì)算機(jī)專(zhuān)家組為語(yǔ)音識(shí)別技術(shù)研究專(zhuān)門(mén)立項(xiàng),并取得了高水平的科研成果。我國(guó)中科院自動(dòng)化所研制的非特定人、連續(xù)語(yǔ)音聽(tīng)寫(xiě)系統(tǒng)和漢語(yǔ)語(yǔ)音人機(jī)對(duì)話系統(tǒng),其準(zhǔn)確率和系統(tǒng)響應(yīng)率均可達(dá)90%以上。 語(yǔ)音識(shí)別技術(shù)概述 語(yǔ)音識(shí)別是解決機(jī)器“聽(tīng)懂”人類(lèi)語(yǔ)言的一項(xiàng)技術(shù)。作為智能計(jì)算機(jī)研究的主導(dǎo)方向和人機(jī)語(yǔ)音通信的關(guān)鍵技術(shù),語(yǔ)音識(shí)別技術(shù)一直受到各國(guó)科學(xué)界的廣泛關(guān)注。如今,隨著語(yǔ)音識(shí)別技術(shù)研究的突破,其對(duì)計(jì)算機(jī)發(fā)展和社會(huì)生活的重要性日益凸現(xiàn)出來(lái)。以語(yǔ)音識(shí)別技術(shù)開(kāi)發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,如聲控電話交換、信息網(wǎng)絡(luò)查詢(xún)、家庭服務(wù)、賓館服務(wù)、醫(yī)療服務(wù)、銀行服務(wù)、工業(yè)控制、語(yǔ)音通信系統(tǒng)等,幾乎深入到社會(huì)的每個(gè)行業(yè)和每個(gè)方面。 廣泛意義上的語(yǔ)音識(shí)別按照任務(wù)的不同可以分為4個(gè)方向:說(shuō)話人識(shí)別、關(guān)鍵詞檢出、語(yǔ)言辨識(shí)和語(yǔ)音識(shí)別。說(shuō)話人識(shí)別技術(shù)是以話音對(duì)說(shuō)話人進(jìn)行區(qū)別,從而進(jìn)行身份鑒別和認(rèn)證的技術(shù)。關(guān)鍵詞檢出技術(shù)應(yīng)用于一些具有特定要求的場(chǎng)合,只關(guān)注那些包含特定詞的句子,例如對(duì)一些特殊人名、地名的電話監(jiān)聽(tīng)等。語(yǔ)言辨識(shí)技術(shù)是通過(guò)分析處理一個(gè)語(yǔ)音片斷以判別其所屬語(yǔ)言種類(lèi)的技術(shù),本質(zhì)上也是語(yǔ)音識(shí)別技術(shù)的一個(gè)方面。語(yǔ)音識(shí)別就是通常人們所說(shuō)的以說(shuō)話的內(nèi)容作為識(shí)別對(duì)象的技術(shù),它是4個(gè)方面中最重要和研究最廣泛的一個(gè)方向。 從語(yǔ)音識(shí)別的流程處理來(lái)看,語(yǔ)音識(shí)別系統(tǒng)同樣可以分成前端和后端兩部分:前端處理音頻流,從而分隔出可能的發(fā)聲聲音片段,并將它們轉(zhuǎn)換成一系列能夠用計(jì)算機(jī)表示的數(shù)值;后端是一個(gè)專(zhuān)用的搜索引擎,它獲取前端產(chǎn)生的輸出并對(duì)三個(gè)數(shù)據(jù)庫(kù)(聲學(xué)模型、語(yǔ)言模型和詞典)進(jìn)行搜索解碼,并給出最終的識(shí)別結(jié)果。語(yǔ)音識(shí)別的步驟可分為三步:第一步是根據(jù)識(shí)別系統(tǒng)的類(lèi)型選擇識(shí)別方法,分析出所需要的語(yǔ)音特征參數(shù),并將這些參數(shù)作為標(biāo)準(zhǔn)模式由機(jī)器存儲(chǔ)起來(lái),形成參考模式庫(kù);第二步是語(yǔ)音識(shí)別的核心,采用選擇的語(yǔ)音識(shí)別方法進(jìn)行模式匹配,具體內(nèi)容又可分別表現(xiàn)為模型的建立、訓(xùn)練和識(shí)別三個(gè)部分;第三步,語(yǔ)音識(shí)別系統(tǒng)可以進(jìn)行識(shí)別后處理,識(shí)別后處理通常是一個(gè)音字轉(zhuǎn)換過(guò)程,有可能包括更高層次的詞法、句法和文法處理,另外也可以作為某個(gè)具體任務(wù)的語(yǔ)法輸入。語(yǔ)音識(shí)別主要的技術(shù)評(píng)價(jià)指標(biāo)包括:識(shí)別內(nèi)容限制(連續(xù)語(yǔ)句還是命令詞)、識(shí)別詞語(yǔ)容量(孤立詞還是大詞匯量)、識(shí)別正確率、識(shí)別使用人員限制(針對(duì)特定人還是不限定使用者)、魯棒性(使用者口音適應(yīng)能力、抗環(huán)境噪聲能力)。按照最為重要的指標(biāo)識(shí)別內(nèi)容限制進(jìn)行劃分,語(yǔ)音識(shí)別技術(shù)可分為大詞匯量連續(xù)語(yǔ)流識(shí)別技術(shù)和命令詞語(yǔ)音識(shí)別技術(shù)。命令詞語(yǔ)音識(shí)別技術(shù)作為現(xiàn)在應(yīng)用最為廣泛的語(yǔ)音識(shí)別技術(shù),按照應(yīng)用場(chǎng)景和核心性能可分為電話命令詞語(yǔ)音識(shí)別技術(shù)和嵌入式命令詞語(yǔ)音識(shí)別技術(shù)。中小詞匯量非特定人語(yǔ)音識(shí)別系統(tǒng)識(shí)別精度已經(jīng)大于98%,對(duì)特定人語(yǔ)音識(shí)別系統(tǒng)的識(shí)別精度就更高,這些技術(shù)已經(jīng)能夠滿足通常應(yīng)用的需要。 語(yǔ)音識(shí)別面臨的問(wèn)題與未來(lái)發(fā)展 目前的語(yǔ)音識(shí)別技術(shù)并不完美,其主要局限有:(1)語(yǔ)音識(shí)別對(duì)環(huán)境依賴(lài)性較強(qiáng),在某種環(huán)境下采集到的語(yǔ)音訓(xùn)練系統(tǒng)只能在該環(huán)境下應(yīng)用,否則系統(tǒng)性能將急劇下降;(2)Lombard 效應(yīng)導(dǎo)致高噪聲環(huán)境下的語(yǔ)音識(shí)別困難,由于高噪音環(huán)境下人的發(fā)音變化很大,如聲音變高、語(yǔ)速變慢等,這些變化導(dǎo)致音調(diào)及共振峰的變化,從而使得語(yǔ)音識(shí)別的準(zhǔn)確度顯著降低;(3)系統(tǒng)的適應(yīng)性差,主要表現(xiàn)在語(yǔ)音識(shí)別系統(tǒng)的性能受許多因素影響,如不同的說(shuō)話人、說(shuō)話方式、環(huán)境噪音、傳輸信道等,由于訓(xùn)練與識(shí)別環(huán)境的差異,同一個(gè)識(shí)別系統(tǒng)對(duì)于不同的用戶、不同的使用需求、不同的聲學(xué)環(huán)境下性能差異可以達(dá)到30%,使得語(yǔ)音識(shí)別技術(shù)的應(yīng)用范圍受到很大限制。 語(yǔ)音識(shí)別技術(shù)未來(lái)可能的發(fā)展方向有兩個(gè):(1)語(yǔ)言模型從概率模型向以語(yǔ)言學(xué)為基礎(chǔ)的文法模型轉(zhuǎn)變,要使計(jì)算機(jī)真正理解人類(lèi)的自然語(yǔ)言,就必須在這一點(diǎn)上取得進(jìn)展,同時(shí)隨著硬件資源的不斷發(fā)展,一些核心算法如特征提取、搜索算法、自適應(yīng)算法等將有進(jìn)一步改進(jìn)的可能;(2)人工神經(jīng)網(wǎng)絡(luò)(ANN)技術(shù)在語(yǔ)音識(shí)別領(lǐng)域有可能實(shí)現(xiàn)突破,人工神經(jīng)網(wǎng)絡(luò)是由結(jié)點(diǎn)互連組成的計(jì)算網(wǎng)絡(luò),本質(zhì)上是對(duì)人類(lèi)大腦神經(jīng)元活動(dòng)的模擬,具有自學(xué)習(xí)能力、記憶、聯(lián)想、推理、概括能力和快速并行實(shí)現(xiàn)的特點(diǎn),同時(shí)還具備自組織、自適應(yīng)的功能。人工神經(jīng)網(wǎng)絡(luò)技術(shù)的這些特點(diǎn)是HMM 模型所不具備的,適合用于處理一些環(huán)境信息復(fù)雜、背景知識(shí)模糊、推理規(guī)則不明確的問(wèn)題,因此對(duì)于噪聲環(huán)境下非特定人的語(yǔ)音識(shí)別問(wèn)題來(lái)說(shuō)是一種很好的解決方案,目前基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的語(yǔ)音識(shí)別系統(tǒng)仍處于實(shí)驗(yàn)室研究階段。 語(yǔ)音作為當(dāng)前通信系統(tǒng)中最自然的通信媒介,語(yǔ)音識(shí)別技術(shù)是非常重要的人機(jī)交互技術(shù)。隨著計(jì)算機(jī)和語(yǔ)音處理技術(shù)的發(fā)展,語(yǔ)音識(shí)別系統(tǒng)的實(shí)用性將進(jìn)一步提高。應(yīng)用語(yǔ)音的自動(dòng)理解和翻譯,可消除人類(lèi)相互交往的語(yǔ)言障礙。國(guó)外已有多種基于語(yǔ)音識(shí)別產(chǎn)品(如聲控?fù)芴?hào)電話、語(yǔ)音記事本等)的應(yīng)用,基于特定任務(wù)和環(huán)境的聽(tīng)寫(xiě)機(jī)也已經(jīng)進(jìn)入應(yīng)用階段。這預(yù)示著語(yǔ)音識(shí)別技術(shù)有著非常廣泛的應(yīng)用領(lǐng)域和市場(chǎng)前景。隨著語(yǔ)音技術(shù)的進(jìn)步和通信技術(shù)的飛速發(fā)展,語(yǔ)音識(shí)別技術(shù)將為網(wǎng)上會(huì)議、商業(yè)管理、醫(yī)藥衛(wèi)生、教育培訓(xùn)等各個(gè)領(lǐng)域帶來(lái)極大的便利,其應(yīng)用和經(jīng)濟(jì)、社會(huì)效益前景非常良好。 第四章 智能語(yǔ)音技術(shù)概述 智能語(yǔ)音技術(shù)簡(jiǎn)介 核心算法和芯片技術(shù)共同推動(dòng)語(yǔ)音技術(shù)應(yīng)用深化語(yǔ)音識(shí)別應(yīng)用決定智能語(yǔ)音行業(yè)未來(lái)成長(zhǎng)。從智能語(yǔ)音技術(shù)的發(fā)展歷程來(lái)看,應(yīng)用的技術(shù)推動(dòng)力主要是語(yǔ)音技術(shù)核心算法和計(jì)算機(jī)芯片技術(shù)。二十世紀(jì)末,建立在統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)理念基礎(chǔ)上的語(yǔ)音技術(shù)核心算法逐步成熟,基于HMM(隱馬爾可夫模型)的語(yǔ)音合成及識(shí)別技術(shù)在實(shí)用中占據(jù)了主導(dǎo)地位。計(jì)算機(jī)芯片技術(shù)則遵照摩爾定律,每18個(gè)月性能提升1倍,芯片運(yùn)算能力的持續(xù)增長(zhǎng)使得更為復(fù)雜的語(yǔ)音技術(shù)算法不斷得以實(shí)現(xiàn)。嵌入式芯片技術(shù)特別是SOC技術(shù)的發(fā)展及芯片成本的下降,有力推動(dòng)了智能語(yǔ)音技術(shù)在移動(dòng)設(shè)備中的應(yīng)用。智能語(yǔ)音技術(shù)是人工智能的研究領(lǐng)域之一,其技術(shù)原理涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。智能語(yǔ)音技術(shù)主要研究人機(jī)之間語(yǔ)音信息的處理問(wèn)題,按機(jī)器在其中所發(fā)揮作用的不同,可分為語(yǔ)音合成和語(yǔ)音識(shí)別兩大類(lèi)人機(jī)語(yǔ)音通信問(wèn)題,如圖所示。 從智能語(yǔ)音技術(shù)的發(fā)展歷程來(lái)看,其應(yīng)用的主要推動(dòng)力之一是語(yǔ)音技術(shù)核心算法的不斷進(jìn)步。上世紀(jì)九十年代,建立在統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)理念基礎(chǔ)之上的語(yǔ)音技術(shù)核心算法逐步成熟,基于HMM(隱馬爾可夫模型)的語(yǔ)音合成及識(shí)別技術(shù)在實(shí)用中逐漸占據(jù)了主導(dǎo)地位。如果未來(lái)核心算法能在自然語(yǔ)言理解上取得突破,則有望通過(guò)智能語(yǔ)音技術(shù)真正實(shí)現(xiàn)人機(jī)智能交互,從而使語(yǔ)音技術(shù)得到更加廣泛的應(yīng)用。 推動(dòng)智能語(yǔ)音技術(shù)進(jìn)入實(shí)用的另一主要?jiǎng)恿t是計(jì)算機(jī)芯片技術(shù)的不斷進(jìn)步。摩爾定律是計(jì)算機(jī)芯片技術(shù)發(fā)展的經(jīng)驗(yàn)性規(guī)律,其主要內(nèi)容是:在相同面積集成電路上可容納的晶體管數(shù)目,約每隔18個(gè)月便會(huì)增加一倍,即芯片性能將提升一倍,而價(jià)格則基本
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1