freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

20xx新編機(jī)器人的語(yǔ)音識(shí)別技術(shù)(已修改)

2024-10-29 12:38 本頁(yè)面
 

【正文】 1 機(jī)器人的語(yǔ)音識(shí)別技術(shù) 摘要 1897 年, MG馬可尼所完成的無(wú)線(xiàn)通信試驗(yàn)就是在固定站與一艘拖船之間進(jìn)行的,距離為 18 海里。 標(biāo)志著通信進(jìn)入了一個(gè)新的時(shí)代,隨著社會(huì)的進(jìn)步,科技發(fā)展也日益興盛起來(lái)。電子技術(shù)和智能自動(dòng)化的發(fā)展更是為人們的日常生活和工業(yè)生產(chǎn)提供了極大的方便。 人們可以通過(guò)一系列的信息傳遞來(lái)直接或間接的控制機(jī)械的運(yùn)轉(zhuǎn)。 讓機(jī)器能夠聽(tīng)懂人類(lèi)的語(yǔ)言并且能夠按照人的口頭命令行動(dòng),從而實(shí)現(xiàn)人際交流一直以來(lái)都是人類(lèi)的一個(gè)夢(mèng)想。 本文所研究的機(jī)器人語(yǔ)音識(shí)別和控制,對(duì)于服務(wù)于機(jī)器人的應(yīng)用領(lǐng)域具有重要的現(xiàn)實(shí)意義。 通過(guò) 單片機(jī)可以很方便的實(shí)現(xiàn)語(yǔ)音控制技術(shù),本次設(shè)計(jì) 是利用 凌陽(yáng)單片機(jī) SPCE061A 的語(yǔ)音識(shí)別控制特性 , 根據(jù)語(yǔ)音識(shí)別的基本原理,對(duì)智能機(jī)器人進(jìn)行語(yǔ)音控制,使其根據(jù)人的指令做出左轉(zhuǎn)、右轉(zhuǎn)、前進(jìn)、后退、跳舞、發(fā)射飛碟等相應(yīng)的動(dòng)作。 由于材料等各方面的限制,只能以理論的形式出現(xiàn)。 關(guān)鍵詞 : 語(yǔ)音識(shí)別,語(yǔ)音控制(嵌入式語(yǔ)音的識(shí)別技術(shù)),智能機(jī)器人,語(yǔ)音壓縮算法 2 目錄 1 緒論 …………………………………………………… .3 本次課題的由來(lái) 設(shè)計(jì)目的及任務(wù) 及設(shè)計(jì)理念 聲控機(jī)器人的發(fā)展前景 整體 方案的規(guī)劃 2 嵌入式語(yǔ)音的識(shí)別技術(shù) …………………………… 11 模式匹配原理的引入 語(yǔ)音識(shí)別技術(shù)總括 3 軟件設(shè)計(jì) ???????????????? .20 主程序的設(shè)計(jì) 語(yǔ)音壓縮算法的研究 關(guān)鍵模塊的設(shè)計(jì) 4 功能的實(shí)現(xiàn) ??????????????? ..29 機(jī)器人預(yù)想功能的總體實(shí)現(xiàn) 5 設(shè)計(jì)總結(jié) ………………………………………… .30 1 緒論 設(shè)計(jì)課題由來(lái) 單片機(jī)在現(xiàn)實(shí)生活中越來(lái)越多的 被應(yīng)用于工業(yè)生產(chǎn)和生活?yuàn)蕵?lè)當(dāng)中 。 自從人類(lèi)能夠使用機(jī)器以來(lái),就有一個(gè)夢(mèng)想,那就是能夠與機(jī) 3 器人進(jìn)行語(yǔ)言交流,讓機(jī)器人按照人的指令去完成相應(yīng)的操作。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器人通過(guò)語(yǔ)音識(shí)別把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高新技術(shù)。語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和人工智能等等。都屬于電子信息專(zhuān)業(yè)的基本課程。 隨著社會(huì)的進(jìn)步和日益發(fā)展,智能自動(dòng)化系統(tǒng)逐漸被應(yīng)用到服務(wù)行業(yè)。于是“機(jī)器人”也就應(yīng)運(yùn)而生了,但是現(xiàn)在機(jī)器人的發(fā)展還處在一個(gè)不成熟的階段,它還不能象人們想象的那樣做出各種 各樣的動(dòng)作來(lái)服務(wù)于人類(lèi)。隨著社會(huì)的發(fā)展,人們的物質(zhì)文化生活水平也有了較大的提高,為了滿(mǎn)足人們愈來(lái)愈高的要求,機(jī)器人的深入和普及也越來(lái)越受到人們的關(guān)注。 人有五官,機(jī)器人的視覺(jué) —— 電子攝象已經(jīng)隨著安全防護(hù)的發(fā)展有了一定的發(fā)展,平常我們?cè)跇怯畋O(jiān)控系統(tǒng)可以看到簡(jiǎn)單的機(jī)器人視覺(jué)系統(tǒng)(電子攝象及處理) ,數(shù)碼相機(jī)等 。聲音的控制 除了我們平常所遇到的聲控?zé)?,我們很難再找到別的。 語(yǔ)音 —— 這種人類(lèi)最簡(jiǎn)單、最自然、最方便和最有效的交換信息的方式,在機(jī)器人上的應(yīng)用還較少。 基于單片機(jī)和外圍接口技術(shù),我們可以大致畫(huà)出語(yǔ)音控制的基本框 圖。 4 圖 最原始的機(jī)器人語(yǔ)音控制 用語(yǔ)音控制來(lái)操作機(jī)器人代替煩瑣的鍵盤(pán)輸入。和機(jī)器通話(huà)實(shí)現(xiàn)人機(jī)對(duì)話(huà)是十分誘人的 ,具有廣闊的發(fā)展前景,是機(jī)器人人工智能的重要標(biāo)志。 語(yǔ) 音 命 令 語(yǔ) 音 識(shí) 別 代 碼 輸 出 機(jī) 器 人動(dòng) 作 碼 機(jī) 器 人動(dòng) 作 碼機(jī) 器 人 執(zhí)行 相 應(yīng)動(dòng) 作 圖 改進(jìn)的機(jī)器人語(yǔ)音識(shí)別框圖 設(shè)計(jì)的目的及任務(wù) 中央處理系統(tǒng) 機(jī)器人控制 顯示器 語(yǔ)音處理系統(tǒng) 5 我們想象中的理想機(jī)器人應(yīng)該是能夠象人類(lèi)一樣聽(tīng)懂自然語(yǔ)言,可以在燥聲情況下,一定的頻率范圍內(nèi)。語(yǔ)言是由不同的人的聲帶所發(fā)出的,人們辨別它主要是通 過(guò)聲波的變換來(lái)判斷的,這就是我們平常所說(shuō)的音變。這樣就使基本模型的音界變的不甚明確,于是在明確的電腦語(yǔ)言處理下就變的比較困難。 在人們普通的對(duì)話(huà)中,有時(shí)候人類(lèi)自己也很難辨別對(duì)方模糊的語(yǔ)音 ,不同的詞語(yǔ)聽(tīng)起來(lái)會(huì)非常相似,這就是我們平常所說(shuō)的語(yǔ)音的模糊性。 在語(yǔ)音的控制方面,首先要對(duì)燥聲環(huán)境,非特定人,語(yǔ)音模糊和音變等一系列事實(shí)的困難進(jìn)行過(guò)濾和處理,這就需要大量的數(shù)據(jù)處理,這樣分配給聽(tīng)覺(jué)的時(shí)間就非常有限。 于是普通的單片機(jī)就不能很好的滿(mǎn)足這樣一系列復(fù)雜的要求,這就需要在 已有語(yǔ)音識(shí)別技術(shù)的研究基礎(chǔ)上,配合功能強(qiáng)大的 凌陽(yáng) 16位單片機(jī) SPCE061A,對(duì)機(jī)器人的語(yǔ)音識(shí)別和特定命令對(duì)應(yīng)行為能力的結(jié)合進(jìn)行實(shí)現(xiàn),是一個(gè)實(shí)踐性和操作性要求較強(qiáng)的實(shí)用性課題。 機(jī)器人語(yǔ)音識(shí)別是語(yǔ)音識(shí)別在機(jī)器人領(lǐng)域的應(yīng)用,它的最終目的是讓機(jī)器人聽(tīng)懂人們口述的語(yǔ)言,進(jìn)而對(duì)口述語(yǔ)言中包含的要求或詢(xún)問(wèn)做出正確的動(dòng)作反應(yīng)或語(yǔ)言反應(yīng),從而形成一個(gè)良好的,自然的“人機(jī)通信系統(tǒng)”。以進(jìn)一步推動(dòng)服務(wù)機(jī)器人的發(fā)展和應(yīng)用。因此,研究機(jī)器人的語(yǔ)音識(shí)別, 對(duì)于服務(wù)機(jī)器人的普及與應(yīng)用意義重大。 未來(lái)科技的發(fā)展趨勢(shì)是在以人為本的前提下,更多地實(shí)現(xiàn)機(jī)器設(shè) 6 備的自動(dòng)化和智能化,讓機(jī)器 為人服務(wù),代替人們進(jìn)行繁重的體力勞動(dòng)和高危險(xiǎn)工程。借助機(jī)器之力進(jìn)行社會(huì)建設(shè)已經(jīng)成為了一個(gè)必然的選擇。隨之而來(lái)的發(fā)展與和諧生活的命題必然會(huì)將人機(jī)交流的重要性提到一個(gè)新的高度,成為服務(wù)型機(jī)器人投入社會(huì)的關(guān)鍵所在。 設(shè)計(jì)理念: 在整個(gè) 設(shè)計(jì)過(guò)程中,我們本著一切向 能實(shí)現(xiàn)理想機(jī)器人的方向靠攏。但是本次設(shè)計(jì)還缺乏一定的實(shí)踐。 聲控機(jī)器人的發(fā)展前景 機(jī)器人是多學(xué)科交叉的產(chǎn)物,集成了運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)、機(jī)械設(shè)計(jì)與制造、計(jì)算機(jī)硬件與軟件、控制與傳感器、模式識(shí)別與人工智能等學(xué)科領(lǐng)域的先進(jìn)理論與技術(shù)。同時(shí),它又是一類(lèi)典型的自動(dòng)化 機(jī)器,是專(zhuān)用自動(dòng)機(jī)器、數(shù)控機(jī)器的延伸與發(fā)展。當(dāng)前,社會(huì)需求和技術(shù)進(jìn)步都對(duì)機(jī)器人向智能化發(fā)展提出了新的要求。 語(yǔ)音信號(hào)處理技術(shù)就是使用數(shù)字信號(hào)處理技術(shù)對(duì)于因信號(hào)進(jìn)行處理,處理的目的使用得到的某些參數(shù)進(jìn)行高效傳輸、存儲(chǔ)、語(yǔ)音增強(qiáng)、語(yǔ)音合成和語(yǔ)音識(shí)別 。 我國(guó)的語(yǔ)音識(shí)別系統(tǒng)的研究起步比較晚,但是也取得了很好的成績(jī),研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱茫瑥?1987 年開(kāi)始執(zhí)行國(guó)家 863計(jì)劃后,國(guó)家 863 智能計(jì)算機(jī)專(zhuān)家組為語(yǔ)音識(shí)別技術(shù)研究專(zhuān)門(mén)理想,每?jī)赡隄L動(dòng)一次。我國(guó) PC 機(jī)語(yǔ)音識(shí)別技術(shù)的研究水平已經(jīng)基本上與國(guó)外同步,在漢語(yǔ)語(yǔ)音 識(shí)別技術(shù)上還有自己的特點(diǎn)和優(yōu)勢(shì),但是獨(dú)立開(kāi)發(fā)的專(zhuān)用漢語(yǔ)語(yǔ)音識(shí)別芯片還是較少,多數(shù)都是與國(guó)外研究機(jī)構(gòu)合作開(kāi)發(fā)研制的。 7 可以說(shuō),語(yǔ)音識(shí)別的研究已經(jīng)得到了全世界范圍的重視,是引領(lǐng)未來(lái)科學(xué)發(fā)展方向的關(guān)鍵技術(shù)之一。因此,研究機(jī)器人的語(yǔ)音識(shí)別,開(kāi)發(fā)實(shí)用的機(jī)器人語(yǔ)音識(shí)別系統(tǒng),對(duì)于服務(wù)機(jī)器人的普及與應(yīng)用意義重大。 整體方案的規(guī)劃 本課題是基于 SPCE061A 的智能機(jī)器人語(yǔ)音識(shí)別的實(shí)現(xiàn),最終目的是形成一個(gè)較好的人機(jī)交流環(huán)境,使機(jī)器人能夠聽(tīng)懂經(jīng)過(guò)訓(xùn)練的人的口頭命令,并能夠按照命令進(jìn)行相應(yīng)的動(dòng)作。 由多帶通濾波器及現(xiàn)行匹 配電路構(gòu)成的專(zhuān)用 IC。專(zhuān)用 IC 是以 8位或 16 位單片機(jī)為計(jì)算核心,外加 A/D 轉(zhuǎn)換, D/A 轉(zhuǎn)換及存儲(chǔ)器。 由 DSP 組成的語(yǔ)音識(shí)別系統(tǒng),一般由定點(diǎn) 16 位 DSP,外加 A/D轉(zhuǎn)換, D/A 轉(zhuǎn)換,以及 ROM、 RAM、 FALSH 等存儲(chǔ)器組成。由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成的語(yǔ)音識(shí)別專(zhuān)用芯片。 SOC 是將 MCU 或 DSP、 A/D、 D/A、 RAM、 ROM 以及預(yù)放、功放等電路集成在一個(gè)芯片上,只要加上極少的電源供電等外圍電路,就可以實(shí)現(xiàn)語(yǔ)音識(shí)別、語(yǔ)音合成及語(yǔ)音回放等功能。 SPCE061A 是一種集成度很高的單片機(jī),它將 MCU、 A/D、 D/A、RAM、 ROM 集成在一塊芯片上,同時(shí)具有 16*16 位的乘法運(yùn)算和內(nèi)積運(yùn)算功能, CPU 最高時(shí)鐘頻率可達(dá)到 49MHz。 本課題的主要實(shí)現(xiàn)過(guò)程是:外部語(yǔ)音命令通過(guò)轉(zhuǎn)換裝置輸入到系統(tǒng)內(nèi)部,經(jīng)過(guò)語(yǔ)音識(shí)別程序的處理轉(zhuǎn)化為機(jī)器人可識(shí)別的觸發(fā)命令然 8 后觸發(fā)相應(yīng)子程序進(jìn)行相關(guān)動(dòng)作。動(dòng)作的實(shí)現(xiàn)方法是:凌陽(yáng) 61 板向控制不同端口送高低電平以控制置于機(jī)器人內(nèi)部不同位置的電機(jī)的運(yùn)轉(zhuǎn),調(diào)用延時(shí),根據(jù)需要使各個(gè)部分電機(jī)相互配合,完成要求的動(dòng)作,從而實(shí)現(xiàn)機(jī)器人的語(yǔ)音控制。 本設(shè)計(jì)綜合考慮 SPCE061A 單片機(jī)的特性以及機(jī)器人行動(dòng)模式來(lái)進(jìn)行設(shè) 計(jì),具體模塊如圖 。 整個(gè)設(shè)計(jì)分為主控模塊、語(yǔ)音模塊、電機(jī)模塊等,各個(gè)模塊分別完成,然后進(jìn)行結(jié)合,實(shí)現(xiàn)機(jī)器人的語(yǔ)音識(shí)別。具體過(guò)程是:首先進(jìn)行機(jī)器人的語(yǔ)音訓(xùn)練,我們這次設(shè)計(jì)采用的是特定人語(yǔ)音識(shí)別,每一個(gè)命令發(fā)布者都必須在發(fā)布命令之前對(duì)機(jī)器人進(jìn)行命令的語(yǔ)音訓(xùn)練。這樣做有一個(gè)好處,非特定人不能命令機(jī)器人進(jìn)行動(dòng)作 。 9 整個(gè)硬件設(shè)計(jì)部分以保持機(jī)器人外部靈活性 為前提,在機(jī)器人各個(gè)部分內(nèi)置電機(jī),利用三極管的通斷特性來(lái)設(shè)計(jì)電路,完成硬件電路的設(shè)計(jì)和組裝。具體電 路如下: 左右腿、脖子電機(jī)驅(qū)動(dòng)模塊 (摘抄) 加速及發(fā)射電機(jī) 10 輸入 /輸出接口 P _ IO A / B _ B uffer ( 讀 )P _ IO A / B _ Da ta ( 寫(xiě) )P _ IO A / B _ B uffer ( 寫(xiě) )P _ IO A / B _ Dir ( 讀 / 寫(xiě) )P _ IO A / B _ Attib ( 讀 / 寫(xiě) )P _ IO A / B _ Da ta ( 讀 )數(shù)據(jù)寄存器和控制邏輯下拉I / O引腳上拉 11 嵌入式語(yǔ)音的識(shí)別技術(shù) 模式匹配原理的引入 嵌入式語(yǔ)音識(shí)別系統(tǒng)都采用了模式匹配的原理,語(yǔ)音識(shí)別一般分為兩個(gè)步驟。第一步是系統(tǒng)“學(xué)習(xí)”或“訓(xùn)練”階段。這一階段的任務(wù)是建立識(shí)別基本單元的聲學(xué)模型以及進(jìn)行文法分析的語(yǔ)言模型,即構(gòu)建參考模式庫(kù)。第二是“識(shí)別”或“測(cè)試 ”階段。根據(jù)識(shí)別系統(tǒng)的類(lèi)型選擇能夠滿(mǎn)足要求的一種識(shí)別方法,采用語(yǔ)音分析方法分析出這種識(shí)別方法所需求的語(yǔ)音特征參數(shù),按照一定的準(zhǔn)則和測(cè)度與參考模式的模型進(jìn)行比較,通過(guò)判決得出結(jié)果。 輸入語(yǔ)音 預(yù)處理特征 提取識(shí)別 模式 匹配識(shí)別結(jié)果語(yǔ)音模型庫(kù)訓(xùn)練 特征提取 經(jīng)過(guò)預(yù)處理后的語(yǔ)音信號(hào),要對(duì)其進(jìn)行特征提取,即特征參數(shù)分析。該過(guò)程就是從原始語(yǔ)音信號(hào)中抽取能夠反映語(yǔ)音本質(zhì)的特征參數(shù),形成特征矢量序列。目前語(yǔ)音識(shí)別所用的特征參數(shù)主要有兩種類(lèi)型:線(xiàn)性預(yù)測(cè)倒譜系數(shù)( LPCC)和美爾頻標(biāo)倒譜系數(shù)( MFCC)。 LPCC系數(shù)主要模 擬人的發(fā)聲模型,為考慮人耳的聽(tīng)覺(jué)特性。它對(duì)元音有較好的描述能力,而對(duì)輔音描述能力差。其優(yōu)點(diǎn)是計(jì)算量小,比較徹底 12 地去掉了語(yǔ)音產(chǎn)生過(guò)程中的激勵(lì)信息,易于實(shí)現(xiàn)。 MFCC 系數(shù)考慮到了人聽(tīng)覺(jué)特性,并具有很高的 抗噪聲能力,但因?yàn)樘崛?MFCC 參數(shù)要在頻域處理,計(jì)算傅立葉變換將耗費(fèi)大量寶貴的計(jì)算資源。因此,嵌入式語(yǔ)音識(shí)別系統(tǒng)中一般都選用 LPCC 系數(shù)。語(yǔ)音特征提取是分幀提取的,每幀特征參數(shù)一般構(gòu)成一個(gè)矢量,因此,語(yǔ)音特征是一個(gè)矢量序列。該序列的數(shù)據(jù)率一般可能過(guò)高,不便于其后的進(jìn)一步處理,為此,有必要采用很有效的數(shù)據(jù)壓縮技術(shù)方 法對(duì)數(shù)據(jù)進(jìn)行壓縮。矢量量化就是一種很好的數(shù)據(jù)壓縮技術(shù)。 參考模式庫(kù) 參考模式庫(kù)是將一個(gè)或多個(gè)說(shuō)話(huà)者的多次重復(fù)的語(yǔ)音參數(shù)經(jīng)過(guò)訓(xùn)練得到的。它是聲學(xué)參數(shù)模板。建立參考模式庫(kù)是在系統(tǒng)使用前獲得并存儲(chǔ)起來(lái)的。參考模式庫(kù)的建立過(guò)程稱(chēng)為訓(xùn)練過(guò)程。 模式匹配 模式匹配是將輸入的待識(shí)別的語(yǔ)音特征參數(shù)同訓(xùn)練得到的參考語(yǔ)音模式進(jìn)行逐一比較分析,獲得最優(yōu)匹配的參考模式便是識(shí)別結(jié)果。目前常用的語(yǔ)音識(shí)別算法主要有:動(dòng)態(tài)時(shí)間規(guī)整( DTW) 、隱馬爾可夫( HMM) 理論、矢量量化( VQ)技術(shù)。 13 語(yǔ)音信號(hào)識(shí)別技術(shù) 語(yǔ)音識(shí)別的過(guò) 程就是 將用 麥克風(fēng)或電話(huà)捕捉到 的 聲波信號(hào) 轉(zhuǎn)化成一組詞語(yǔ)的過(guò)程。被準(zhǔn)確識(shí)別的詞語(yǔ) 可 以得出 最后的結(jié)果 ,進(jìn)入響應(yīng) ,如指揮與控制系統(tǒng) , 數(shù)據(jù)輸入和文件的準(zhǔn)備工作 。 也可以作為 輸入, 為進(jìn)一步 的 語(yǔ)言加工 服務(wù), 以達(dá)到講話(huà) 被 理解 的目的 。 矢量量化的基本原理 將若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量(或者是從一幀語(yǔ)音數(shù)據(jù)中提取的特征矢量)在多維空間給與整體量化,從而可以在信息量損失較小的情況下壓縮數(shù)據(jù)量。矢量量化有效地應(yīng)用了矢量中各元素之間的相關(guān)性,因此可以比標(biāo)量量化有更好的壓縮效果。 當(dāng)給矢量量化器輸入一個(gè)任意 矢量 ix ∈ kR 進(jìn)行矢量量化時(shí),矢量量化器首先判斷它屬于哪個(gè)子空間 jR 的代表矢量 jY 。 也就是說(shuō),矢量量化過(guò)程就是用 jY 代表 iX 的過(guò)程,或者說(shuō)把 iX 量化成了 jY Y。 ( ) , 1 , 1jiY Q X j J i N? ? ? ? ? 式中, ()iQX —— 量化器
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1