freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

20xx新編機器人的語音識別技術(shù)(已修改)

2025-10-24 12:38 本頁面
 

【正文】 1 機器人的語音識別技術(shù) 摘要 1897 年, MG馬可尼所完成的無線通信試驗就是在固定站與一艘拖船之間進行的,距離為 18 海里。 標志著通信進入了一個新的時代,隨著社會的進步,科技發(fā)展也日益興盛起來。電子技術(shù)和智能自動化的發(fā)展更是為人們的日常生活和工業(yè)生產(chǎn)提供了極大的方便。 人們可以通過一系列的信息傳遞來直接或間接的控制機械的運轉(zhuǎn)。 讓機器能夠聽懂人類的語言并且能夠按照人的口頭命令行動,從而實現(xiàn)人際交流一直以來都是人類的一個夢想。 本文所研究的機器人語音識別和控制,對于服務(wù)于機器人的應用領(lǐng)域具有重要的現(xiàn)實意義。 通過 單片機可以很方便的實現(xiàn)語音控制技術(shù),本次設(shè)計 是利用 凌陽單片機 SPCE061A 的語音識別控制特性 , 根據(jù)語音識別的基本原理,對智能機器人進行語音控制,使其根據(jù)人的指令做出左轉(zhuǎn)、右轉(zhuǎn)、前進、后退、跳舞、發(fā)射飛碟等相應的動作。 由于材料等各方面的限制,只能以理論的形式出現(xiàn)。 關(guān)鍵詞 : 語音識別,語音控制(嵌入式語音的識別技術(shù)),智能機器人,語音壓縮算法 2 目錄 1 緒論 …………………………………………………… .3 本次課題的由來 設(shè)計目的及任務(wù) 及設(shè)計理念 聲控機器人的發(fā)展前景 整體 方案的規(guī)劃 2 嵌入式語音的識別技術(shù) …………………………… 11 模式匹配原理的引入 語音識別技術(shù)總括 3 軟件設(shè)計 ???????????????? .20 主程序的設(shè)計 語音壓縮算法的研究 關(guān)鍵模塊的設(shè)計 4 功能的實現(xiàn) ??????????????? ..29 機器人預想功能的總體實現(xiàn) 5 設(shè)計總結(jié) ………………………………………… .30 1 緒論 設(shè)計課題由來 單片機在現(xiàn)實生活中越來越多的 被應用于工業(yè)生產(chǎn)和生活娛樂當中 。 自從人類能夠使用機器以來,就有一個夢想,那就是能夠與機 3 器人進行語言交流,讓機器人按照人的指令去完成相應的操作。語音識別技術(shù)就是讓機器人通過語音識別把語音信號轉(zhuǎn)變?yōu)橄鄳奈谋净蛎畹母咝录夹g(shù)。語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和人工智能等等。都屬于電子信息專業(yè)的基本課程。 隨著社會的進步和日益發(fā)展,智能自動化系統(tǒng)逐漸被應用到服務(wù)行業(yè)。于是“機器人”也就應運而生了,但是現(xiàn)在機器人的發(fā)展還處在一個不成熟的階段,它還不能象人們想象的那樣做出各種 各樣的動作來服務(wù)于人類。隨著社會的發(fā)展,人們的物質(zhì)文化生活水平也有了較大的提高,為了滿足人們愈來愈高的要求,機器人的深入和普及也越來越受到人們的關(guān)注。 人有五官,機器人的視覺 —— 電子攝象已經(jīng)隨著安全防護的發(fā)展有了一定的發(fā)展,平常我們在樓宇監(jiān)控系統(tǒng)可以看到簡單的機器人視覺系統(tǒng)(電子攝象及處理) ,數(shù)碼相機等 。聲音的控制 除了我們平常所遇到的聲控燈,我們很難再找到別的。 語音 —— 這種人類最簡單、最自然、最方便和最有效的交換信息的方式,在機器人上的應用還較少。 基于單片機和外圍接口技術(shù),我們可以大致畫出語音控制的基本框 圖。 4 圖 最原始的機器人語音控制 用語音控制來操作機器人代替煩瑣的鍵盤輸入。和機器通話實現(xiàn)人機對話是十分誘人的 ,具有廣闊的發(fā)展前景,是機器人人工智能的重要標志。 語 音 命 令 語 音 識 別 代 碼 輸 出 機 器 人動 作 碼 機 器 人動 作 碼機 器 人 執(zhí)行 相 應動 作 圖 改進的機器人語音識別框圖 設(shè)計的目的及任務(wù) 中央處理系統(tǒng) 機器人控制 顯示器 語音處理系統(tǒng) 5 我們想象中的理想機器人應該是能夠象人類一樣聽懂自然語言,可以在燥聲情況下,一定的頻率范圍內(nèi)。語言是由不同的人的聲帶所發(fā)出的,人們辨別它主要是通 過聲波的變換來判斷的,這就是我們平常所說的音變。這樣就使基本模型的音界變的不甚明確,于是在明確的電腦語言處理下就變的比較困難。 在人們普通的對話中,有時候人類自己也很難辨別對方模糊的語音 ,不同的詞語聽起來會非常相似,這就是我們平常所說的語音的模糊性。 在語音的控制方面,首先要對燥聲環(huán)境,非特定人,語音模糊和音變等一系列事實的困難進行過濾和處理,這就需要大量的數(shù)據(jù)處理,這樣分配給聽覺的時間就非常有限。 于是普通的單片機就不能很好的滿足這樣一系列復雜的要求,這就需要在 已有語音識別技術(shù)的研究基礎(chǔ)上,配合功能強大的 凌陽 16位單片機 SPCE061A,對機器人的語音識別和特定命令對應行為能力的結(jié)合進行實現(xiàn),是一個實踐性和操作性要求較強的實用性課題。 機器人語音識別是語音識別在機器人領(lǐng)域的應用,它的最終目的是讓機器人聽懂人們口述的語言,進而對口述語言中包含的要求或詢問做出正確的動作反應或語言反應,從而形成一個良好的,自然的“人機通信系統(tǒng)”。以進一步推動服務(wù)機器人的發(fā)展和應用。因此,研究機器人的語音識別, 對于服務(wù)機器人的普及與應用意義重大。 未來科技的發(fā)展趨勢是在以人為本的前提下,更多地實現(xiàn)機器設(shè) 6 備的自動化和智能化,讓機器 為人服務(wù),代替人們進行繁重的體力勞動和高危險工程。借助機器之力進行社會建設(shè)已經(jīng)成為了一個必然的選擇。隨之而來的發(fā)展與和諧生活的命題必然會將人機交流的重要性提到一個新的高度,成為服務(wù)型機器人投入社會的關(guān)鍵所在。 設(shè)計理念: 在整個 設(shè)計過程中,我們本著一切向 能實現(xiàn)理想機器人的方向靠攏。但是本次設(shè)計還缺乏一定的實踐。 聲控機器人的發(fā)展前景 機器人是多學科交叉的產(chǎn)物,集成了運動學與動力學、機械設(shè)計與制造、計算機硬件與軟件、控制與傳感器、模式識別與人工智能等學科領(lǐng)域的先進理論與技術(shù)。同時,它又是一類典型的自動化 機器,是專用自動機器、數(shù)控機器的延伸與發(fā)展。當前,社會需求和技術(shù)進步都對機器人向智能化發(fā)展提出了新的要求。 語音信號處理技術(shù)就是使用數(shù)字信號處理技術(shù)對于因信號進行處理,處理的目的使用得到的某些參數(shù)進行高效傳輸、存儲、語音增強、語音合成和語音識別 。 我國的語音識別系統(tǒng)的研究起步比較晚,但是也取得了很好的成績,研究水平也從實驗室逐步走向?qū)嵱?,?1987 年開始執(zhí)行國家 863計劃后,國家 863 智能計算機專家組為語音識別技術(shù)研究專門理想,每兩年滾動一次。我國 PC 機語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音 識別技術(shù)上還有自己的特點和優(yōu)勢,但是獨立開發(fā)的專用漢語語音識別芯片還是較少,多數(shù)都是與國外研究機構(gòu)合作開發(fā)研制的。 7 可以說,語音識別的研究已經(jīng)得到了全世界范圍的重視,是引領(lǐng)未來科學發(fā)展方向的關(guān)鍵技術(shù)之一。因此,研究機器人的語音識別,開發(fā)實用的機器人語音識別系統(tǒng),對于服務(wù)機器人的普及與應用意義重大。 整體方案的規(guī)劃 本課題是基于 SPCE061A 的智能機器人語音識別的實現(xiàn),最終目的是形成一個較好的人機交流環(huán)境,使機器人能夠聽懂經(jīng)過訓練的人的口頭命令,并能夠按照命令進行相應的動作。 由多帶通濾波器及現(xiàn)行匹 配電路構(gòu)成的專用 IC。專用 IC 是以 8位或 16 位單片機為計算核心,外加 A/D 轉(zhuǎn)換, D/A 轉(zhuǎn)換及存儲器。 由 DSP 組成的語音識別系統(tǒng),一般由定點 16 位 DSP,外加 A/D轉(zhuǎn)換, D/A 轉(zhuǎn)換,以及 ROM、 RAM、 FALSH 等存儲器組成。由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成的語音識別專用芯片。 SOC 是將 MCU 或 DSP、 A/D、 D/A、 RAM、 ROM 以及預放、功放等電路集成在一個芯片上,只要加上極少的電源供電等外圍電路,就可以實現(xiàn)語音識別、語音合成及語音回放等功能。 SPCE061A 是一種集成度很高的單片機,它將 MCU、 A/D、 D/A、RAM、 ROM 集成在一塊芯片上,同時具有 16*16 位的乘法運算和內(nèi)積運算功能, CPU 最高時鐘頻率可達到 49MHz。 本課題的主要實現(xiàn)過程是:外部語音命令通過轉(zhuǎn)換裝置輸入到系統(tǒng)內(nèi)部,經(jīng)過語音識別程序的處理轉(zhuǎn)化為機器人可識別的觸發(fā)命令然 8 后觸發(fā)相應子程序進行相關(guān)動作。動作的實現(xiàn)方法是:凌陽 61 板向控制不同端口送高低電平以控制置于機器人內(nèi)部不同位置的電機的運轉(zhuǎn),調(diào)用延時,根據(jù)需要使各個部分電機相互配合,完成要求的動作,從而實現(xiàn)機器人的語音控制。 本設(shè)計綜合考慮 SPCE061A 單片機的特性以及機器人行動模式來進行設(shè) 計,具體模塊如圖 。 整個設(shè)計分為主控模塊、語音模塊、電機模塊等,各個模塊分別完成,然后進行結(jié)合,實現(xiàn)機器人的語音識別。具體過程是:首先進行機器人的語音訓練,我們這次設(shè)計采用的是特定人語音識別,每一個命令發(fā)布者都必須在發(fā)布命令之前對機器人進行命令的語音訓練。這樣做有一個好處,非特定人不能命令機器人進行動作 。 9 整個硬件設(shè)計部分以保持機器人外部靈活性 為前提,在機器人各個部分內(nèi)置電機,利用三極管的通斷特性來設(shè)計電路,完成硬件電路的設(shè)計和組裝。具體電 路如下: 左右腿、脖子電機驅(qū)動模塊 (摘抄) 加速及發(fā)射電機 10 輸入 /輸出接口 P _ IO A / B _ B uffer ( 讀 )P _ IO A / B _ Da ta ( 寫 )P _ IO A / B _ B uffer ( 寫 )P _ IO A / B _ Dir ( 讀 / 寫 )P _ IO A / B _ Attib ( 讀 / 寫 )P _ IO A / B _ Da ta ( 讀 )數(shù)據(jù)寄存器和控制邏輯下拉I / O引腳上拉 11 嵌入式語音的識別技術(shù) 模式匹配原理的引入 嵌入式語音識別系統(tǒng)都采用了模式匹配的原理,語音識別一般分為兩個步驟。第一步是系統(tǒng)“學習”或“訓練”階段。這一階段的任務(wù)是建立識別基本單元的聲學模型以及進行文法分析的語言模型,即構(gòu)建參考模式庫。第二是“識別”或“測試 ”階段。根據(jù)識別系統(tǒng)的類型選擇能夠滿足要求的一種識別方法,采用語音分析方法分析出這種識別方法所需求的語音特征參數(shù),按照一定的準則和測度與參考模式的模型進行比較,通過判決得出結(jié)果。 輸入語音 預處理特征 提取識別 模式 匹配識別結(jié)果語音模型庫訓練 特征提取 經(jīng)過預處理后的語音信號,要對其進行特征提取,即特征參數(shù)分析。該過程就是從原始語音信號中抽取能夠反映語音本質(zhì)的特征參數(shù),形成特征矢量序列。目前語音識別所用的特征參數(shù)主要有兩種類型:線性預測倒譜系數(shù)( LPCC)和美爾頻標倒譜系數(shù)( MFCC)。 LPCC系數(shù)主要模 擬人的發(fā)聲模型,為考慮人耳的聽覺特性。它對元音有較好的描述能力,而對輔音描述能力差。其優(yōu)點是計算量小,比較徹底 12 地去掉了語音產(chǎn)生過程中的激勵信息,易于實現(xiàn)。 MFCC 系數(shù)考慮到了人聽覺特性,并具有很高的 抗噪聲能力,但因為提取 MFCC 參數(shù)要在頻域處理,計算傅立葉變換將耗費大量寶貴的計算資源。因此,嵌入式語音識別系統(tǒng)中一般都選用 LPCC 系數(shù)。語音特征提取是分幀提取的,每幀特征參數(shù)一般構(gòu)成一個矢量,因此,語音特征是一個矢量序列。該序列的數(shù)據(jù)率一般可能過高,不便于其后的進一步處理,為此,有必要采用很有效的數(shù)據(jù)壓縮技術(shù)方 法對數(shù)據(jù)進行壓縮。矢量量化就是一種很好的數(shù)據(jù)壓縮技術(shù)。 參考模式庫 參考模式庫是將一個或多個說話者的多次重復的語音參數(shù)經(jīng)過訓練得到的。它是聲學參數(shù)模板。建立參考模式庫是在系統(tǒng)使用前獲得并存儲起來的。參考模式庫的建立過程稱為訓練過程。 模式匹配 模式匹配是將輸入的待識別的語音特征參數(shù)同訓練得到的參考語音模式進行逐一比較分析,獲得最優(yōu)匹配的參考模式便是識別結(jié)果。目前常用的語音識別算法主要有:動態(tài)時間規(guī)整( DTW) 、隱馬爾可夫( HMM) 理論、矢量量化( VQ)技術(shù)。 13 語音信號識別技術(shù) 語音識別的過 程就是 將用 麥克風或電話捕捉到 的 聲波信號 轉(zhuǎn)化成一組詞語的過程。被準確識別的詞語 可 以得出 最后的結(jié)果 ,進入響應 ,如指揮與控制系統(tǒng) , 數(shù)據(jù)輸入和文件的準備工作 。 也可以作為 輸入, 為進一步 的 語言加工 服務(wù), 以達到講話 被 理解 的目的 。 矢量量化的基本原理 將若干個標量數(shù)據(jù)組成一個矢量(或者是從一幀語音數(shù)據(jù)中提取的特征矢量)在多維空間給與整體量化,從而可以在信息量損失較小的情況下壓縮數(shù)據(jù)量。矢量量化有效地應用了矢量中各元素之間的相關(guān)性,因此可以比標量量化有更好的壓縮效果。 當給矢量量化器輸入一個任意 矢量 ix ∈ kR 進行矢量量化時,矢量量化器首先判斷它屬于哪個子空間 jR 的代表矢量 jY 。 也就是說,矢量量化過程就是用 jY 代表 iX 的過程,或者說把 iX 量化成了 jY Y。 ( ) , 1 , 1jiY Q X j J i N? ? ? ? ? 式中, ()iQX —— 量化器
點擊復制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1