freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

語音控制小車設計方案(已修改)

2025-05-11 02:19 本頁面
 

【正文】 語音控制小車設計方案 國內外語音識別技術的發(fā)展現狀與機器交流一直是人們的夢想,人們也在一直不斷的探索研究著,如今語音識別技術的發(fā)展也已經逐步成熟[2] 禹琳琳. 語音識別技術及應用綜述[J]. 現代電子技術,2013,13:4345.,它在高新信息產業(yè)的人機交互中起著關鍵性作用,語音識別技術是今后和未來智能化發(fā)展的一個重要突破口。國外語音識別技術的快速發(fā)展是在上個世紀的九十年代[3] 佘利忠. 基于神經網絡的漢語數碼語音識別技術研究[D].湖南師范大學,2008.;早在五十年代初期,外國人研發(fā)了一臺能識別10個數字英文發(fā)音的系統(tǒng),現如今的語音識別技術又有了新的發(fā)展方向,即分為特定與非特定連續(xù)語音識別,還分有大詞匯量的語音識別和孤立詞識別以及多人語音識別等,在該技術的鄰域里面,還運用了神經網絡技術。由于前期許多大公司對語音識別技術的投入很大的資本,使其發(fā)展非常迅速;九十年代后,語音識別技術的評估機制不斷提高,在語音識別的準確率上也顯著提升[4] 郭恒飛. 基于非特定人車載電器語音集成控制系統(tǒng)的設計與實現[D].合肥工業(yè)大學,2011.;如今,語音產品非常的多元化,國外非常著名的語音系統(tǒng)有Siri、Google Now以及微軟Cortana,這些技術都基本應用在手機,Siri衍生于美國國防部的研究產品,它原是主要使用在為軍方處理一些復雜的事情,如今成為民用軟件,成為人們學習生活的個人助理,Siri成立于2007年,通過與Nuance合作,發(fā)展成為真正的語音識別工具,Siri能夠在如今的手機當中成為一個使用的機器人,人類通過自然的語音輸入,使它能夠搜索資料、播報實況、安排行程、提問對答等;除了SIri 外其他的語音識別軟件的使用在生活當中也都是大同小異,都是為人們提供快速便捷的服務。在五十年代,我國開始研究語音識別技術,由于科技的發(fā)展相當快速,語音識別的研究進展也很快。以前只是在實驗室里探索研究,現如今已發(fā)展到面向生活實際。在80年代后期,由于我國對語音識別技術發(fā)展執(zhí)行相關計劃,我們的語音識別技術的發(fā)展進入到一個全新的發(fā)展階段,大部分權威的科研機構都曾經在實驗室進行過語音識別技術方面的研究[5] 彭輝,魏瑋,陸建華. 特定人孤立詞的語音識別系統(tǒng)研究[J]. 控制工程,2011,03:397400+404.。據報道,在07年某月北京的自然博物館中,新開展館展出了一只具有語音對話功能的智能熊貓,其外形逼真,當人和它說話的時候,它能夠在人多嘈雜的展館中識別出人說的話,識別成功率也很高;之后了解到它是在非特定人連續(xù)語音識別系統(tǒng)上開發(fā)制作的,基于該系統(tǒng)特性,這只機器熊貓識別人們說話的成功率在98%左右,所以在展館中非常有趣。隨著對語音識別技術的著重發(fā)展,特別是人們生活中,小詞匯量的非特定人語音識別使用廣泛,受日常人們的生活需要,且識別率很高,因而這也足以證明:人們在平常生活中,中小詞匯量的非特定人識別技術是即實用又受歡迎的。在2009年前后,由于語音識別解碼器的高度集成發(fā)展為我國的語音識別實時應用提供了殷實的基礎;隨著互聯(lián)網的發(fā)展,我國著名的語音識別系統(tǒng)有百度語音,它不僅提供一般的語音服務,在手機及導航中,為用戶定制了特色的搜索服務。到現在,我國語音識別技術也相對成熟,國內該方向上的研究水平也與國外差不多,除此外,在漢語識別的技術上,我們擁有技術上特點與優(yōu)勢,該技術加有我們中國獨有的特色元素。 課題設計意義 在大多數的小車設計中,小車的控制都是基于手動遙控控制小車的運動狀態(tài),需要操作人員通過用手操控遙控裝置來實現,對此,本次課題設計主要是通過語音來控制小車,從而解放我們的雙手,做到更加智能化的控制小車,打破傳統(tǒng)的小車控制操作,讓小車明白你說了什么,并根據說出的口令命令進行相應動作,開創(chuàng)新的小車控制方式,;語音小車在現代的玩具制造業(yè)中也占據著重要的地位,小車以語音控制的這一新穎控制方式,受到很多小孩子的喜歡,他們可以像動畫片中的主人公一樣,擁有一個屬于自己的機器人,能夠對它進行語音控制,提高了玩具的趣味性;就此,我們的課題以非特定人語音識別展開設計,語音識別的研究在語音識別系統(tǒng)穩(wěn)定實用化中成為一個非常重要的方向[6] 張利平. 漢語連續(xù)語音識別系統(tǒng)的研究與實現[D].西北大學,2010.。語音識別技術的研究取得了顯著的進步,從以前的假想實現成為現實;如現在的智能玩具市場中,智能小車作為微電子智能玩具是面向廣大群眾需求的主流,這區(qū)別于傳統(tǒng)式的手遙控小車運動方式,大大的帶給人們一種前所未有的新鮮感,在這些設計系統(tǒng)當中,語音識別技術是關鍵,讓人們體驗到不用動手只用開口的真正智能化。通過課題設計,我自己也能了解學到一些有關語音識別技術方面的知識,這些知識區(qū)別于我所在學校學到的傳統(tǒng)基礎知識,它能讓自己大開眼界,了解到現在的語音識別科技的發(fā)展趨勢,設計中,也讓自己把在學校中學到的知識重新的復習了一遍,讓自己受益匪淺。語音識別技術的應用也很廣,不僅僅局限于玩具小車的設計中,在現在的高端產品中都擔任著重要的角色,如家具電器、智能手機、智能導航儀等中都發(fā)揮著不可估量的作用。因此,展開語音小車的設計是非常有意義的。 課題設計方案經過多方的學習參考文獻資料,由此得出了三種最初的設計方案,并加以認真考慮那種方法最為適于課題的設計。方案一:采用STC11L08XE單片機作為主控芯片,語音識別模塊使用LD3320語音芯片,由于LD3320芯片集成了語音接收識別處理器和外部電路,其系統(tǒng)也精簡,由于LD3320芯片集成了語音識別處理器和外部電路,包括AD 和DA 轉換器、麥克風、聲音輸出等接口,且不需要外接任何的輔助芯片如Flash、RAM[7] 金鑫,田犇,闕大順. 基于LD3320的語音控制系統(tǒng)設計實現[J]. 電腦與信息技術,2011,06:2225.;由于電路的精簡,讓各個芯片之間按原理設計的要求焊接在一起,使用起來非常的實用方便,該語音模塊能夠直接集成在現有的產品中,并且可以直接實現語音識別、聲控、人機對話等功能,此語音模塊的市場價格相對比較便宜,它采用的非特定人連續(xù)語音識別的技術,使得該模塊的語音識別率相當高;通過使用LM2596和LM2940芯片作電源模塊,分別為兩個直流電機、L298N、語音模塊提供電源,采用定時/計數器T0產生的PWM方波來控制電機的正反轉等運動狀態(tài)[8] 張戟,楊騰飛. 車載自動語音識別系統(tǒng)設計[J]. 佳木斯大學學報(自然科學版),2011,02:201205.,實現該方案結構如圖11所示:圖11 STC單片機方案框圖方案二:使用凌陽SPCE061A單片機來設計語音小車,這款芯片非常的強大,其內部集成了語音的識別模塊并且具有語音的播報和錄放功能的模塊[9] 馮平,張治中. 多功能語音控制小車的設計與實現[J]. 數字通信,2009,01:8789.,只需要焊接好麥克風(MIC)和拓展語音的功放就可以了,在本設計當中,只要一塊SPCE061A就能實現基本的功能模塊的功能,極其的精簡,在設計過程中節(jié)約了大量的時間,非常的便于使用,但是價格比較昂貴,這個方案的基本結構圖如圖12所示:圖12 凌陽61核心方案框圖方案三:這個方案是基于TMS320vc5420這款芯片的語音處理板的設計,整個設計都是圍繞著TMS320vc5420為主要核心電路進行設計,該系統(tǒng)以語音CODEC芯片與DSP芯片作為最主要核心,并且具有強大的數據處理的能力和較靈活的與外部通信的接口電路,其預算處理的速度非常的高效,能夠快速的分析處理大量的語音信號的數據,實時性也不錯,基于其性價比比較昂貴,一般用的不是太多,這個方案的設計如圖13所示:圖13 DSP核心方案框圖由以上方案對比,方案一其性價比也相對比較便宜,基于該核心芯片是能夠識別非特定人語音的,并且該芯片的識別正確率也很高,有95%這樣的識別正確率,區(qū)別于一些需要進行事先錄制聲音的語音識別芯片,在芯片外圍電路也比較簡單,芯片外圍設有喇叭、麥克風等拓展口,在語音識別方面上有較大的優(yōu)勢;方案二運用的比較的廣泛,看起來也比較簡易,但是考慮到其在軟件上的設計比較困難并且整個設計價格較高;方案三雖然對語音信號的數據處理非常的強大,但是也考慮到其昂貴的價格,不宜選擇;所以經過這三種方案的探討與仔細的分析思考后,決定選擇方案一為此次設計方案。2 語音小車硬件設計 語音小車原理框圖基于硬件平臺的設計,構建小車硬件原理框如圖21所示。語音信號輸入LD3320語音芯片小車兩個直流電機L298N電機驅動模塊STC11L08XE單片機REG1117穩(wěn)壓芯片電源模塊電池盒圖21 語音小車原理框圖此次的設計有三個大模塊,即為語音識別模塊LD3320(與單片機STC11L08XE集合在一塊板子上)、電源模塊(由LM2596和LM2940組成)、電機驅動模塊L298N;在小車的設計上,在驅動小車上,電池輸出電壓由電壓可調LM2596芯片穩(wěn)壓后輸出,為小車的兩個直流電機提供驅動電源;一部分由LM2940芯片把電池輸出電壓穩(wěn)定在5V,測試輸出穩(wěn)定后,專門為整個語音芯片工作;,這樣才能夠使整個語音模塊正常的工作;當接收語音的信號時候,該信號會經過語音芯片的邏輯處理,通過芯片內部的AD/DA轉換,變換成單片機能夠讀取的數字信號,通過I/O口,由單片機內部的邏輯處理,再通過軟件的編程,使用定時器中斷T0產生脈沖寬度調制波(PWM)信號,然后再通過控制輸出I/O口的操作,對L298N發(fā)出相對應的控制信號,實現對小車電機運動狀態(tài)的操作。 語音識別模塊語音模塊電路原理如圖21所示。圖21 語音模塊電路原理圖在語音模塊中,里面含有3塊芯片,一塊是語音信號接收識別模塊(LD3320),一塊是語音處理模塊(STC11L08XE)以及REG1117穩(wěn)壓模塊[10] 黃仿元. 利用語音識別技術實現的室內照明電路控制系統(tǒng)[J]. 電子制作,2013,14:3940.,在這個原理圖當中,STC11L08XE單片機與LD3320是以并行方式連接的;在單片機芯片外部,設計有芯片復位電路,為單片機工作提供工作時鐘頻率;在語音芯片外圍,該語音芯片與單片機共用同一個時鐘輸入,并設計有喇叭音量外部控制電路,在本次設計中未使用到該電路,除此,還設計有麥克風增益的輔助電路,在調節(jié)麥克風的靈敏度時,會使用到該電路,還有一些外圍電源處理電路,目的是為了讓電源信號穩(wěn)定,不影響芯片工作;除了外圍電路,同時還要為P0~P7口、讀寫信號口、片選信號口、復位口及MD、A0口接上上拉電阻,保證這些端口信號穩(wěn)定。在整個硬件的語音模塊中,該模塊對外部語音信號進行識別處理的過程如圖22所示。LD3320語音識別芯片單片機拼音字符串識別結果關鍵詞列表MIC輸入特征的提取語音識別器頻譜分析圖22 語音模塊處理過程框圖在芯片中語音識別功能是通過在內部關鍵詞列表中的詞語與語音相匹配出結果的過程;在對語音進行識別時候,在芯片內部把聲音的頻譜轉換成相應特征的語音,根據這個語音特征,語音再從關鍵詞列表中,逐個對列表詞語進行匹配,在匹配出最好最優(yōu)的關鍵詞后,將其作為語音識別的結果[11] 武劍虹,黃石磊,匡鏡明. 語音識別系統(tǒng)測試平臺設計[J]. 電訊技術,2003,04:102105.。例如:在我們日常的手機的應用里面,關鍵詞語的內容就包括了電話本里面的聯(lián)系人或者手機里面存儲短信的人的名字、手機應用功能的設置菜單命令、存儲卡里面的存儲的歌曲的曲名,地圖地址等。根據需要,設置相應的寄存器,通過改變里面的數據,就能夠把列表中相對應的待識別條目內容以字符竄的形式寫入到語音識別芯片,修改一些需要設定關鍵詞;從算法角度來看,每一條關鍵詞語最多能夠容納的字數是限制在30個字以內,但是從大多數的實際情況來看,用戶在說出條目時,如果一下子說超過8個字以上的關鍵詞,這樣肯定會有說錯字、說漏字、說多字、停頓等情況,這些情況都會嚴重影響語音的識別,從而造成語音識別的錯誤,大大的提高了誤識別率。因此,一般來說,如果想要獲得較為準確的語音識別結果,條目中的關鍵詞語字數不要太長,盡量短一些,這樣識別的準確率也相對提高了很多。LD3320芯片原理圖如圖23所示。圖23 語音芯片原理圖LD3320語音芯片的誕生,是在人們生活中非特定人語音識別的要求下,由設計開發(fā)人員特別研發(fā)設計出來的,并作出了相關技術的解決辦法?;诳紤]設計的實用性和便捷,開發(fā)設計時在LD3320語音芯片周圍集成了高精度的A/D和D/A的轉換接口,內部有放大處理,因此不再需要外接任何的Flash 和RAM等輔助芯片,高度的集成就能夠實現語音識別、聲控、人機對話等功能。并且,在識別的關鍵詞語列表里面,關鍵詞是可以進行動態(tài)編輯的?;贚D3320語音芯片的強大功能,它能夠在幾乎任何的電子產品中,包括以最簡單且普遍的51單片機作為主要控制芯片的系統(tǒng)里面,也可以輕松的實現各種語音人機交流等功能。同時也為市面上基本所有的電子產品,添加了VUI(Voice User Interface)語音用戶操作的界面,增加了電子語音功能特色。該款芯片的主要功能有:①非特定人語音識別技術:在進行語音識別的時候,不需要使用者事先進行錄音練習;可以直接進行語音識別,語音識別的準確率高達95%;②真正獨立芯片解決方案:由于其內部存儲空間容量比較大,不需擴展外接RAM和Flash,從而不用外擴而降低該芯片的使用成本;③在芯片內置有高精度的D/A與A/D通道:由于芯片本身的設計開發(fā),它可以在內部自動完成AD轉換,除此,在AD的輸入上面只需接好MIC,就可以完成模擬量的輸入,在DA輸出上能夠播放聲音的文件,不用外接放大器,在內部集成有550mw的放大器;④高準確度和實用的語音識別效果:可容納50條關鍵詞,隨意自由編輯詞條內容,但是,對外界語音也只能從這50條關鍵字中進行識別匹配;因此在不同的場合可以根據需要編輯不同的關鍵詞
點擊復制文檔內容
規(guī)章制度相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1