freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于語音識別的家居智能監(jiān)控系統(tǒng)本科生畢業(yè)設(shè)計說明書(編輯修改稿)

2025-12-14 04:16 本頁面
 

【文章內(nèi)容簡介】 領(lǐng)域的優(yōu)勢開發(fā)出智能家居的產(chǎn)品,能更好地和家電結(jié)合在一起,他們利用自己的渠道優(yōu)勢和市場影響力,積累多年的管理經(jīng)驗、生產(chǎn)經(jīng)驗和良好的售后服務(wù)、企業(yè)信譽來打開市場。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 3 智能家居的功能及意義 智能家居 ( Smart Home) 頻繁出現(xiàn)在各大媒體上,成了人們耳熟能詳?shù)脑~匯。目前關(guān)于智能家居的稱謂多種多樣,諸如:電子家庭 ( Electronic Home) 、 eHome、數(shù)字家園 ( Digital family) 、家庭自動化 ( Home Automation) 、家庭網(wǎng)絡(luò) ( Home /Networks for Home) 、網(wǎng)絡(luò)家居 ( Network Home) 、智能化家庭 ( Inte1ligent home) 等等幾十種,盡管名稱是五花八門,但它們的含義和所要完成的功能大體是相同的。 目前通常把智能家居被定義為利用電腦、網(wǎng)絡(luò)和綜合布線技術(shù),通過家庭信息管理平臺將與家居生活有關(guān)的各種子系統(tǒng)有機地結(jié)合的一個系統(tǒng)。也就是說,首先,它們都要在一個家居中建立一個通訊網(wǎng)絡(luò),為家庭信息提供必要的通路,在家庭網(wǎng)絡(luò)的操作系統(tǒng)的控制下,通過相應(yīng)的硬件和執(zhí)行機構(gòu),實現(xiàn)對所有家庭網(wǎng)絡(luò)上的家電和設(shè)備的控制和監(jiān)測。其次,它們都要通過一 定的媒介平臺,構(gòu)成與外界的通訊通道,以實現(xiàn)與家庭以外的世界溝信息,滿足遠程控制 /監(jiān)測和交換信息的需求。最后,它們的最終目的都是為滿足人們對安全、舒適、方便和符合綠色環(huán)境保護的需求 。 Speech SDK簡介 微軟的 Speech SDK是是微軟提供的軟件開發(fā)包,其中包含了語音識別和合成引擎相關(guān)組件、幫助文檔和例程,它是 —個語音識別和合成的二次開發(fā)平臺。我們可以利用這個平臺,在自己開發(fā)的軟件里嵌入語音識別和合成功能,從而使用戶可以用聲音來代替鼠標(biāo)和鍵盤完成部分操作,例如:文字輸入、菜單控制等,實現(xiàn)真正的 “人機對 話 ”。 Speech SDK是基于 COM的視窗操作系統(tǒng)開發(fā)工具包。這個 SDK中含有語音應(yīng)用程序接口( SAPI),微軟連續(xù)語音識別引擎( MCSR)以及串聯(lián)語音合成(又稱文本到語音)引擎( TTS)等等。 圖 SAPI框架圖 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 4 SAPI 中還包括對于低層控制和高度適應(yīng)性的直接語音管理,訓(xùn)練向?qū)?,事件,語法,編譯,資源,語音識別管理以及文本到語音管理,其結(jié)構(gòu)如圖 。 在 圖 ,語音框架主要靠 SAPI運行來實現(xiàn)應(yīng)用程序與語音引擎之間的協(xié)作,而SAPI提供各種接口實現(xiàn)不同的語音功能, SAPI使得應(yīng)用 程序和語音引擎之間高度緊密的結(jié)合,實時處理各種語音引擎在底層工作中的細節(jié)。本系統(tǒng)會同時使用到 SPEECH SDK的語音識別引擎和 TTS合成引擎.因此,對這兩個引擎的相關(guān)控制命令介紹如下。 語音識別引擎接口 (1)識別上下文 (1spRecoContext)接口:是主要的語音識別程序接口,主要用于發(fā)送和接收與語音識別相關(guān)的消息通知,創(chuàng)建語法規(guī)則對象。 (2)語音識別引擎 (1spReeognizer)接口:用于創(chuàng)建語音識別引擎的實例。 SAPI擁有兩種不同的語音識別引擎類型,一個是共享的語音識別引擎 (SharedRecognizer)。由于它可以與其他語音識別應(yīng)用程序共享其程序資源,所以在大多數(shù)場合中被推薦使用。需要建立一個采用共享語音識別引擎的識別環(huán)境 (IspRecoContext)。一個是獨占(1nProcRecognizer)的引擎,它只能由創(chuàng)建的應(yīng)用程序使用,而共享引擎可以提供多個應(yīng)用程序使用。 (3)語法規(guī)則 (IspRecoGrammar)接口:定義引擎需要識別的具體內(nèi)容,創(chuàng)建、載入和激活識別用的語法規(guī)則。 (4)識別結(jié)果 (IspVoice)接口:用于獲取識別的結(jié)果,包括識別的文字,識別的語法規(guī)則等。 語 音合成引擎接口 語音合成 (ISpVoice)接口:主要功能是實現(xiàn)文本到語音的轉(zhuǎn)換。它的作用如使用IspVoice:: Speak來從文本數(shù)據(jù)生成語音,從而使電腦會說話。當(dāng)處于異步工作時,可以使用 IspVoiee:: CetStatus來獲得發(fā)音狀態(tài)及文本位置等。在接口中,有許多成員函數(shù),通過這些成員函數(shù)可以實現(xiàn)對發(fā)音頻率、發(fā)音音量等合成屬性進行調(diào)整。在 C中,我們通過實現(xiàn) ISpVoice接口的 SpVoice類來實現(xiàn)語音合成。具體步驟如下: (1)首先創(chuàng)建 SpVoice類的對象; (2)利用對象成員函數(shù)設(shè)置語音屬 性,如果不設(shè)置,則按默認(rèn)方式處理; (3)調(diào)用對象成員函數(shù) speak函數(shù)來朗讀指定文本 Speak函數(shù)需要兩個參數(shù),第一個參數(shù)指明需要朗讀的文本。第二個參數(shù)指明發(fā)音方式。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 5 語音識別的發(fā)展歷史及應(yīng)用領(lǐng)域 國外研究歷史及現(xiàn)狀 語音識別的研究工作可以追溯到 20世紀(jì) 50年代 ATamp。T貝爾實驗室的 Audry系統(tǒng),它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)。 但真正取得實質(zhì)性進展,并將其作為一個重要的課題開展研究則是在 60年代末 70年代初。這首先是因為計算機技術(shù)的發(fā)展為語音識別的實現(xiàn)提供了硬件和軟件的可能,更重要的是語音 信號線性預(yù)測編碼( LPC)技術(shù)和動態(tài)時間規(guī)整( DTW)技術(shù)的提出,有效的解決了語音信號的特征提取和不等長匹配問題。這一時期的語音識別主要基于模板匹配原理,研究的領(lǐng)域局限在特定人,小詞匯表的孤立詞識別,實現(xiàn)了基于線性預(yù)測倒譜和 DTW技術(shù)的特定人孤立詞語音識別系統(tǒng);同時提出了矢量量化 (VQ) 和隱馬爾可夫模型 (HMM) 理論。 隨著應(yīng)用領(lǐng)域的擴大,小詞匯表、特定人、孤立詞等這些對語音識別的約束條件需要放寬,與此同時也帶來了許多新的問題:第一,詞匯表的擴大使得模板的選取和建立發(fā)生困難;第二,連續(xù)語音中,各個音素、 音節(jié)以及詞之間沒有明顯的邊界,各個發(fā)音單位存在受上下文強烈影響的協(xié)同發(fā)音( Coarticulation)現(xiàn)象;第三,非特定人識別時,不同的人說相同的話相應(yīng)的聲學(xué)特征有很大的差異,即使相同的人在不同的時間、生理、心理狀態(tài)下,說同樣內(nèi)容的話也會有很大的差異;第四,識別的語音中有背景噪聲或其他干擾。因此原有的模板匹配方法已不再適用。 實驗室語音識別研究的巨大突破產(chǎn)生于 20世紀(jì) 80年代末:人們終于在實驗室突破了大詞匯量、連續(xù)語音和非特定人這三大障礙,第一次把這三個特性都集成在一個系統(tǒng)中,比較典型的是卡耐基梅隆大學(xué) (Carnegie Mellon University)的 Sphinx系統(tǒng),它是第一個高性能的非特定人、大詞匯量連續(xù)語音識別系統(tǒng)。 這一時期,語音識別研究進一步走向深入,其顯著特征是 HMM模型和人工神經(jīng)元網(wǎng)絡(luò) (ANN) 在語音識別中的成功應(yīng)用。 HMM 模型的廣泛應(yīng)用應(yīng)歸功于 ATamp。T Bell 實驗室Rabiner 等科學(xué)家的努力,他們把原本艱澀的 HMM純數(shù)學(xué)模型工程化,從而為更多研究者了解和認(rèn)識,從而使統(tǒng)計方法成為了語音識別技術(shù)的主流。 統(tǒng)計方法將研究者的視線從微觀轉(zhuǎn)向宏觀,不再刻意追求語音特征的細化,而是 更多地從整體平均(統(tǒng)計)的角度來建立最佳的語音識別系統(tǒng)。在聲學(xué)模型方面,以 Markov鏈為基礎(chǔ)的語音序列建模方法 HMM(隱式 Markov鏈)比較有效地解決了語音信號短時內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 6 穩(wěn)定、長時時變的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語音的句子模型,達到了比較高的建模精度和建模靈活性。在語言層面上,通過統(tǒng)計真實大規(guī)模語料的詞之間同現(xiàn)概率即 N元統(tǒng)計模型來區(qū)分識別帶來的模糊音和同音詞。另外,人工神經(jīng)網(wǎng)絡(luò)方法、基于文法規(guī)則的語言處理機制等也在語音識別中得到了應(yīng)用。 20世紀(jì) 90年代前期,許多著名的大公司如 IBM、蘋果、 AT& T和 NTT都對語音識別系統(tǒng)的實用化研究投以巨資。語音識別技術(shù)有一個很好的評估機制,那就是識別的準(zhǔn)確率,而這項指標(biāo)在 20世紀(jì) 90年代中后期實驗室研究中得到了不斷的提高。比較有代表性的系統(tǒng)有: IBM公司推出的 Via Voice和 Dragon System公司的 Naturally Speaking, Nuance公司的 Nuance Voice Platform語音平臺, Microsoft的 Whisper, Sun的 VoiceTone等。 其中 IBM公司于 1997 年開發(fā)出漢語 ViaVoice 語音識別系統(tǒng),次 年又開發(fā)出可以識別上海話、廣東話和四川話等地方口音的語音識別系統(tǒng) ViaVoice98 。它帶有一個 32 000 詞的基本詞匯表,可以擴展到 65 000 詞,還包括辦公常用詞條,具有糾錯機制,其平均識別率可以達到 95 %。該系統(tǒng)對新聞?wù)Z音識別具有較高的精度,是目前具有代表性的漢語連續(xù)語音識別系統(tǒng)。 國內(nèi)研究歷史及現(xiàn)狀 我國語音識別研究工作起步于五十年代,但近年來發(fā)展很快。研究水平也從實驗室逐步走向?qū)嵱?。?1987年開始執(zhí)行國家 863計劃后,國家 863智能計算機專家組為語音識別技術(shù)研究專門立項,每兩年滾動一次。 我國語音識別技術(shù)的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術(shù)上還有自己的特點與優(yōu)勢,并達到國際先進水平。中科院自動化所、聲學(xué)所、清華大學(xué)、北京大學(xué)、哈爾濱工業(yè)大學(xué)、上海交通大學(xué)、中國科技大學(xué)、北京郵電大學(xué)、華中科技大學(xué)等科研機構(gòu)都有實驗室進行過語音識別方面的研究,其中具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動化研究所模式識別國家重點實驗室。 清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識別系統(tǒng)的識別精度,達到 %(不定長數(shù)字串)和 %(定長數(shù)字 串)。在有 5%的拒識率情況下,系統(tǒng)識別率可以達到 %(不定長數(shù)字串)和 %(定長數(shù)字串),這是目前國際最好的識別結(jié)果之一,其性能已經(jīng)接近實用水平。研發(fā)的 5000詞郵包校核非特定人連續(xù)語音識別系統(tǒng)的識別率達到 %,前三選識別率達 %;并且可以識別普通話與四川話兩種語言,達到實用要求。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 7 中科院自動化所及其所屬模式科技 (Pattek)公司 2020年發(fā)布了他們共同推出的面向不同計算平臺和應(yīng)用的天語中文語音系列產(chǎn)品 ——Pattek ASR,結(jié)束了中文語音識別產(chǎn)品自 1998年以來一直由國外 公司壟斷的歷史。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 8 第二章 智能家居監(jiān)控系統(tǒng)的方案設(shè)計 系統(tǒng)實現(xiàn)過程分析 在此設(shè)計中,主要體現(xiàn)了無線收發(fā)一體化,即無線在始終的進行著收和發(fā),這樣能更好的實現(xiàn)實時性。主控通過 AT89C52單片機做控制,將數(shù)據(jù)通過串口發(fā)送至電腦上,通過上位機界面顯示,在微軟公司的語音識別包的基礎(chǔ)上,以電腦為載體,可以通過語音來控制家中電器的工作,同時了解家中一切是否正常。這種方案的最大好處在于能夠幫助一些行動不便的老人或者一些殘疾人,在不需要走動的情況下了解家中安全狀態(tài),且可通過說話來直接控制家中電器的工作。如圖 示。 圖 系統(tǒng)整體結(jié)構(gòu)框圖 單片機最小系統(tǒng)板設(shè)計 本設(shè)計采用自己設(shè)計的最小系統(tǒng)開發(fā)板,分為四個模塊,主控模塊、現(xiàn)場控制模塊、通信模塊、電源模塊。下面分別介紹各個模塊。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 9 主控模塊 該系統(tǒng)采用的是 Atmel公司生產(chǎn)的 AT89C52單片機為主控器。 AT89C52是一個低電壓,高性能 CMOS 8位 單片機 ,片內(nèi)含 8k bytes的可反復(fù)擦寫的 Flash只讀程序存儲器和 256 bytes的隨機存取數(shù)據(jù)存儲器( RAM),器件采用 ATMEL公司 的高密度、非易失性存儲技術(shù)生產(chǎn),兼容標(biāo)準(zhǔn) MCS51指令系統(tǒng),片內(nèi)置通用 8位中央處理器和 Flash存儲單元,AT89C52單片機在電子行業(yè)中有著廣泛的應(yīng)用。 在單片機的引腳外圍固定的引腳,如 VCC( 40), GND( 20) 已經(jīng)正確固定到電源和地上。 X1( 18), X2( 19)是接晶振的引腳已經(jīng)外接到 30PF的電容。 RST(9)是單片機的復(fù)位引腳,通過 RC回路,作為單片機的上電復(fù)位。 作為 P3口的第二功能端口, ( 10) , ( 11) 為單片機的通信引腳,和 MAX232芯片連接。方便在下載程序時,只要上電復(fù)位即可完成下載的硬件操作。 另外,為了提高 P0口的驅(qū)動能力,在 P0口的各引腳上接了上拉電阻 Vcc=5V。采用一片 MAX232,為 RS232與 TTL電平的轉(zhuǎn)換,使得可以方面使用電腦的 COM口,對單片機進行程序的燒錄。 XTAL30pFC230pFC3X1 X2P11 圖 主控模塊晶振電路 10UFC110KR2VCCRESS1SWPB 圖 復(fù)位電路 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 10 另外,通過單片機驅(qū)動無線模塊,無線模塊在數(shù)據(jù)傳輸過程中起到了至關(guān)重要的作用,先簡單介紹下主控單片機原理圖,如果想讓單片機正常工 作,最重要的是晶振電路和復(fù)位電路了,其原理如圖 。 現(xiàn)場控制模塊 這個控制模塊也是以 AT89C52為主體,通過讀取無線接收到的數(shù)據(jù)或者通過將數(shù)據(jù)通過無線發(fā)送至主控,同時通過 12864液晶顯示器顯示現(xiàn)場得到的數(shù)據(jù)。 AT89C52主體電路如圖 。 VCCP00P01
點擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1