【文章內(nèi)容簡介】
音的識(shí)別,及針對移動(dòng)客服領(lǐng)域錄音的優(yōu)化。 場景分割: 將一個(gè)通話錄音中的用戶語音和坐席語音分離出來,從而分別對中高端 客戶和客服的語音進(jìn)行針對性的分析。 情緒偵測: 對通話中用戶或坐席的情緒進(jìn)行自動(dòng)偵測與判斷,一旦發(fā)現(xiàn)異常,可及時(shí)記錄或預(yù)警。 語速檢測: 對分離后的坐席或坐席語音進(jìn)行語速檢測,如語速過快則可能用戶很難聽清楚,影響服務(wù)質(zhì)量,而語速過慢則可能坐席技能是不夠熟練、或者工作狀態(tài)不佳。 靜音檢測: 檢測錄音文件中長時(shí)靜音(冷場、用戶等待時(shí)間)的狀態(tài),靜音時(shí)長的檢測策略可在系統(tǒng)中靈活設(shè)置與修改。 難點(diǎn)及解決方案 難點(diǎn) 1: 語音轉(zhuǎn)寫 解決方案: 需要與集成商 合作,對 客服中心的 歷史錄音進(jìn)行訓(xùn)練,同時(shí)梳理客戶服務(wù)熱線的 業(yè)務(wù)邏輯、知識(shí)庫。 難點(diǎn) 2:自動(dòng)質(zhì)檢規(guī)則 解決方 案: 符合對語音數(shù)據(jù) 的質(zhì)檢策略和規(guī)則,如語速的基準(zhǔn)值、情緒的基準(zhǔn)值等,可通過對歷史人工質(zhì)檢數(shù)據(jù)進(jìn)行分析和建模。 難點(diǎn) 3:業(yè)務(wù)分類策略 解決方案: 以客服中心 目前的主要業(yè)務(wù)選項(xiàng)作為分類目標(biāo),對主流的分類算法進(jìn)行分析與實(shí)驗(yàn),使用文本分類器的區(qū)分性訓(xùn)練、支持向量機(jī)、最大熵等分類技術(shù),研究可適用于復(fù)雜任務(wù)的分類算法。 主要技術(shù)方案和關(guān)鍵技術(shù) 通過對語音 信息數(shù)據(jù)挖掘 技術(shù)、客服業(yè)務(wù)、呼叫中心錄音模塊、客服質(zhì)檢流程等進(jìn)行研究和應(yīng)用設(shè)計(jì),依托現(xiàn)有平臺(tái)建設(shè) 中高端客戶信息數(shù)據(jù)挖掘 系統(tǒng),下圖是 該 系統(tǒng)的主要功能組成模塊和組成結(jié)構(gòu): D e v e l o p e rD e b u g g e rA p p l i c a t i o ni S PI M SA n a l y z e rT u n e rS u p p o r t e rR e s e a r c h e rR e c o g n iz e r E n g in eG r a m m a r S y s t e mG r a m m a r C o m p i l e rA b n f 2 g x m lG r a m m a r P a r s e rG r a m m a r C a c h e M a n a g e rS e m a n t i c I n t e r p r e t a t i o nK W S C o r eS p e a k e r S e g m e n tA b n o m a l E m o t i o nK e y w o r d S p o t t i n gL e x i c o nR e s o u r c e M a n a g e rR e c o g n i z e r P a r a m e t e r sV o i c e A c t i v a t i o n D e c t e c tV A D c o r eA u d i o S o u r c e P r o v i d e rN M SD i a l o g i cM i c r o p h o n eL o g g i n gC a l l l o g g i n gS y s t e m l o g g i n gA u d i o D r i v e r s , T h r e a d s , A C E , X M L , u r i , C o n f i g u r a t i o n , a n d m o r e .O S A d a p te r sM i c c r o s o f t W i n d o w s 2 0 0 0 / X P / 2 0 0 3 / V i s t a / 7 , R e d h a t L i n u x A S 3 / 4 / 5 , S u n S o l a r i s 9 / 1 0O p e r a tin g S y s te mi s r b a t r e ci s r m t r e ci s r a n a l y z e rR e c o g n i z e r A P IE n d p o i n t e r D e c t e c t e r A P Ik w s d e m oF e a t u r e E x t r a c t i o nT o o lsQ u i c k K W S A P IIS A P r o g r a m m in g In te r fa c e s 其中藍(lán)色區(qū)域都屬于 ISA 產(chǎn)品的核心功能模塊,白色區(qū)域是和 ISA 產(chǎn)品有密切關(guān)系的第三方角色或組件。可以看到 ISA 產(chǎn)品分為應(yīng)用接口( ISR Programming Interface)、識(shí)別引擎( Recognizer Engine)和操作系統(tǒng)適配( OS Adpters)三層架構(gòu)。 應(yīng)用接口是 ISA 產(chǎn)品提供的用戶開發(fā)接口,是系統(tǒng)最重要的對外功能,集成開發(fā)人員最關(guān)注這些接口的功能和使用方法。 數(shù)據(jù)挖掘 引擎是這些開發(fā)接口的功能實(shí)現(xiàn)者,同時(shí)還提供了多種工具和方法用于支持開發(fā)。操作系統(tǒng)適配層屏蔽了多操作系統(tǒng)的復(fù)雜性,為識(shí)別引擎提供操作系統(tǒng)相關(guān)的底層支持。這三個(gè)邏輯層共同構(gòu)成了完整的 ISA 產(chǎn)品架構(gòu)。 (四)廣西移動(dòng)《 IVR 自動(dòng)撥測服務(wù)項(xiàng)目 》 研究總體框架 IVR 業(yè)務(wù)探測系統(tǒng)主要由三部分組成: ? 媒體網(wǎng)關(guān) 實(shí)現(xiàn) PSTN/GSM/CDMA 到 VOIP 的協(xié)議轉(zhuǎn)換。 ? 語音識(shí)別服務(wù) 實(shí)現(xiàn) IVR 探測時(shí)的 語音識(shí)別。 ? IVR 業(yè)務(wù)探測應(yīng)用 整合媒體網(wǎng)關(guān)和語音識(shí)別 服務(wù) ,實(shí)現(xiàn) IVR 業(yè)務(wù)探測應(yīng)用。 數(shù) 據(jù)I V Rw e b S e r v i c e短 信 營 業(yè) 廳數(shù) 據(jù) 庫 / 語 音網(wǎng) 路 交 換 機(jī)媒 體 網(wǎng) 關(guān) / 媒 體 代 理語 音 設(shè) 別 服 務(wù)I V R 探 測 服 務(wù) . . .語 音 解決自動(dòng)撥測問題 IVR 屬于語音設(shè)備,實(shí)現(xiàn)業(yè)務(wù)探測和自動(dòng)測試就需要用機(jī)器來模擬人工進(jìn)行撥測。但使用呼叫中心現(xiàn)有的交換機(jī)或使用手機(jī)終端都難以徹底解決問題。我們在大量的調(diào)研的基礎(chǔ)上,決定采用 VOIP 網(wǎng)關(guān)的技術(shù)方案。既可以完成自動(dòng)撥測,又可以同時(shí)模擬固話、 CDMA、 GSM 號(hào)碼進(jìn)行多路撥測。這樣,就可以實(shí)現(xiàn)對電信用戶、聯(lián)通用戶、中國移動(dòng)本省、它省用戶(包括全球通、神州行、動(dòng)感地帶等不同品牌,鉆、金、銀等不同級別的用戶)的 IVR 流程模擬撥測。 解決語音 識(shí)別困難 當(dāng)機(jī)器撥入 IVR 系統(tǒng)后,需要與 IVR 流程進(jìn)行交互,包括二次撥號(hào)、信息錄入(如密碼、手機(jī)號(hào)、身份證、年月日等),這依賴于語音識(shí)別技術(shù)。機(jī)器收到語音信息后,需要根據(jù)語音編碼、去噪、模式識(shí)別等技術(shù),將這些信息轉(zhuǎn)換為人可以識(shí)別的信息,然后再使用人可識(shí)別信息進(jìn)行業(yè)務(wù)規(guī)則判定。 目前,語音識(shí)別技術(shù)雖有提高但仍有很大的局限性。 本項(xiàng)目 采用一種特殊的語音識(shí)別技術(shù),加上我們對業(yè)務(wù)積累來實(shí)現(xiàn) IVR 的業(yè)務(wù)探測和自動(dòng)測試。通過語音識(shí)別廠家的語音識(shí)別引擎,配合有效的業(yè)務(wù)規(guī)則,可以將語音識(shí)別的準(zhǔn)確率提高到一個(gè)新的高度,使之勝任 IVR 業(yè)務(wù)探測。 主要技術(shù)方案和關(guān)鍵技術(shù) IVR 業(yè)務(wù)探測系統(tǒng)的主要工作流程如下 : 1. 探測系統(tǒng)開始工作后,到達(dá)指定時(shí)間時(shí),開始通過媒體網(wǎng)關(guān) GS8 進(jìn)行呼叫,撥打欲測的 IVR 平臺(tái)后; 2. 撥通后,對平臺(tái)播放的任何流程語音 進(jìn)行錄音,并將錄音傳遞給 語音識(shí)別系統(tǒng) 進(jìn)行實(shí)時(shí)語音識(shí)別; 3. 語音識(shí)別系統(tǒng) 將收到的語音與系統(tǒng)中保存的目標(biāo)語音進(jìn)行識(shí)別,并將識(shí)別結(jié)果 (正確或錯(cuò)誤 ) 返回給探測程序; 4. 探測程序收到識(shí)別結(jié)果后,記錄進(jìn)探測報(bào)告。如果識(shí)別錯(cuò)誤,則探測程序依據(jù)探測流程是否