在今天的通話應(yīng)用市場(chǎng)上,應(yīng)用VoiceXML的基本目標(biāo)在于全力擴(kuò)大現(xiàn)有網(wǎng)站及其內(nèi)容的容量,使它們適應(yīng)交互式語(yǔ)音響">

首頁(yè) > 專(zhuān)家說(shuō)

voicexml的應(yīng)用開(kāi)發(fā)

來(lái)源:新能源網(wǎng)
時(shí)間:2024-08-17 12:05:41
熱度:

voicexml的應(yīng)用開(kāi)發(fā)【專(zhuān)家解說(shuō)】: 應(yīng)用中的VoiceXML
在今天的通話應(yīng)用市場(chǎng)上,應(yīng)用VoiceXML的基本目標(biāo)在于全力擴(kuò)大現(xiàn)有網(wǎng)站及其內(nèi)容的容量,使它們適應(yīng)交互式語(yǔ)音響

【專(zhuān)家解說(shuō)】: 應(yīng)用中的VoiceXML 在今天的通話應(yīng)用市場(chǎng)上,應(yīng)用VoiceXML的基本目標(biāo)在于全力擴(kuò)大現(xiàn)有網(wǎng)站及其內(nèi)容的容量,使它們適應(yīng)交互式語(yǔ)音響應(yīng)應(yīng)用,同時(shí)減小復(fù)雜應(yīng)用方案的編程復(fù)雜性。此外,在客戶(hù)服務(wù)器信息處理環(huán)境中,它允許語(yǔ)音與數(shù)據(jù)服務(wù)的輕松結(jié)合。   VoiceXML是專(zhuān)門(mén)設(shè)計(jì)用于抽取應(yīng)用開(kāi)發(fā)商在底層特定平臺(tái)上的編程內(nèi)容。在本質(zhì)上,由于開(kāi)發(fā)商不再需要在通話平臺(tái)上編寫(xiě)微小細(xì)節(jié)的地址代碼,從而簡(jiǎn)化了語(yǔ)音應(yīng)用的創(chuàng)建。它實(shí)現(xiàn)了應(yīng)用程序內(nèi)容的標(biāo)準(zhǔn)化,例如話音識(shí)別語(yǔ)法與呼叫控制等。因此,應(yīng)用VoiceXML編譯程序的系統(tǒng),雖然具有自己的特定規(guī)格,但是無(wú)需考慮已經(jīng)抽取的特定系統(tǒng)的要求,就可以容易地移植到其他系統(tǒng)中。作為一種通用語(yǔ)言,VoiceXML不但適合應(yīng)用開(kāi)發(fā)商,而且也適合提供新聞、天氣預(yù)報(bào)及航空服務(wù)信息的服務(wù)提供商。   VoiceXML設(shè)計(jì)的工作原理:語(yǔ)音應(yīng)用程序作為系列頁(yè)存儲(chǔ)在類(lèi)似于網(wǎng)絡(luò)服務(wù)器的文件服務(wù)器上。從實(shí)現(xiàn)平臺(tái)接收到輸入呼叫時(shí),VoiceXML編譯程序會(huì)向文件服務(wù)器發(fā)出一個(gè)特定URL請(qǐng)求,就像用戶(hù)瀏覽網(wǎng)絡(luò)時(shí)輸入網(wǎng)站地址一樣。文件服務(wù)器可以與編譯程序直接相連,也可以設(shè)置在外部,通過(guò)本地網(wǎng)或互聯(lián)網(wǎng)的IP協(xié)議訪問(wèn)。他們可以保持應(yīng)用程序的服務(wù)邏輯,可以提供數(shù)據(jù)庫(kù)查找與其他系統(tǒng)操作功能。   然后,這些頁(yè)可以向編譯程序提供系統(tǒng)需要的對(duì)話流和各種操作,例如要求呼叫用戶(hù)提供特定語(yǔ)音輸入。用戶(hù)的回應(yīng)影響對(duì)話編譯,會(huì)使上述請(qǐng)求返回文件服務(wù)器。而后,下一VoiceXML頁(yè)會(huì)完成答復(fù),從而用戶(hù)對(duì)話得以持續(xù)。   VoiceXML應(yīng)用于簡(jiǎn)單應(yīng)用比較理想,例如自動(dòng)值班應(yīng)用程序。在此程序中,呼叫用戶(hù)與系統(tǒng)間的對(duì)話不很復(fù)雜,用戶(hù)交互簡(jiǎn)單。同時(shí),VoiceXML也可應(yīng)用于較為復(fù)雜的應(yīng)用中。在這些應(yīng)用中,向用戶(hù)提供多種選擇,數(shù)據(jù)檢索范圍較大?;赩oiceXML的應(yīng)用接口向用戶(hù)提示事先錄制的和合成的對(duì)話,可以理解簡(jiǎn)單的單詞和詞組。隨著這種技術(shù)的不斷改進(jìn),它可以支持更豐富的人機(jī)自然語(yǔ)言對(duì)話。 一、 語(yǔ)音在一些方面的應(yīng)用 首先,讓我們看一看,從語(yǔ)音的角度使我們感興趣的幾個(gè)不同的應(yīng)用。 1、企業(yè)的SQL數(shù)據(jù)庫(kù) 許多企業(yè)都有基干SQL的關(guān)系型數(shù)據(jù)庫(kù),用來(lái)處理事務(wù)和分析數(shù)據(jù)。如Microsoft的SQL Server,Oracle8i,Informix,IBM DB2和Sybase,以及一些小型的個(gè)人數(shù)據(jù)庫(kù),如Access,Excel 等。 2、合作成交流的系統(tǒng) 通常我們都使用E-mail來(lái)作為交流的工具,如許多公司都使用一些這樣的系統(tǒng),如Microsoft 的Exchange Server,Lotus Domino和Iplanet Messaging Server。除了E-mail.這些系統(tǒng)還提供諸如日歷,通訊薄,任務(wù)和共享文檔的使用,作為基干Voicexml企業(yè)門(mén)戶(hù)的一個(gè)組成部分,使得公司員工通訊普通的電話來(lái)“收發(fā)”郵件或日期安排成為可能。 3、企業(yè)級(jí)的應(yīng)用程序 許多中大型的企業(yè)開(kāi)始使用一些大型的ERP系統(tǒng),如SAP,Peoplesoft,Oracle,Baan,J.D.Edwards來(lái)提高企業(yè)的生產(chǎn)和運(yùn)營(yíng)能力。例如,一家公司投資購(gòu)買(mǎi)了Peoplesoft公司的HRMS(人力資源管理系統(tǒng))系統(tǒng),從而使得公司的員工通過(guò)基干Voicexml的語(yǔ)音來(lái)享受如下的服務(wù),如查詢(xún)個(gè)人信息,參加競(jìng)爭(zhēng)招聘,交納個(gè)人所得稅等等。這些大型的應(yīng)用程序或系統(tǒng)都有定義好的API接口,從而使得與其他應(yīng)用程序的整合變得非常容易。一個(gè)基干Voicexml的應(yīng)用程序可以用這些API接口來(lái)把數(shù)據(jù)傳化為xml 文件,然后再通過(guò)XSLT,實(shí)現(xiàn)Voicexml的轉(zhuǎn)換。 4、企業(yè)的目錄服務(wù) 在企業(yè)中可能用到的目錄服務(wù)主要有Novell的目錄服務(wù),微軟的NT Directing,微軟的Active Directory和基干LDAP的目錄服務(wù)(如inplanet Directory Server和IBM的 Secureway Directory Server)。目錄服務(wù)在很多方面都能得到應(yīng)用,如;存儲(chǔ)用戶(hù)信息,存儲(chǔ)用戶(hù)的私人賬號(hào)或密碼。語(yǔ)音門(mén)戶(hù)可以為員工提供一些自服務(wù),也可以充當(dāng)人與人交流或溝通的媒介,一個(gè)員工可以撥號(hào)接通另一位員工的電話,該員工的電話可以是基干語(yǔ)音系統(tǒng)的目錄服務(wù)。如它可以播出如下的應(yīng)答(“connect me with Mike on his cell phone”)而不用在公司目錄中尋找。 二、開(kāi)發(fā)Voicexml程序的框架和方法。 1、服務(wù)器端的腳本編程 服務(wù)部的編程可以有好多種語(yǔ)言來(lái)選擇,如Perl,CGI,ASP,JSP,PHP,Java servelet等。用這些技術(shù)實(shí)現(xiàn)的應(yīng)用程序運(yùn)行在服務(wù)端的框架上,如通常所說(shuō)的Web Application Server, 通過(guò)其中引擎(Engine)的解釋?zhuān)涂梢詫?shí)行動(dòng)態(tài)的Web效果和編程,這些Application Server通常指基干J2EE標(biāo)準(zhǔn)的,如IBM的Websphere, BEA的 Bea weblogic server,Oracle的Application server 和sun的inplanet server。以及一些其他的如 Microsoft in IIS,Apache+ Tomcat等。 除了提供動(dòng)態(tài)角本的能力外,Application Server來(lái)提供事務(wù)處理,持久性可擴(kuò)展性,高可用性,安全性和可靠性等相關(guān)的能力,這些就使得開(kāi)發(fā)者,只要專(zhuān)注于系統(tǒng)商業(yè)邏輯的開(kāi)發(fā),而不用考慮其他的問(wèn)題,從而減輕了開(kāi)發(fā)人員的負(fù)擔(dān),同時(shí)也增強(qiáng)了系統(tǒng)的性能。 2、應(yīng)用程序的整合 服務(wù)端的角本技術(shù)只解決了一個(gè)問(wèn)題,即生成動(dòng)態(tài)的Voicexml的頁(yè)面。但怎樣來(lái)整合其他的應(yīng)用程序,還是一個(gè)問(wèn)題。當(dāng)然,我們可以使用相同的應(yīng)用程序接口和組件來(lái)整合企業(yè)級(jí)的應(yīng)用程序,例如在Microsoft的word中,我們可以使用OLE-DB和ADO接口來(lái)和不同的數(shù)據(jù)庫(kù)系統(tǒng)整合,用MAPI和合作數(shù)據(jù)對(duì)象同企業(yè)消息系統(tǒng)和合作系統(tǒng)整合,用COM接口同許多基干COM應(yīng)用的后臺(tái)應(yīng)用程序進(jìn)行整合。 同樣,在J2EE中,可以用JDBC API來(lái)連接各種數(shù)據(jù)庫(kù)系統(tǒng),用Java Mail API 來(lái)同企業(yè)消息系統(tǒng)整合;用JCA同后臺(tái)的應(yīng)用程序如SAP R/3或Peoplesoft 的 HRMS整合。 下圖一表示用服務(wù)端的角本編程來(lái)發(fā)布Voicexml的應(yīng)用程序,并實(shí)現(xiàn)同企業(yè)數(shù)據(jù)庫(kù)和后臺(tái)應(yīng)用程序的整合。 三、XML和XSLT 我們可以使用預(yù)線定義好的 XML接口或XML的工具箱,如微軟的XML Parser 或Apache xerces parser 來(lái)生成基干Java/c++/com的xml結(jié)構(gòu),然后用 XSLT來(lái)處理XML文檔,生成基干XSLT的文檔格式,下圖二顯示了XML和XSLT結(jié)合生成Voicexml的內(nèi)容。 圖二.XML/XSLT的模型 其具體的實(shí)現(xiàn)可以使用Apache xml 項(xiàng)目中的基干Java的XML/XSLT的稱(chēng)為Cocoon的工具包,它允許開(kāi)發(fā)者自己定義基干XML的內(nèi)容發(fā)布接口,然后用XSLT處理工具動(dòng)態(tài)的轉(zhuǎn)化為WML,Voicexml, pdf 等不同的格式,附錄中的例子,就顯示了用它來(lái)生成Hello world的Voicexml程序。 VoiceXml在以下的領(lǐng)域內(nèi)有著廣泛的應(yīng)用。  ?。薄⑿畔⒌墨@取。如股票信息,天氣情況,體育消息,交通信息等。  ?。?、電子交易(包括電子商務(wù),電子零售)。如銀行的帳戶(hù)查詢(xún),存取,股票交易等。  ?。?、電信領(lǐng)域的服務(wù)。如UNIFIED MESSAGE,CALL CENTER(呼叫中心)等。 有關(guān)VoiceXml的部分產(chǎn)品介紹  ?。薄BM   IBM主要開(kāi)發(fā)了VIAVOICE的VOICEXML的服務(wù)器,以及VOICEXML的開(kāi)發(fā)包,從而能與WEBSPHERE結(jié)合,實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)與電話的完美結(jié)合。但是該服務(wù)器只支持英語(yǔ),法語(yǔ)和德語(yǔ)。  ?。?、MOTOROLA   MOTOROLA也有自己的VOICEXML的網(wǎng)關(guān)及開(kāi)發(fā)VOICEXML的開(kāi)發(fā)包。但是也不支持 中文。  ?。?、NUANCE   NUANCE是一個(gè)專(zhuān)門(mén)開(kāi)發(fā)語(yǔ)音的廠商。他有開(kāi)發(fā)和構(gòu)架VOICEXML的一整套工具。其中包括VOICE WEB SERVER,V-Builder(開(kāi)發(fā)VOICEXML的可使化工具),Secure Verifier 。尤其是他對(duì)超過(guò)20種語(yǔ)言(包括中文及廣東話)的支持及其優(yōu)良的穩(wěn)定性贏得了很多市場(chǎng)分額,其中包括American Airlines,Bell Atlantic,UPS等大公司都已成為他的客戶(hù)。 四、總結(jié) Voicexml 給計(jì)算機(jī)應(yīng)用程序帶來(lái)了新的活力,通過(guò)整合現(xiàn)有的應(yīng)用程序,以及融合一些諸如文本到語(yǔ)音轉(zhuǎn)化(Text-to-speech, TTS),自動(dòng)識(shí)音識(shí)別(Automatic Speech Recognition ,ASR),VOIP(Voice over Internet Platform)等技術(shù),從而生成交互的語(yǔ)音應(yīng)用程序和系統(tǒng)。
    無(wú)相關(guān)信息