1)微軟語音API微軟的語音API(簡稱SAPI)是壹個應用編程接口(API),它包括語音識別(SR)和語音合成(SS)引擎,在Windows下被廣泛使用。目前微軟已經發布了幾個版本的SAPI(最新版本是SAPI 5.4),要麽作為Speech SDK的開發工具包發布,要麽直接包含在windows操作系統中。SAPI支持多種語言的識別和閱讀,包括英語、中文和日語。
2).IBM viaVoiceIBM是較早開始語音識別研究的機構之壹。早在20世紀50年代末,IBM就開始了語音識別的研究。計算機被設計用來檢測特定的語言模式,並獲得聲音和相應字符之間的統計相關性。1999年,IBM發布了VoiceType的免費版本。2003年,IBM基於生存能力授權ScanSoft擁有桌面產品的獨家經銷權,隨後ScanSoft與Nuance合並。現在生存能力早已淡出人們的視線,取而代之的是細微差別。
3)NuanceNuance communication是壹家跨國計算機軟件技術公司,總部位於美國馬薩諸塞州伯靈頓,主要提供語音和圖像解決方案及應用。目前業務集中在服務器和嵌入式語音識別、電話轉向系統、自動電話號簿服務等。除了語音識別技術,Nuance語音技術還包括語音合成、聲紋識別等技術。在世界語音技術市場上,80%以上的語音識別采用了Nuance識別引擎技術,其名下擁有超過1000項專利技術。該公司開發的語音產品可以支持50多種語言,在全球擁有超過20億用戶。Nuance的語音識別服務應用在蘋果iPhone 4S的Siri語音識別中。
4)作為國內最大的智能語音技術提供商,科大訊飛科大訊飛在智能語音技術領域有著長期的研究和積累,在中文語音合成、語音識別、口語評測等技術方面擁有國際領先的成果。占據中國語音技術市場60%以上的份額,語音合成產品市場份額達到70%以上。
5)其他有影響力的商業語音交互平臺包括谷歌的語音搜索、百度和搜狗的語音輸入法等。