Win10語(yǔ)音輸入怎么樣
據(jù)PCWorld網(wǎng)站報(bào)道,Windows有一項(xiàng)微軟不愿意提及的功能。雖然Windows10可以讓用戶(hù)使用觸控筆“寫(xiě)寫(xiě)畫(huà)畫(huà)”,借助Windows Hello利用臉部登錄系統(tǒng)(或保護(hù)Web安全),甚至命令小娜設(shè)置提醒事項(xiàng),但它明顯不想讓用戶(hù)使用的一項(xiàng)功能是,利用其語(yǔ)音識(shí)別引擎對(duì)系統(tǒng)發(fā)號(hào)施令或讓用戶(hù)利用語(yǔ)音輸入編輯文檔。
微軟不大力宣揚(yáng)Windows語(yǔ)音識(shí)別功能的原因可以追溯到10年前,當(dāng)時(shí)微軟產(chǎn)品經(jīng)理謝恩·博切(Shanen Boettcher)在演示W(wǎng)indows Vista的語(yǔ)音輸入功能時(shí)搞砸了。之后Windows的語(yǔ)音輸入技術(shù)一直相當(dāng)“低調(diào)”,目前幾乎沒(méi)有用戶(hù)知道Windows有語(yǔ)音輸入功能。
如果說(shuō)Windows有機(jī)會(huì)再戰(zhàn)語(yǔ)音輸入領(lǐng)域,目前似乎是個(gè)時(shí)機(jī)——計(jì)算機(jī)和人工智能的進(jìn)展為語(yǔ)音輸入提供了好得多的基礎(chǔ)。
在被問(wèn)及語(yǔ)音輸入技術(shù)在Office中的未來(lái)時(shí),微軟負(fù)責(zé)語(yǔ)音識(shí)別研究以及小娜和必應(yīng)的執(zhí)行副總裁哈里·舒姆(Harry Shum)表示,“這是一個(gè)重大問(wèn)題。語(yǔ)音輸入沒(méi)有扮演更重要的角色是不可理解的。”
1、語(yǔ)音識(shí)別不完美的原因:
部分用戶(hù)仍然認(rèn)為語(yǔ)音輸入還是《杜恩斯比利》(Doonesbury)系列漫畫(huà)中蘋(píng)果牛頓PDA的水平,把用戶(hù)說(shuō)的“I am writing a test sentence”,聽(tīng)為“Siam fighting atomic sentry”。用戶(hù)有這種想法是可以原諒的:Windows語(yǔ)音識(shí)別功能仍然采用微軟Speech Recognizer 8.0技術(shù),自Vista以來(lái),這一技術(shù)就基本上沒(méi)有什么變化。舒姆稱(chēng)之為“祖父”級(jí)技術(shù)。
PCWorld表示,但硬件已經(jīng)發(fā)生了很大變化:聽(tīng)和解釋語(yǔ)音要求的處理能力遠(yuǎn)低于10年前。Surface Book等PC產(chǎn)品中的集成式麥克風(fēng)陣列的質(zhì)量,意味著無(wú)需使用專(zhuān)用麥克風(fēng)語(yǔ)音識(shí)別就可以達(dá)到很高的準(zhǔn)確率。只是,語(yǔ)音輸入技術(shù)的發(fā)展已經(jīng)適合大眾使用了嗎?
在使用語(yǔ)音輸入軟件輸入長(zhǎng)度為1028個(gè)單詞的文章時(shí),95%的準(zhǔn)確率意味著用戶(hù)必須修正逾15個(gè)錯(cuò)誤。在測(cè)試中,Windows語(yǔ)音輸入準(zhǔn)確率為93.6%,從理論上說(shuō)這一數(shù)值并不高,低于測(cè)試的其他專(zhuān)用語(yǔ)音輸入軟件。Windows有個(gè)奇怪的習(xí)慣,在輸入逗號(hào)時(shí),它會(huì)在文檔中插入“comma”(逗號(hào))這個(gè)詞匯。語(yǔ)音輸入社區(qū)似乎對(duì)這類(lèi)相對(duì)較小的失誤是否有重要影響有不同看法。
當(dāng)然,這還不是全部。使用過(guò)語(yǔ)音輸入軟件的人都知道,準(zhǔn)確率的關(guān)鍵是訓(xùn)練。隨著時(shí)間推移,語(yǔ)音輸入軟件會(huì)了解用戶(hù)口音,“apricot”中“a”的發(fā)音與“bad”還是“ape”中的“a”相同,和如何過(guò)濾無(wú)意識(shí)的痙攣性語(yǔ)言障礙。微軟員工曾聲稱(chēng),經(jīng)過(guò)適當(dāng)訓(xùn)練,Windows語(yǔ)音識(shí)別技術(shù)的準(zhǔn)確率可以達(dá)到99%。1000個(gè)單詞出現(xiàn)10個(gè)錯(cuò)誤還不算太壞。
很少有用戶(hù)愿意花時(shí)間訓(xùn)練使用語(yǔ)音識(shí)別軟件。Windows語(yǔ)音識(shí)別軟件,要求用戶(hù)用10分鐘時(shí)間訓(xùn)練數(shù)個(gè)句子,會(huì)讓用戶(hù)有度日如年的感覺(jué)。小娜和Siri不要求用戶(hù)進(jìn)行訓(xùn)練,那是因?yàn)樗鼈円呀?jīng)被訓(xùn)練了數(shù)以百萬(wàn)計(jì)的語(yǔ)音樣本。
小娜(可以在PC和手機(jī)上使用)在語(yǔ)音識(shí)別方面表現(xiàn)遠(yuǎn)優(yōu)于Windows語(yǔ)音輸入系統(tǒng)的原因是,它利用了微軟云服務(wù)的計(jì)算能力。微軟會(huì)對(duì)用戶(hù)的語(yǔ)音進(jìn)行分析,使用戶(hù)語(yǔ)音與其其他數(shù)據(jù)相關(guān)聯(lián),生成作為小娜靈魂的智能。
2、微軟重視語(yǔ)音識(shí)別:
鑒于小娜的出色表現(xiàn),用戶(hù)會(huì)認(rèn)為語(yǔ)音應(yīng)當(dāng)成為上周微軟Ignite會(huì)議的中心。但I(xiàn)gnite期間沒(méi)有任何與語(yǔ)音輸入有關(guān)的會(huì)議,只有一次會(huì)議與語(yǔ)音識(shí)別有關(guān)。微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在主旨演講中把語(yǔ)音識(shí)別稱(chēng)作是微軟未來(lái)的關(guān)鍵元素。
以Skype Translator為例。據(jù)納德拉稱(chēng),Skype Translator依賴(lài)三個(gè)方面的研究:語(yǔ)音識(shí)別、語(yǔ)音合成和機(jī)器翻譯。在演講中,納德拉稱(chēng)微軟語(yǔ)音識(shí)別算法的誤字率為6.9%,這是一個(gè)糟糕的成績(jī):準(zhǔn)確率僅為93.1%。PCWorld稱(chēng),如果微軟真正看好辦公軟件,語(yǔ)音識(shí)別在PC中的未來(lái)不僅僅是利用Skype在孟加拉國(guó)訂賓館,而是撰寫(xiě)體驗(yàn),不過(guò)是通過(guò)語(yǔ)音而非手指。