微軟語音技術大“探祕”

標籤:

(//www.tvsmo.com)
【大紀元5月10日訊】電腦科技日新月异,在不久的將來,電腦和人的聲音將難分真假,人們用家庭個人電腦,便可制造河面因突然下雨而產生無數漣漪的畫面效果,仿真而且互動,世界真正進入新一代多媒体的時代。

  賽迪網5月9日報道,這一天可能不遠了,因為微軟公司每年正在撥出巨額預算,進行基本電腦科技研發,成果日益丰盈。

  微軟公司目前已面市的office XP軟件和視窗XP操作系統所采用的,由微軟亞洲研究院幵發的語音合成技術,已經能夠讓電腦講比較自然的中文和英語。

  微軟亞洲研究院院長張亞勤博士昨日与新加坡媒体分享該研究院的科研成果時透露,研究院曾經“讓微軟主席比爾﹒蓋茨在中國學生面前講流利標准的中文”。

  這當然不是真的,因為比爾﹒蓋茨并不會講中文,這是語音合成技術創造的。

  未來需要“聲音密碼”

  目前來說,人們也還是能夠聽出那是電腦在說話,不是真人在講話。不過,張亞勤博士表示:“在三五年后,經過許多的研究努力,我們將無法分辨究竟是人類或者是電腦在說話。事實上,電腦所講的中文或英語,將比一般人都標准。”

  因此,他指出,到時人們可能就需要聲音密碼(speech ID),“以防自己的聲音被別人使用”。

  語音合成技術還能夠讓電腦模擬不同人的聲音,女人的聲音、男人的聲音,小孩的聲音,而且可以輕易的調整音調。在這個基礎上,研究院幵發了讓人們能輕易的用個人電腦制作“語音合成童話”的軟件。這個軟件將來可能与微軟的一些產品一齊推出。

  張亞勤博士還展示了新一代多媒体的情況,你可以隨心所欲的調整觀看畫面景色的角度、遠近,享受互動式畫面效果,例如水面漣漪、下雨、晝夜不同之景觀,甚至是追赶河上盤旋的飛禽。還可以試看畫面在白天和夜晚的不同效果。

  當然,微軟亞洲研究院的研究成果不衹這些,張博士還演示了微軟幵發的技術,如何改善音樂和影片通過無線網絡播放的效果,以及電腦模擬真人跳舞,甚至讓電腦模特兒“隨樂而動”的能耐。不衹是人,電腦可以模擬甚至是改造任何動物的動作、聲音,把鹿化為馬、把貓變成兔。
(//www.dajiyuan.com)

相關新聞
媒體稱微軟擬購ITV數碼台
IBM絕地大反攻II:加強与微軟的合作
微軟要從市場上撤回Windows?
宏圖、微軟聯手打造兼容WMA格式的DVD產品
如果您有新聞線索或資料給大紀元,請進入。
評論