170對語音數據庫的測試
肖興國是一個年歲不大,看起來最多三十出頭的青年人。身材瘦削,極其精干,臉上隨時帶著一副親切的笑容,一看就是那種隨時都能和你稱兄道弟的人。
除他之外,與他同來的還有一個更年輕的,看起來只有二十四五歲的年輕人,擰著一個筆記本,帶著一個黑框眼鏡,看起來有些木訥,大概是技術性人員。
李景然一開始出現在大廳的時候,坐在大堂一角一張雙人沙發上的兩人並沒意識到從電梯口出現的這個男孩兒就是他們這次要來會見的「貴客」,因為李景然實在是太年輕,讓人難以想到他就是要跟自己合作的客戶。
直到李景然朝兩人走去,站到兩人的面前,試探的叫了聲「肖先生」,肖興國才恍然大悟的站了起來,急忙握住李景然遞過來的手,一邊連說「抱歉」,一邊嘴里不停感嘆李景然的年少,什麼「青年才俊,年少有為」,見面就是一通贊嘆。
類似的話,李景然已經听過多次,早就具有了免疫能力,他只是淡淡的笑了笑,心中並無多少波瀾。
肖興國先是向李景然介紹了一下他身邊的那個叫小彭的技術人員,然後就提議說現在差不多已經快中午了,是不是先吃了中午飯大家再坐下來談。李景然就說沒關系,他先看看樣品再說。
肖興國對于李景然的提議自然沒什麼異議,對他來說早一點談妥生意更好,于是自然的一邊點頭,一邊又開始對李景然這種「敬業精神」大肆夸贊,一枚枚不要錢的精神糖衣炮彈朝李景然身上猛砸!
「你媽,要不是老子定力好,恐怕一見面,就被你個***夸得上天入地,無所不能,連方向都找不到了。」對于肖興國這個自來熟的夸贊,李景然心頭月復誹,敬謝不敏。
看樣品自然不方便在大庭廣眾之下,于是李景然向二人提議去自己的房間,肖興國欣然同意了。
肖興國和彭智勇跟著李景然進入了位于大廈二十三層的豪華行政房,卻見里面還有兩個十五六歲的半大孩子正坐在坐在床上津津有味的看電視。兩個半大孩子見有人進來後,就把電視關了,也不出去,卻只是坐在床邊,時不時的朝自己這邊瞟一下。他見李景然並沒有介紹這兩個小孩兒,就以為是跟著他一起來廣州玩耍的親戚,于是也就不以為意。
李景然把肖興國和他的技術員小彭讓到茶幾對面的一張長條沙發坐下,他自己則坐在與其相對的一個單人沙發上。
「雷山生,您上次說對我司所有有關中文的語音數據庫都感興趣,因此,這次我們所帶的樣品之中,就包含了以標準普通話為主,以北方話,廣東話,江浙話,福建話,湖南話,.江西話和客家話中國七大地域方言為輔的語音數據庫。每種方言,我們截取了2%-5%的語音樣本。小彭,你先給雷山生演示一下。」說道正事,肖興國也不像剛才那樣輕松隨意,神情也變得有些嚴肅。
听到肖興國的吩咐後,李景然就見叫小彭的技術員從隨身攜帶的電腦包內掏出一個戴爾筆記本電腦,開機後從中調出一個音頻軟件,開始播放,然後過了兩三秒,李景然就從筆記本自帶的揚聲器中听見一個個被人讀出來的語音,都是單個的字詞或詞組,有男聲,有女聲,有小孩的聲音,也有青年人和老年人的聲音。
李景然在听的同時,肖興國用眼楮朝技術員小彭示意了一下,于是,李景然就听到旁邊的年輕人咳嗽兩聲,清了下嗓子,然後用一種略帶緊張的聲音,向李景然道︰
「李先生,對于普通話,我們的每個語素,都同時采集了孩子,青年,中年和老年四個年齡層次的聲音,每個年齡層次,都有男聲和女聲,因此,對于單個語素,我們采集了多達八種不同類型的聲音。
「而針對其他方言的采集,雖然沒有像普通話那樣多達八種,但目前最低的,我們也已經完成了包括男聲,女聲,小孩,中年共計四種類型的語音。而像其他有些比較熱門的有影響力的方言,如廣東話和江浙話,我們差不多完成了六種語音采集。
「而對于所有采集的語音,我們都會根據每個字詞的不同發音,進行標注,檢查,整理,分離,然後形成一個系統的,容易查找的語音數據庫。」
人機互動,人機交流中最關鍵的兩項核心技術就是「語音合成」和「語音識別」。語音合成是為了讓「機器說話」,人能夠听得懂機器的語言;而語音識別則是為了讓機器听得懂人話,明白人說的是什麼。
而不管是語音合成還是語音識別,有一個必不可少的最基礎的一項工作,那就是語音數據庫,這是實現以上兩種核心技術的「原材料」。雖然有了語音數據庫,一般人也很難搞定,或者說到目前為止世界上就沒人哪個人或哪個機構真正搞定過語音合成和語音識別,特別是語音識別,這一混合了信號處理、模式識別、概率論和信息論、發聲機理和听覺機理、人工智能等多種領域的前沿學科,對于所有想攻克這一技術的機構來說,真的非常非常困難!
但是,其他人搞不定自動語音識別技術,對于擁有全世界最先進智能體的李景然來說,卻不是那麼高不可攀,反而像「語音數據庫」這種沒有任何技術含量,需要大量人力物力才能搞得定的「累活」對李景然來說倒成了一個讓人頭疼的麻煩,逼得他只得求助于他人。
老實講,深圳智冠提供的語音數據庫,到底好不好,優秀不優秀,對于在這方面只是了解了一些皮毛的他來說根本就無法判斷。要判斷深圳智冠的東西有沒有用,或者說好不好用,方法只有一個,那就是傳給真智,讓真智自己去研究,這就是李景然為什麼要冒天大的奇險,不遠千里,把真智從蓉城搬到廣州,為此,還請了真武真情這兩個被蒙在鼓里的超級保鏢「一路保駕」。
若非如此,李景然是萬萬不會冒險讓真智離開家中一步的。
听完了小彭的介紹後,幾個簡短片段的演示也告一段落。這時,肖興國便一臉期待的看著李景然的臉,道︰
「雷山生,您覺得我們的產品怎麼樣?
「嗯,肖先生,對于貴司提供的語音樣品,我現在還不能完全的準確判斷。你能不能拷一兩個片段給我,讓我放到我的識別程序上去識別一下?」李景然向肖興國提出了一個請求,沒說好,也沒說不好,即使對方的產品真的好,他也不會馬上就說好。
「沒問題。小彭,你用u盤拷兩個樣本讓雷山生測試測試。」肖興國爽快的同意。當初在電話中,李景然就告訴他他們公司準備開發一款智能語音輸入系統,現在人家要親自測試,那也無可厚非。
「不用,肖先生,用我自己的u盤就行了。」李景然從兜內模出一個嶄新的,遞給小彭。
對于這個小細節,肖興國自然也沒在意。
當小彭把載有兩個語音庫片段的遞回給李景然的時候,兩人就見李景然將其插入了手中的一台聯想筆記本電腦的接口,在上載的同時,還模出一個黑色的耳機,插入電腦的耳機接孔。
之後,坐在李景然對面的肖興國和彭智勇,就見李景然把筆記本擱在自己的腿上,開始 里啪啦,速度極快的打起字來。
在等待李景然「測試」自己語音片段的過程中,有好幾次,肖興國都好奇的想站起身,繞過去看看這個年齡小得和自己那個正在上高中的佷子差不多的「雷山生」,到底是如何僅用一台筆記本電腦和一副耳機就能夠測試出自己語音庫的優劣。因為他販賣語音庫也不是一次兩次了,每次顧客都會叫上一群語言學,語匯學和聲音學方面的專家,要麼到自己公司專業級的聲學實驗室去測試,那麼就是拿著拷貝給他們的片段,到哪家高校的聲學實驗室去測試,幾乎沒有像李景然這麼簡單草率的。
但到最後,他還是忍住了。覺得那畢竟是人家的商業機密,如果因為自己的好奇,犯了人家的忌諱,最後弄砸了生意,那才真的雞飛蛋打,得不償失。
不能窺見「雷山生」測試自己語音片段的方法,肖興國便把注意力集中在李景然的臉上,妄圖從起面部表情從窺見些端倪,比如滿不滿意啊,高不高興啊,之類的。但這次,還是讓他失望了。因為李景然在整個測試過程中,或者說打字過程中,臉上一直都是一副雲淡風輕,沒有任何表情的樣子。
「這個家伙,真的是有些奇怪啊!」最後,肖興國只得在心中無奈的給李景然貼了一張「怪人」的標簽。
然後,有一件事卻是他永遠也無法得知的,那就是他曾經離史上最強大的非人智能體僅僅一步之遙!
!@#