早上七點左右就睡醒了,把東西整理一下,看了一下今天的天氣,想說今天應該不會很熱吧(結果事後證明我是錯的 = =),在樓下買了一份早餐就匆匆忙忙的去趕299了。

早上七八點的299在忠孝橋塞住是很正常的,結果又花了一點時間才下公車,下了公車又急急忙忙的坐上往公館的捷運,總覺得好像又回到高職早上在趕捷運的時候了,不過以前遲到會被罰,這個總不會了吧。

出了公館捷運站,又讓我想到去年二月中的事了(景物依舊,人事已非 Orz),總之我隨著舟山路一直往前面走,繞來繞去的一直找不到博理館在哪邊,不過還好附近都有地圖可以看,憑著我的絕佳方向感總算是找到博理館了。

博理館是廣達董事長林百里捐贈給台大的一棟七層樓建築物,從建築物的名稱就可以發現一點端倪了,「博理」音似「百里」,而英文名稱Barry Lam更是林百里的英文名字,由此可見一番(不過我說的好像是廢話耶 XD)。剛剛查了一下,電機四館也在動工中,叫做明達館,是由明碁和友達共同捐贈的。不知道我們宜大什麼時候才會有這種企業捐贈建築物的出現 Orz。

在門口的報到處簽名之後,拿了狗牌(內附兩天飯票)和一本厚達450頁的書(!?),就急忙的進會議廳了。一進會議廳就聽到台上有一位教授在說明這棟建築物的設施,後來我在書上看到,這位教授原來就是胡老大常常說的李琳山教授,無論如何,第一場的talk就要開始了。

第一位是Fujisaki教授,聽李琳山教授的介紹,這位F教授在語音處理方面是一位國際知名的學者,而且還有一個模型是拿他的名字來命名,叫做Fujisaki Model,真的是很厲害喔,不過第一場我聽不懂 = =,現場播的slide跟我手中這本的slide內容對不上,而且連名字都對不上,總之第一場talk就這樣昏睡過去了。

第一場talk結束之後,就是美食試吃大會,其實這也沒什麼好說的啦,只有一兩樣好吃而已,跳過。

第二場的talk還比較有一點興趣,Sagisaka教授把人的情緒加在語音裡面,也就是會有高興、悲傷之類的情緒產生,用的就是Fujisaki Model。第三場則是在昏睡中度過,因為沒什麼興趣,只知道Sagayama教授放了一些音樂,其他就渾然不知了(昏)。

第三場其實是delay了20分鐘才結束,所以我們放飯的時間也被迫要縮短,今天吃了一個雞排飯,可是還蠻普通的耶,明天中午打算去台科找謝大,順便一起吃飯。

下午的第一場,一樣昏睡中度過(Orz),一直到了第二場終於有台灣的學者了,所以我這次有比較認真聽,可是我還是只了解一點點而已,比如像是HPG(Hierarchical Framework of Discourse Prosody)和Fujisaki parameter而已。

結束第二場美食試吃大會之後,總算是有讓我覺得好玩的東西了,Nakamura教授的「Corpus-based Speech Translation」,這個還蠻有意思的,主要是把兩種不同的語言的語音利用Machine Translation, Speech Synthesis, etc.,把A語言的語音變成B語言的語音,簡單來說就是小叮噹的「翻譯米糕」啦。N教授實作了J(Japanese)<->C(Chinese)還有J<->E(English)兩種,不過展示的只有J<->C而已,光是如此就已經讓我們驚豔許久,之後的Q&A還有教授問什麼時候(How soon)會上市,看來這個產品上市的話,一定會方便許多愛到國外遊玩的朋友吧。

第四場的東西也蠻好玩的,Shikano教授的「New Speech Media Applied to Universal Communication」,裡面的NAM(Non-Audible Murmur)可以把一般我們的耳語(murmur/whisper)放大訊號之後,轉換成一般人所聽到的正常聲音,也就是whisper to text, text to speech,而且他們用的input device不是一般的麥克風,而是一種叫做MAN Microphone的麥克風,把一個類似聽診器的東西掛在耳朵下方,然後用whisper的方式說話就可以轉換成功了。

最後一場實在是累了,雖然是台灣的學者,不過我還是偷溜出去了。今天最有趣的就是下午兩位教授的Presentation了,非常期待N教授的產品上市耶。

一直忘了提到我的早餐還有NB,早餐一整天都沒吃,光是吃美食大會的東西就飽了 = =。還有NB,會議廳的訊號太差了啦,在A8J上面只看到兩三個AP訊號而已,而且有些是Adhoc,有些有加密,唯一可以連線的AP訊號卻是差到不行(囧),出了會議廳之後,我的A8J就找到20個以上的訊號,看來這個是博理館還可以改善的地方。

在台北車站等299的時候,我終於又回復以往的雄風,讓我搶到了一個位子,送啦!

參考資料:
Taiwan-Japan Joint Workshop on Speech Science and Technologies
電機三館 - 博理館
電機四館
Hiroya Fujisaki
ATR Spoken Language Communication Research Laboratories

kewang 發表在 痞客邦 留言(0) 人氣()