專頁
國家教育研究院, 新北市。 6,825 個讚 · 251 人正在談論這個 · 13,424 個打卡次。國家教育研究院(National Academy for Educational Research,...
貼文
大數據在華語文的應用 語料庫於華語文應用論壇… 更多 國家教育研究院(下簡稱國教院)自2013年開始建置華語文語料庫(COCT),迄今已建置書面語語料約1億1仟多萬字、口語語料約960萬字、華英雙語語料約340萬字、華語中介語料42萬字。適逢國教院五週年院慶,為提供大數據在華語教學、辭典編輯、教材研發應用的討論交流,特於今(28)日起假國教院臺北院區舉辦「語料庫於華語文應用論壇」,下午二時舉行開幕式,並邀請香港理工大學人文學院院長黃居仁講座教授就漢語語料庫為主題專題演講。 專題演講主講人黄教授曾主持或共同主持開發各種中文語言資源,如中文詞知識庫(CKIP)詞匯庫與語法訊息、中央研究院現代漢語平衡語料庫及中英雙語知識本體詞網 (Sinica BOW)等等,是建立中文語言資源領域的權威;在詞彙語意學、計算語言學、語料庫語言學、漢語語法理及語意研究領域都極富盛名。他也是國際計算語言學委員會(International Committee of Computational Linguistics, ICCL)的19名終身會士之一,更是首位也是唯一的華人。2013年榮獲法國南部艾克斯馬賽(Aix-Marseille)大學頒發榮譽博士學位,該校為法國規模最大的大學,也是法語國家和地區最大的大學,在黃居仁教授之前後任獲此殊榮者為諾貝爾文學獎得主高行健及莫言,可見該校頒發此學位之嚴謹,黃教授能撥空與會分享其研究,值得期待。 演講後安排「語料庫於華語文應用論壇」則邀請教育部《重編國語辭典修訂本》總編輯許學仁教授、中華語文知識庫《兩岸常用辭典》總編輯蔡信發教授,以及在計算語言學及大數據在教學運用的專家學者清華大學張俊盛教授、臺灣師範大學陳浩然教授、臺灣大學高照明教授等學者分享經驗,並提供與會者經驗交流。 國外已有很多大數據應用在教學、教材、及辭典編輯的例子,至於國內則希望透過交流,啟發大家思考如何善用語料庫的資源。此論壇希望透過與談人經驗分享及與會者的意見交流,激發大數據創新運用的新思維。
圖片
留言