專頁
g0v.tw 台灣零時政府。 145,215 個讚 · 260 人正在談論這個。 g0v:開源協作,改造社會 採訪/邀約:g0v-talks@googlegroups.com 加入聊天室:http://join.g0v.tw/...
貼文
【不小心收到一份包含 1100 萬資料的「巴拿馬文件」怎麼辦?】
 
這兩天最熱門的關鍵字「巴拿馬文件」,堪稱是史上最大的解密資料,揭露了各國政治人物與菁英們未曝光的海外資產。根據維基百科,這逼近 2.6 TB 的資料包含了:4,804,618 份電子郵件、3,047,306 份資料庫格式文件、2,154,264 份 PDF 文件、1,117,026 張圖片、320,166 份文本文件、2,242 份其他文件。
 … 更多
如果你不小心收到了一份這麼龐大的資料,要如何找出關鍵的訊息呢?
 
即將在 5/14-15 登場的 g0v Summit 2016 邀請到來自英國開放知識基金會的 Freyja van den Boom,來談「告別文字擷取與資料探勘的痛苦: FutureTDM」。FutureTDM 是由歐盟資助的計畫,旨在找出為什麼文字資料探勘(Text & Data Mining,簡稱 TDM)的接受度在歐洲遠遠落後於預期,並試圖解決此一現象。
 
每天都有大量的資訊產生:不僅是科學研究的量測,也包括文字、影片或圖像等各種形式的資料,都可能為學術、商業以及感興趣的大眾提供很多相關的想法。但是,研究顯示,要能將 TDM 的潛在效益完全釋放,有許多挑戰必須克服:包括技術上、法律上及經濟上的限制、對 TDM 缺乏意識,以及技術上的缺口。我們的目標是找出什麼是問題所在、誰被這些問題所影響以及我們如何能解決這些問題,讓大家都受益。
 
想分享您在文字資料探勘上的經驗及挫折嗎?您有發現很棒的工具,或是解決問題的祕訣嗎?無論您有什麼應用的想法,或只是想看看您手上的文件可以做些什麼,都歡迎來一起討論!
 
🎈 5/15 13:30-14:00
告別文字擷取與資料探勘的痛苦: FutureTDM
Freyja van den Boom
 
☀ 快看今年精彩議程:http://summit.g0v.tw/2016/schedules
 
▻ g0v Summit 2016 將於 5 月 14­-15 日登場
▻ 報名購票網址:http://g0v-summit2016.kktix.cc/events/conference
▻ 現場有即時口譯!中翻英,英翻中都通噢~
圖片
留言