104/05/20:金融大數據、開放數據與資料探勘-R 的解決方案

► 演講說明

現在我們已經從過去的經濟,進入大數據經濟(Big Data Economy)的時代。金融市場分析者長久以來就是大數據的使用者,但是對於日益龐大的數據資料,除了機器學習等統計分析之外,就是軟體的需求。R 語言對於大數據的處理,有著強大的功能。這次演講的解決方案,將著重在如何使用套件bigmemory管理記憶體以及如何使用R擷取開放數據(Open Data)。
bigmemory能夠將2G的記憶體負載,縮小到50MB左右。一個美國上市公司資料庫,約10G。這樣的效能,大大提升大數據分析的效率。一旦大數據的記憶體管理得當,後續的分析就簡易許多。bigmemeory對於大矩陣big.matrix的解決方案,協助了投資和風險管理中所須要計算的大型共變數矩陣(large covariance)。
針對投資組合管理常常用的財務演算,介紹R語言獲得金融開放數據(Open Data)以及資產選擇(Asset Selections under Big Data)的處理。

※ 為避免演算耗時,大數據方面,我們將以台灣百家公司近400MB的資料作範例,說明 R 套件對大數據的處理方式及資料探勘函數。

※ Open data方面,須要連上網實際取得市場數據。因本校無提供校外人士無線網路服務,故請參與者務必自備網路線。

※ 更進一步需先準備好的東西,活動前會通知。

► 主  講  人

何宗武 教授 (世新大學財務金融學系教授)

► 演講日期

104年5月20日 (星期三) 13:10~15:00

► 演講地點

世新大學管理學院大樓七樓M735