104/05/06:R 軟體於象徵性資料的統計圖與視覺化

► 演講說明

傳統探索式資料分析 (exploratory data analysis, EDA) 是以單一觀察值所組成的資料集合 (classical data sets) 為分析對象。藉由統計圖表(例如盒形圖及散佈圖等等)和視覺化技術,呈現資料的結構及樣態,讓使用者從中探索而觀察到潛藏於資料所包含的訊息。然而在現實生活中,資料收集愈趨於巨量,也愈為複雜。為了匯總管理並同時儘可能的保留資料原本所隱含的資訊,資料收集的變數格式不再只是單一點的數值,而是以區間(interval)、直方圖(histogram)或分佈(distribution)等等表示,此為文獻上所稱的象徵性資料(symbolic data)。另一方面,現今統計學家面臨巨量資料三大特性的挑戰:量(Volume)、速(Velocity)與多樣性(Variety)。它需要新的資料處理方式及新的統計方法來進行分析。而象徵性資料分析(SDA)可針對各種資料描述型態提供分析策略,對於巨量資料分析具有極大的潛力。本研究以R軟體實作一些統計圖,做為區間資料、時間相依區間資料及直方圖資料的視覺化探索工具。

► 主  講  人

吳漢銘 副教授 (淡江大學數學系副教授) 個人網站

 ► 演講日期

104年5月6日 (星期三 ) 13:10~15:00

► 演講地點:

世新大學管理學院大樓七樓M735