GAP(廣義相關圖) 是一套探索式的視窗統計分析軟體(exploratory data analysis, EDA)。主要目的是提供使用者以全矩陣式的視覺化方法,互動式地觀測資料的相關性結構及特性。我們開發了多種資料排序及群集分析方法,例如: 橢圓排序(R2E),階層式分群法,K均值法等等。以色彩及不同呈現條件,展現原始資料矩陣及兩個相關矩陣的結構,具有許多目前市面上統計分析軟體所沒有的功能。以廣義相關圖為發展主軸,我們亦針對數個重要的生物醫學資料形態進行結構分析,以模組方式,創造出適合各種資料形態之不同資訊視覺化環境,以利未來選擇或發展合適之統計方法與合理之生物與數學假設,為生物及醫學特徵資料提供一個多樣化之群集分析與資訊視覺化工作環境。目前此套軟體已開放下載試用,並在一些國際學術研討會及教學中演示,獲得許多迴響。

  

軟體設計以GAP架構為核心,分析方法以維度縮減(Dimension Reduction)和群集分析(Cluster Analysis)方法為主。發展互動式的2D 及3D 的Scatterplot 來觀察降維後的資料結構。已實作的方法有奇異值分解(SVD)、主成份分析(PCA)、切片逆迴歸法(SIR)、多維度尺度法(MDS) 及ISOMAP。各個圖形的資料點可以相互連結並選取。目的是提供使用者更方便的EDA工具。 

 

 

目前以維度縮減的方法為主,例如主成份分析(PCA),切片逆迴歸法(SIR) 相關的方法等,做影像的分割問題。影像特徵的選取可以在空間域,頻率域及Gabor 的空間-頻率域。 

  

本軟體初期以cDNA晶片品質視覺化為起點,走向將以微陣列資料統計分析為主,並結合生物資料庫的搜尋與解釋,期望提供生物資訊研究者一個良好的分析工具。 

Title:  Kernel Sliced Inverse Regression with Applications to Classification

Abstract:

Sliced inverse regression (SIR) was introduced by Li (1991) to find the effective dimension reduction directions for exploring the intrinsic structure of high-dimensional data. In this study, we propose a hybrid SIR method using a kernel machine which we call kernel SIR.