流形学习[1][2][3],也被称为流形学习方法(Manifold Learning),自2000年起成为信息科学领域的重要研究方向。这一方法旨在从高维度的采样数据中恢复低维度的流形结构,从而实现数据的维数约简或可视化。流形学习的核心理念是从观测现象中探索事物本质,发现数据背后的内在规律。 分类
流形学习方法在模式识别中有广泛应用,可分为线性流形学习算法和非线性流形学习算法两类。其中,非线性流形学习算法包括等距映射(Isomap)、拉普拉斯特征映射(Laplacian eigenmaps,LE)、局部线性嵌入(Locally-linear embedding,LLE)等;线性方法则包括主成分分析(Principal component analysis,PCA)、多维尺度变换(Multidimensional scaling,MDS)等。 Isomap
Isomap是由麻省理工学院计算机科学与人工智能实验室的Josh Tenenbaum教授于2000年提出的。该方法的目标是在保持高维流形上的数据点间近邻结构的同时,找到其对应的低维嵌入。Isomap使用MDS作为计算工具,并引入了微分几何中的测地线距离概念,以及一种通过图论中的最小路径逼近测地线距离的算法。Isomap的优势在于其计算过程依赖于线性代数的特征值和特征向量问题,确保了结果的稳健性和全局最优性;能够通过剩余方差判断低维嵌入的本质维数;且仅需确定一个参数(近邻参数k或邻域半径e)。