流形学习
何晓飞
浙江大学
信息时代
机器学习问题
? 何晓飞
信息
(训练集)
?: ? → ?
我们考虑的?和?往往
是欧氏空间
Manifold = Many + Fold, 很多曲面片的叠加
叠加但不是拼接,不自交
欧氏空间属于流形
任何一个流形都可以嵌入
到足够高维度的欧氏空间中
(Whitney嵌入定理)
流形(Manifold)
流形假设
真实数据是怎样的?
外围欧氏空间的维度很
高
数据存在一定的低维内
在结构
我们假设数据是位于一
个低维子流形上
流形
我们的地球表面是二维流形 局部可以认为是欧氏空间
测地线
弯曲的’直线’,用来计算流形上两点的最短距离
球面上的测点线不是直线,因为直线根本不在球面上
流形的特殊性质
不满足平行公设: 存在过
空间中任意两点的平行
直线(测地线)
球面: 任意两条测地线(大
圆弧)都相交
测地三角形的内角和不
一定等于180度
1818年至1826年间,高斯曾测量在Harz山脉中由
Inselberg、Brocken和Hoher三地形成的三角形,看看
其内角和是否等于180度。
流形的特殊性质
地球上总有一点是风平浪静的
基本概念:拓扑空间
Topological spaces are mathematical structures that
allow the formal definition of concepts such as
convergence, connectedness, and continuity.
A topological space is a set X together with τ (a
collection of subsets of X) satisfying the following
axioms:
The empty set and X are in τ.
τ is closed under arbitrary union.
τ is closed under
流形/空间/直线/欧氏/球面/数据/set/等于/180/性质/
流形/空间/直线/欧氏/球面/数据/set/等于/180/性质/
-->