解析:
答:对于user-product-rating数据,als会建⽴⼀个稀疏的评分矩阵,其⽬的就是通过⼀定的规则填满这个稀疏矩阵。
als会对稀疏矩阵进⾏分解,分为⽤⼾-特征值,产品-特征值,⼀个⽤⼾对⼀个产品的评分可以由这两个矩阵相乘得到。
通过固定⼀个未知的特征值,计算另外⼀个特征值,然后交替反复进⾏最⼩⼆乘法,直⾄差平⽅和最⼩,即可得想要的矩阵。
解析:
随机初始化中⼼点范围,计算各个类别的平均值得到新的中⼼点。
重新计算各个点到中⼼值的距离划分,再次计算平均值得到新的中⼼点,直⾄各个类别数据平均值⽆变化。
解析:
根据两个阈值来划分数据,以随机的⼀个数据点作为canopy中⼼。
计算其他数据点到其的距离,划⼊t1、t2中,划⼊t2的从数据集中删除,划⼊t1的其他数据点继续计算,直⾄数据集中⽆数据。
解析:
对于待分类的数据和分类项,根据待分类数据的各个特征属性,出现在各个分类项中的概率判断该数据是属于哪个类别的。
解析:
⼀个频繁项集的⼦集也是频繁项集,针对数据得出每个产品的⽀持数列表,过滤⽀持数⼩于预设值的项,对剩下的项进⾏全排列,重新计算⽀持数,再次过滤,重复⾄全排列结束,可得到
频繁项和对应的⽀持数。
-------------------
---------------------------------------------------------------------------------------------------------------------
⾯试的时候这样的题⽬给你,你会不会说,fuck~,怎么这么变态,经常写代码的⼈,看到这个应该会很⾯熟。究竟什么样的题⽬这么变态,解答如下,仅供参考学习