更深入地学习算法
1.您可能关注的人(推特)
如何确定我的请求的最近结果?数据挖掘?哪种算法?
2.你是如何联系的 特征 </跨度> (Linkedin … soundex http://en.wikipedia.org/wiki/Soundex,这里是Google的副总裁 工程 </跨度> 和CIO Douglas Merrill讲的是http://www.youtube.com/watch?v=syKY8CrHkck#t=22m03s
前三个问题怎么样?欢迎任何想法!
谢谢 …
希望有所帮助, 克里斯
可能是许多类型的推荐算法之一 协同过滤 ?
这只是社交图上的最短路径算法。假设连接没有重量,它将简单地使用 广度优先 。
只需使用相同的算法重新排列数据集 的 你可以关注的人 强> 。
看看这本书 编程集体智慧 用于很好地介绍用于的算法类型 的 你可以关注的人 强> 和 的 与你相似 强> ,它也有很棒的python代码。
我不使用twitter;但考虑到这一点:
1)。从表面上看,这并不困难:对于我追随的每个人,看看他们跟随谁。然后,对于他们关注的每个人,看看他们跟随谁,等等。当然,你走的越深,所需的数字越多。
你可以更进一步,如果你也可以有效地提取相反的:对于我跟随的人,谁也跟着他们?
对于这两种方式,什么是未说明的是一种方法来衡量推特,看看他们是否是我真正想要关注的人:自由追随者也可能跟随保守的推特,但这并不意味着我想跟随保守的(见#3)。
2)。不确定,想一想......
3)。假设生物和推文是唯一可行的,那么困难的部分是:
一旦拥有了正确的属性集,就会想到两种不同的算法:
这都是推测性的,但如果有人获得报酬,这听起来很有趣。