深度学习word2vec学习笔记.pdf


立即下载 易米烊光
2024-04-19
学习 深度 语言 机器 公司 自然 word2vec 巨星 向量 Google
1.2 MB

ML info word2vec
- 1 -
深度学习 word2vec 笔记之基础篇
by 北流浪子(2014-05-25)
博客地址:http://blog.csdn.net/mytestmy/article/details/26969149
基础篇:http://blog.csdn.net/mytestmy/article/details/26961315
一.前言
伴随着深度学习的大红大紫,只要是在自己的成果里打上 deep learning 字样,
总会有人去看。深度学习可以称为当今机器学习领域的当之无愧的巨星,也特别
得到工业界的青睐。
在各种大举深度学习大旗的公司中,Google 公司无疑是旗举得最高的,口号
喊得最响亮的那一个。Google 正好也是互联网界璀璨巨星,与深度学习的联姻,
就像影视巨星刘德华和林志玲的结合那么光彩夺目。
巨星联姻产生的成果自然是天生的宠儿。2013 年末,Google 发布的 word2vec
工具引起了一帮人的热捧,互联网界大量 google 公司的粉丝们兴奋了,从而
google 公司的股票开始大涨,如今直逼苹果公司。
在大量赞叹 word2vec 的微博或者短文中,几乎都认为它是深度学习在自然
语言领域的一项了不起的应用,各种欢呼“深度学习在自然语言领域开始发力了”。
互联网界很多公司也开始跟进,使用 word2vec 产出了不少成果。身为一个
互联网民工,有必要对这种炙手可热的技术进行一定程度的理解。
好在 word2vec 也算是比较简单的,只是一个简单三层神经网络。在浏览了
多位大牛的博客,随笔和笔记后,整理成自己的博文,或者说抄出来自己的博文。
二.背景知识
2.1 词向量
自然语言处理(NLP)相关任务中,要将自然语言交给机器学习中的算法来
处理,通常需要首先将语言数学化,因为机器不是人,机器只认数学符号。向量
是人把自然界的东西抽象出来交给机器处理的东西,基本上可以说向量是人对机
器输入的主要方式了。
词向量就是用来将语言中的词进行数学化的一种方式,顾名思义,词向量就
是把一个词表示成一


学习/深度/语言/机器/公司/自然/word2vec/巨星/向量/Google/ 学习/深度/语言/机器/公司/自然/word2vec/巨星/向量/Google/
-1 条回复
登录 后才能参与评论
-->