坑先挖好,回头再填
坑先挖好,回头再填 论文地址:https://arxiv.org/pdf/1706.03762.pdf
背景 现有机器学习系统无法直接处理文本数据,一般需要进行向量化,这个过程叫做Word Embedding(词嵌入)。 过去多年最常用的向量化方式是基于统计的离散方法表示,如独热编码(One-hot Representation)、词频-逆文本(TF-IDF)、词袋模型(Bag of Words)、N-gram等。 2013年,Word2Vec横空出世(相关论文见 #参考文档),自然语言...
发现新版本的内容。