embedding_column 和 feature column 是什么区别?
embedding_column是feature column的一种类型
embedding column体现在graph上和代码上是这样的
这是一个feature column的例子,能够能好的理解feature column和embedding column的关系
Feature column的计算大概分两步
第一步 算id; 第二步 查表, 这部分是common的
我们最初的数据可能是4个单词比如dog、spoon、scissors、guitar,然后这些单词被分类特征列Categorical处理成为数字0、32、79、80,接下来我们可以使用指示列来处理成为独热的01列表(图中假设我们有81种单词分类),也可以按照嵌入Embeding列来处理成小数元素组成的3元素数列。
embedding column 的code在
https://github.com/tensorflow/tensorflow/blob/1bece066defe89e05559c80c7a6d4a804c419a17/tensorflow/python/ops/embedding_ops.py