-
协同过滤仅需要一个 user-item 矩阵(矩阵元素为打分值),并不需要user和item的属性。可以视作矩阵补全问题。
-
基于内容
- 缺点: 推荐物较为静态
-
基于社交(社会化推荐)
-
基于当前情景
-
冷启动问题
-
推荐差异化、个性化
-
推荐动态化 所谓动态化是指,所推荐的东西的疆域不能是封闭的,要对用户进行适当引领,摆脱‘过滤气泡’造成的智识孤立
本文严重参考了:知识图谱技术原理介绍 by 王昊奋
知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID(标识符, identifier)来标识。每个属性-值对(attribute-value pair,又称AVP)用来刻画实体的内在特性,而关系(relation)用来连接两个实体,刻画它们之间的关联。
- RDF(Resource Description Framework, 资源描述框架)
- 图数据库(graph database) 例如 neo4j, 这种存储方式现在比较流行,添加新的数据源较为方便
-
知识表示代表模型:TransE
对事实(head, relation, tail),将relation看做head到tail的翻译
存在的问题:无法解决一对多,多对一和多对多的情形
-
关系路径的表示和建模
-
知识图谱的嵌入(knowledge graph embedding)
即将实体和关系投影到连续的向量空间中去
-
TransG: A Generative Mixture Model for Knowledge Graph Embedding
-
数据来源:百科、freebase 知识、垂直站点的结构化数据、半结构化/非结构化数据挖掘(包括搜索日志)
-
构建过程
从异构数据源抽取构建知识图谱所需的各种候选实体(概念)及其属性关联,形成了一个个孤立的抽取图谱(ExtractionGraphs)。为了形成一个真正的知识图谱,还需要将这些信息孤岛集成在一起
前面说过,实体要有全局唯一标识,这需要实体对齐。 不一致性的处理
- 维护更新
Holographic Embeddings of Knowledge Graphs by Maximilian Nickel, et al., 2015
题目非常炫酷:知识图谱的全息嵌入。y
构建好知识图谱之后,就能进行基于知识图谱的挖掘了。
-
关系抽取
-
知识推理 针对属性的,比如,通过出生年月得到年龄
针对关系的,比如,爸爸的爸爸是爷爷
-
相关实体挖掘
-
实体排序
知识图谱在智能搜索、反欺诈、异常检测等领域的应用
Linked Data - Connect Distributed Data across the Web
该项目旨在构建一张计算机能理解的语义数据网络
Google Knowledge Graph
百度知心
搜狗知立方
wikidata
上翻后引导
直接答案满足
广告的计价方式
- 按照展示计费 CPM(cost per mail/ cost per thousand impressions) 千人成本,这种计量方式比较粗犷
CPTM (cost per targeted thousand impressions) 有效千人成本 排除无效的人群
2.按照点击计费 cpc(cost per click)
模型的评估 lift5
追踪用户行为 受众选择: low-level model 做初筛,high-level model 做细选
-
Ad Click Prediction: a View from the Trenches by H. Brendan McMahan, et al., google, 2013
来自谷歌广告一线战壕的干货。FTRL-Proximal 在线学习算法