Skip to content

Latest commit

 

History

History
158 lines (75 loc) · 4.01 KB

File metadata and controls

158 lines (75 loc) · 4.01 KB

推荐系统/计算广告专题

推荐系统

  • 协同过滤仅需要一个 user-item 矩阵(矩阵元素为打分值),并不需要user和item的属性。可以视作矩阵补全问题。

  • 基于内容

    • 缺点: 推荐物较为静态
  • 基于社交(社会化推荐)

  • 基于当前情景

  • 冷启动问题

  • 推荐差异化、个性化 

  • 推荐动态化 所谓动态化是指,所推荐的东西的疆域不能是封闭的,要对用户进行适当引领,摆脱‘过滤气泡’造成的智识孤立

参考资料
  1. Amazon.com Recommendations: Item-to-Item Collaborative Filtering

知识图谱(knowledge graph)

本文严重参考了:知识图谱技术原理介绍 by 王昊奋

知识图谱:机器大脑中的知识库

知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID(标识符, identifier)来标识。每个属性-值对(attribute-value pair,又称AVP)用来刻画实体的内在特性,而关系(relation)用来连接两个实体,刻画它们之间的关联。

存储方式
  1. RDF(Resource Description Framework, 资源描述框架)
  2. 图数据库(graph database) 例如 neo4j, 这种存储方式现在比较流行,添加新的数据源较为方便
知识表示
  • 知识表示代表模型:TransE

    对事实(head, relation, tail),将relation看做head到tail的翻译

    存在的问题:无法解决一对多,多对一和多对多的情形

  • 关系路径的表示和建模

  • 知识图谱的嵌入(knowledge graph embedding)

    即将实体和关系投影到连续的向量空间中去

  • TransG: A Generative Mixture Model for Knowledge Graph Embedding

知识图谱构建

  • 数据来源:百科、freebase 知识、垂直站点的结构化数据、半结构化/非结构化数据挖掘(包括搜索日志)

  • 构建过程

    从异构数据源抽取构建知识图谱所需的各种候选实体(概念)及其属性关联,形成了一个个孤立的抽取图谱(ExtractionGraphs)。为了形成一个真正的知识图谱,还需要将这些信息孤岛集成在一起

  前面说过,实体要有全局唯一标识,这需要实体对齐。 不一致性的处理

  • 维护更新

Holographic Embeddings of Knowledge Graphs by Maximilian Nickel, et al., 2015

题目非常炫酷:知识图谱的全息嵌入。y

知识图谱挖掘

构建好知识图谱之后,就能进行基于知识图谱的挖掘了。

  • 关系抽取

  • 知识推理    针对属性的,比如,通过出生年月得到年龄

   针对关系的,比如,爸爸的爸爸是爷爷

  • 相关实体挖掘

  • 实体排序

知识图谱实践

知识图谱在智能搜索、反欺诈、异常检测等领域的应用

Linked Data - Connect Distributed Data across the Web

该项目旨在构建一张计算机能理解的语义数据网络

Google Knowledge Graph

百度知心

搜狗知立方

wikidata

产品化细节

上翻后引导

直接答案满足


计算广告

广告的计价方式

  1. 按照展示计费 CPM(cost per mail/ cost per thousand impressions) 千人成本,这种计量方式比较粗犷

CPTM (cost per targeted thousand impressions) 有效千人成本 排除无效的人群

2.按照点击计费 cpc(cost per click)

模型的评估 lift5

DSP

追踪用户行为 受众选择: low-level model 做初筛,high-level model 做细选

实时竞价方面的研究文章汇总