首页 > 其他分享 >推荐系统学习笔记(一)

推荐系统学习笔记(一)

时间:2024-03-06 23:33:06浏览次数:25  
标签:预测 推荐 系统 用户 笔记 学习 信息 物品

  • 好的推荐系统
    • 疑问:推荐系统的主要任务,推荐系统和分类目录以及与搜索引擎的区别等
    • 什么是推荐系统
      • 如果对象数目巨大,用户只能通过搜索引擎找到自己需要的目标
      • 如果用户没有明确需求时,需要一个工具帮助筛选,给出一些建议,这个工具就是推荐系统
      • 推荐系统的任务
        • 联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对他感兴趣的用户面前,从而实现信息消费者和生产者的双赢
        • 更好的发掘长尾(一小部分用户的个性化需求),提高销售业绩
      • 和搜索引擎比较
        • 不同的是推荐系统不需要用户提供明确信息
        • 相同的是帮助用户发现信息
      • 推荐算法的本质:通过一定的方式将用户的物品联系起来,而不同的推荐系统利用了不同的方式
      • 推荐系统就是自动联系用户和物品的一种工具
      • 成功的条件
        • 信息过载
        • 用户没有明确的需求
    • 什么是好的推荐系统
      • 用户,平台,内容生产者 三赢
      • 预测准确度是最重要指标
      • 准确的预测并不代表是好的推荐,不新颖,不能令他惊喜,无法增加潜在购买力
      • 不仅能够准确预测用户行为,能够扩展用户事业,帮助用户发现可能感兴趣,不容易发现的东西
    • 实验方法
      • 离线实验
        • 方法
          • 日志获得用户数据行为,生成数据集
          • 按照规则划分训练集和测试集,在训练集上训练模型,测试集上预测
          • 通过事先定义的指标评测算法的预测结果
        • 优点
          • 不需要实际系统的控制权
          • 不需要用户参与
          • 速度快,测试大量算法
        • 缺点
          • 离线指标不全面,无法计算商业指标
      • 用户调查
        • 用户回答问题
        • 成本高,任务设计要科学,实验人群要分布科学
      • 在线实验
        • AB实验,常见实验方法,随即划分用户
        • 优点:公平获得不同算法在线的性能指标
        • 缺点:周期长,各个层级阶段会互相干扰
      • 预测准确度
        • 评分预测:预测用户对物品评分的行为叫评分预测,可能出现用户评分高,但是用户评分的可能性很小
        • TopN预测:给用户一个个个性化的推荐列表,准确率/召回率,更符合实际应用需求
        • 覆盖率:描述一个推荐系统对物品长尾的发掘能力,推荐系统能够推荐出来的物品占总物品的比例。一个好的推荐系统不仅要有较高的用户满意度,还要有较高的覆盖率
        • 多样性:能够覆盖用户不同的兴趣领域
        • 新颖性:推荐用户没有听说过的东西,可以推荐用户没搜索过的东西
        • 惊喜度:用户历史上喜欢的物品不相似,但是用户觉得满意的推荐
        • 信任度:同样的推荐结果,让用户信任的方式推荐给用户,让用户产生更强的购买欲
          • 提高透明度,让用户了解推荐系统的运行极机制,得到用户认同
          • 考虑用户的社交网络信息,利用好友推荐
        • 实时性
          • 实时推荐给用户,满足用户新的行为变化
          • 能够将新的物品推荐给用户
        • 健壮性
          • 设计推荐系统的时候尽量使用代价较高的用户行为
          • 进行攻击检测,清理污染的数据
        • 商业目标
          • 推荐系统需要符合商业目标

标签:预测,推荐,系统,用户,笔记,学习,信息,物品
From: https://www.cnblogs.com/ak918xp/p/18057904

相关文章

  • 2252309------对飞机(航空)订票系统(C语言)进行逆向学习、分析、思考、设计构思、改进....
    **飞机订票系统**一、资料来源CSDN博主吴朋奉阅读量最高的一篇博文--飞机订票系统(C语言)----https://blog.csdn.net/weixin_47774641/article/details/111398063?spm=1001.2014.3001.5506二、运行环境Windows11+DEVC++三、源代码(来自博主吴朋奉)......
  • html5的学习
    HTML5基本标签<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>基本标签学习</title></head><body><!--标题标签--><h1>一级标签</h1><h2>二级标签</h2>......
  • 2024.3.6学习笔记
    1.InfoNCEloss(源自知乎https://zhuanlan.zhihu.com/p/506544456)1.引入把对比学习看成是一个字典查询的任务,即训练一个编码器从而去做字典查询的任务。假设已经有一个编码好的queryq以及一系列编码好的样本k0,k1,k2...,把k0,k1,k2...可以看作是字典里的key。假设只有一......
  • ICLR 2024|图像匹配新突破!GIM:首个从互联网视频中学习通用图像匹配器的框架
    前言 为了解决基于深度学习方法泛化性的问题,来自厦门大学、Intel、大疆的研究者们提出了GIM:LearningGeneralizableImageMatcherfromInternetVideos。GIM是第一个可以让匹配模型从互联网视频中学习到强泛化能力的训练框架。本文转载自机器之心仅用于学术分享,若侵权请......
  • 模拟退火学习笔记
    模拟退火,优雅的暴力我认为有必要摘抄一下提单上的简介ZX写的前言:本片适用于模拟退火入门-进阶模拟退火(SA)是一种随机化算法。当一个问题的方案数量极大(甚至是无穷的)而且不是一个单峰函数时,我们常使用模拟退火求解。一般的,很多题都可以用模拟退火水过,在OI界称之[优雅的暴......
  • 学习笔记
    coreUSER:存放工程文件、主函数文件main.c,以及其他包括system_stm32f10x.c等CORE:用来存放核心文件和启动文件OBJ:是用来存放编译过程文件以及hex文件STM32F10x_FWLib:用来存放ST官方提供的库函数源码文件SYSTEM:此文件夹里面的代码由ALIENTEK提供,是STM32F10x系列的底......
  • 学习进度条
     2024-03-05   所花时间(包括上课)2h   代码量(行)300   博客量(篇)1   了解到的知识点课上学习及java编程练习内容   ......
  • Android开发学习之路01
    今日跟着一个人进行了Androidstudio上创建数据库和数据表的联系,这应该是老师留的作业中,进行数据库的连接。原文链接:https://blog.csdn.net/fjh_xx/article/details/131404230一.前言二.SQLite数据库介绍1.什么是SQLite数据库2.特点3.SQLite操作API4.SQLite数据类型三.S......
  • SOME/IP 笔记
    参考链接1:https://mp.weixin.qq.com/s?__biz=MzI0NTU1NDQ3Mw==&mid=2247483718&idx=1&sn=35ec9b655c6d20b9ea14972133a2ce28&chksm=e94d8d00de3a04162fd1acf8eb1dd3300266cc5be77fb66b018a882dd7274ba5a71f1347ab41&scene=21#wechat_redirect#SOME/IP协议......
  • Java学习总结 Day2
    Java学习总结Day2构造器publicclassperson{//一个类默认会有一个方法(构造器)Stringname;intage;//实例化初始值/*1.使用new必须有构造器,本质是调用构造器*2.初始化值*3.快捷键alt+insert*/publicperson(){}//有......