首页 > 其他分享 >多模态融入推荐

多模态融入推荐

时间:2024-08-06 11:09:13浏览次数:15  
标签:模态 融入 seq 训练 emb 特征 推荐 表征

多模态特征如何融入到推荐

最近刚好读了2篇文章,对于多模态特征处理的核心问题:

  • 多模态表征和推荐ID类特征的表征不在一个向量空间,如何有效融合;
  • 其次多模态特征预训练的,如何有效评估以及融入推荐系统之后如何进行更新的问题

一、先解决怎么融合的问题:

  1. 将多模态表征聚类,使用聚类的id进行输入,模态特征退化成id类特征
  2. 直接使用多模态特征进行DIN
  3. 使用simscore(target和seq的相似度,作为seq序列的sideinfo)

1,3都能取得一定效果,简单反而能有一定收益,多模态表征和序列表征毕竟还是差异比较大,简单输入能早点参与模型参数更新;2的话由于多模态表征深度参与,但由于多模态表征无法进行联合更新,效果一般

有啥更好的方式:

  • 多模态特征的分布表示(target和seq)计算分箱分布统计
  • 直接接入,但taget,seq向量直接接个DIN模型,这个辅助模型用来对齐多模态表征和序列模型表征;可以理解这个辅助模型在当前行为样本上的微调,然后把中间参数、logits和序列模型联合训练
  • simcore分数进行编码,通过一个可学习emb,学习数值型emb,然后和推荐系统进行联合训练

二、多模态特征更新

  • 模态特征+微调网络(通过行为数据进行多轮的微调,毕竟多模态特征微调成本高,但一些MLP网络微调相对轻松容易)
  • 微调网络相当于一个对齐网络(对齐多模态特征和行为序列特征表征),然后将微调网络(中间层参数以及logits)接入到正常序列模型进行联合训练

三、多模态特征预训练

  • 定义好<正、负>样本,对于文本<正样本取搜索文本和购买商品标题> <负样本取mini-batch随机负样本>;对应图片<正样本取搜索图片和购买商品图片> <负样本取mini-batch随机负样本>; 正负样本的确定决定预训练多模态语义向量的质量
  • loss直接使用对比loss,infoNCE loss

四、序列特征attention模块

  • (target,seq,pos,gap) 四元组; 通过 Temporal Interest Module, TIM网络(说实话个人觉得这个网络效果不如显式的特征交叉,显式特征交叉表达信号强,交叉的浅训练充分,交叉阶数越大,训练越难,不容易收敛)

五、兴趣纠缠或者拉扯问题

  • 多个emb,任务级别的emb,单个任务独享emb
  • shared emb 处理共享信息,但最好是有共享参数的领域
  • 各个任务emb参数尺寸尽量跟场景配合,部分场景小,搭配小的emb才能训练充分

参考:

标签:模态,融入,seq,训练,emb,特征,推荐,表征
From: https://www.cnblogs.com/adam86546853/p/18344746

相关文章

  • 基于springboot的协同过滤算法的个性化音乐推荐系统(源码+Lw+文档+讲解等)
    博主介绍:✌十余年IT大项目实战经验、在某机构培训学员上千名、专注于本行业领域✌技术范围:Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫+大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战项目。主要内容:系统功能设计、开题报告......
  • Hashtable工具类 - C#小函数类推荐
          此文记录的是一个Hashtable的增强版本,以前没泛型的时候笔者喜欢用Hashtable,性能刚刚的。/***Hashtable工具类AustinLiu刘恒辉ProjectManagerandSoftwareDesignerE-Mail:[email protected]:http://lzhdim.cnblogs.comD......
  • 学习Python的书籍推荐--《Python编程从入门到实践》
    版权信息:书名:Python编程:从入门到实践(第3版)作者:[美]埃里克·马瑟斯(EricMatthes)译者:袁国忠评价:1.北京邮电大学副教授陈光老师是这样评价的:    编程教学之道,一是重在实践,二是循序渐进一一通过巧妙的实战项目,激发和保持学习的热情,让学习渐入佳境。在这两方......
  • SSM番剧评价推荐3ar02 本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表系统内容:用户,热门番剧,高分番剧,热推番剧,番剧推荐,打赏信息,平台审核员,审核通知,番剧分类开题报告内容一、研究背景随着网络文化的兴起和动漫产业的蓬勃发......
  • 【分享贴】2024年主流项目管理软件推荐
    最近一直有小伙伴问我有没有什么好的项目管理软件推荐,刚好最近也整理了一些内容,本期就给大家分享2024年一些主流的项目管理软件。主要会包含每款软件的简要介绍、功能、优势、不足、以及适用对象这几个维度,部分软件是个人亲身体验过的,另一部分就是整理的广大网友的使用心得,如有不......
  • 推荐一款界面优雅、功能强大的 .NET + Vue 权限管理系统
    前言今天推荐一款用.NET和Vue3实现的开源权限管理系统。它的界面清爽干净,功能强大,还具备灵活的角色权限分配功能,能够满足不同规模企业的管理需求。无论你是开发新手还是大神,都能轻松上手,快速搭建起自己的权限管理体系。别再犹豫了,赶快来试试吧!项目简介Malus是海棠的意思,顾......
  • 科大讯飞P30、小度K16、优学派U59区别 2024最具性价比学习机推荐
    科大讯飞AI学习机P30是一款为小学到高中学生设计的全能型学习平板。它配备了6GB的运行内存和256GB的存储空间,能够轻松运行各种学习应用和存储大量学习资料。11英寸的大屏幕采用护眼设计,能够有效减少蓝光辐射,保护学生视力。P30覆盖了从小学到高中的全科目课程,配合科大讯飞的AI技术,......
  • Java计算机毕业设计基于协同过滤算法的音乐推荐系统(开题报告+源码+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着互联网技术的飞速发展,音乐作为人们日常生活中不可或缺的一部分,其获取方式也经历了从实体唱片到数字音乐的巨大变革。面对海量的音乐资源和日益个......
  • Java计算机毕业设计基于协同过滤算法的体育用品推荐系统(开题报告+源码+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着互联网的迅猛发展,电子商务已成为人们购物的主要渠道之一,体育用品市场也不例外。然而,面对海量的体育用品信息和多样化的用户需求,如何高效、精准地......
  • 推荐3款免费且实用的数据库管理工具
    前言数据库在日常工作中确实扮演着至关重要的角色,无论是数据管理、分析还是应用开发,都离不开它的支持。今天大姚给大家分享3款免费且实用的数据库管理工具,希望可以帮助到有需要的同学。DBeaverDBeaver是一款免费的跨平台数据库工具,适用于开发人员、数据库管理员、分析师和所有......