首页 > 其他分享 >A LLM-based Controllable, Scalable, Human-Involved User Simulator Framework for Conversational Recom

A LLM-based Controllable, Scalable, Human-Involved User Simulator Framework for Conversational Recom

时间:2024-07-02 16:22:58浏览次数:17  
标签:Conversational Controllable based preferences Involved Scalable Human

目录

Zhu L., Huang X. and Sang J. A llm-based controllable, scalable, human-involved user simulator framework for conversational recommender systems. 2024.

作者利用 LLM 进行用户模拟, 虽然是复杂了一点, 但是感觉还是很无聊啊, 没有想象中那么酷.

CSHI (Controllable, Scalable, and Human-Involved)

  • CSHI 的设计初衷是为了更好地评判对话推荐系统, 本质上是一个用户模拟系统.

  • user profile init: 这部分用于生成用户画像, 这一部分可以认为设置, 也可以模型通过用户的交互序列自动生成.

  • preferences init: 分为 long/real-time preferences, 特别的, real-time preferences 分为 "known preferences" 和 "unknown preferences", 我们可以通过参数来设置一个用户 "known preferences" 和 "unknown preferences" 的比例.

  • Message handling: 'user' 在接收到 (Agent) 的信息后, 会有三种模式:

    • Ask response: 此时判断 Agent 是希望知道自己的 preference, 所以会提供相应的偏好信息;
    • Recommend response: 此时消息是给自己推荐一些东西, 回答应当是一些反馈;
    • Chit-chat response: 闲聊阶段.

代码

[official]

标签:Conversational,Controllable,based,preferences,Involved,Scalable,Human
From: https://www.cnblogs.com/MTandHJ/p/18280062

相关文章

  • A Guide to Setting Plot Styles Based on the Matplotlib Library
    AGuidetoSettingPlotStylesBasedontheMatplotlibLibraryDateAuthorVersionNote2024.06.21DogTaoV1.0Finishthedocument.文章目录AGuidetoSettingPlotStylesBasedontheMatplotlibLibraryBasicUsageDrawplotsAdjuststyleSaveplotsAnnotatepl......
  • Web渗透:XSS-DOM-based XSS
    DOM-basedXSS(基于DOM的跨站脚本攻击)是一种XSS攻击类型,其特点是恶意脚本通过操作文档对象模型(DOM)直接在客户端执行,而无需经过服务器的处理。这种攻击主要利用客户端JavaScript代码中的漏洞,使得攻击者能够在浏览器中注入并执行恶意代码。DOM的基本概念文档对象模型(DOM,Document......
  • 渲染中的光照着色方式:PBR(Physically Based Rendering,物理基础渲染)与 传统经验渲染
    参考《UnityShader入门精要》十八章基于物理的渲染 与PBR(PhysicallyBasedRendering,物理基础渲染)对应的渲染方法通常被称为“传统渲染”或“基于经验的渲染”(EmpiricalRendering)。以下是两者的主要区别:传统渲染传统渲染方法基于经验规则和艺术调整,而不是物理定律。这种......
  • dlib安装问题:ERROR: Could not build wheels for dlib, which is required to install
      #问题安装报错。 >pipinstalldlibDefaultingtouserinstallationbecausenormalsite-packagesisnotwriteableCollectingdlibDownloadingdlib-19.24.4.tar.gz(3.3MB)━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━......
  • CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based M
    本文是LLM系列文章,针对《CBT-LLM:AChineseLargeLanguageModelforCognitiveBehavioralTherapy-basedMentalHealthQuestionAnswering》的翻译。CBT-LLM:一个基于认知行为治疗的心理健康问答的中文大语言模型摘要1引言2相关工作3方法4实验5结论和未......
  • 《Optimizing the LINPACK Algorithm for Large-Scale PCIe-Based CPU-GPU Heterogene
    论文标题《OptimizingtheLINPACKAlgorithmforLarge-ScalePCIe-BasedCPU-GPUHeterogeneousSystems》为基于PCIe的大规模CPU-GPU异构系统优化LINPACK算法作者GuangmingTan、ChaoyangShui、YinshanWang、XianzhiYu和YujinYan来自中科院计算所初读摘要......
  • Zabbix 7.0 LTS OVF (build with LNMP based on Rocky 8.10) - VMware 虚拟机模板
    Zabbix7.0LTSOVF(buildwithLNMPbasedonRocky8.10)-VMware虚拟机模板Zabbix7.0LTS|企业级开源监控解决方案请访问原文链接:https://sysin.org/blog/zabbix-7-ovf/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgZabbix简介全方位监控获取整个IT......
  • 腾讯冷启动论文阅读《Enhancing User Interest based on Stream Clustering and Memor
    背景用户冷启动一直是推荐系统中的一个难题,新用户(或非活跃用户)由于缺少行为数据,模型预估不准确。为了改善用户冷启动,腾讯提出了UserInterestEnhancement(UIE)模型(论文中提到也可以用于item的冷启动)。基本思想是先对用户聚类,然后用userembedding检索最相似的k个聚类中心来表示......
  • codeforces 1442 D Codeforces Round 681 (Div. 1, based on VK Cup 2019-2020 - Fina
    链接大意就是给你n组物品,这n组物品里面每组有\(t_i\)个,且他们是按照价值不降的顺序排列的。现在允许取k个物品,每个物品必须取在数组的开头处,每个物品在被取用后就会消失。问你最大能够拿到多少价值的物品。其中\(n,k\leq1500,\sumt_i\leq1e6,a_i\leq1e8\)很背包吧。可......
  • [论文速览] Design and Development of a Framework For Stroke-Based Handwritten Gu
    1.Pretitle:DesignandDevelopmentofaFrameworkForStroke-BasedHandwrittenGujaratiFontGenerationsource:arXiv2024paper:https://arxiv.org/abs/2404.03277code:None关键词:fontgeneration,handwritten,gujarati,stroke阅读理由:刷新鲜论文ing2.Mo......