首页 > 其他分享 >2024-02-26 闲话

2024-02-26 闲话

时间:2024-02-26 16:22:53浏览次数:25  
标签:02 dots 26 task sequence 知识 2024 pap input

Course 不是 Undergraduate Research.

Plug-and-Play Knowledge Injection for Pre-trained Language Models

建议以后写完文章拿 ChatGPT 跑一遍语法错误

image

metioned 不是 mentions 谢谢。

设计了 “plug - and - play” 的 paradigm。下文记作 pap 范式

主打 map-tuning。

有一个通用 LLM(我的理解是掌握了语义能力) P 微调得到的 LLM D(能独立应付一些 down-stream task 比如情感分析等等),B 是知识库,我们希望训练一个知识插件 M 实现 D 在inference 时能有效使用 B 中的知识。显然 M 的体量极其小,否则直接微调 D 即可。

这里当然有 constraints:对于通用的 pap,我们不希望 M 在训练中见过来自 D 的信息,也不希望 M 中的信息在训练过程中被 D 见过;对于 task-specific 的 pap,我们可以允许 M 见到过来自 D 的信息,但是训练 M 的过程中需要保证 D 的参数是 frozen 的。

叫 map-tuning 的原因其实是对 input sequence 做了一些手脚。在 inference 过程中,我们将 input sequence (token 序列 \(w_1,\dots w_n\))中找到若干区间 \([l_1,r_1]\dots [l_k,r_k]\),将它们和 B 中的“知识 \(e_1,\dots e_k\)” Match 起来,也就是说用 M 将知识映射为一个向量,然后 \(\forall p\in[1,k],w_{l_p},\dots w_{r_p}\) 换成 \(M(e_p),/ w_{l_p} \dots w_{r_p}\)。对 input sequence 增强之后再喂给模型 D 来 complete down stream task.

现在问题就是:

  • 知识如何 embedding。

  • embedding 的知识怎么用 M 映射。

  • \([l_1,r_1]\dots [l_k,r_k]\) 怎么选择,怎么实现它们和 B 中知识的 matching

标签:02,dots,26,task,sequence,知识,2024,pap,input
From: https://www.cnblogs.com/yspm/p/18034372/WasteWords20240226

相关文章

  • Ncast盈可视高清智能录播系统RCE漏洞(CVE-2024-0305)复现
    0x00漏洞简介Ncast盈可视高清智能录播系统是广东盈科电子公司的一款产品。该系统2017及之前版本/classes/common/busiFacade.php接口存在RCE漏洞。0x01资产测绘:zoomeye-query:title:"高清智能录播系统"fofa-query:app="Ncast-产品"&&title=="高清智能录播系统"0x02漏......
  • 【李宏毅机器学习2021】(二)Tips for training
    这一节主要讲解机器学习、类神经网络训练不起来怎么办?讲解一些训练的tips。先来回顾下机器学习的步骤:接下来将介绍在机器学习过程中,遇到问题时如何判断原因并解决:在训练数据上Loss值很大ModelBias在训练数据上Loss值很大,有可能是发生了Model问题。问题原因:模型太......
  • SketchUp Pro 2023:颠覆传统,重塑设计世界mac/win版
    SketchUpPro2023是一款强大的三维建模软件,专为设计师、建筑师和创意专业人士打造。这款软件以其直观易用的界面和强大的功能而著称,为用户提供了无限的创意空间。→→↓↓载SketchUpPro2023mac/win版 SketchUpPro2023在用户体验方面进行了全面的优化,界面更加简洁明了,操......
  • GDOI2024 游记
    加训睡觉/fendou。Day-10|2024.2.20早上打了icpc2022hangzhou。拷打钱哥怎么没过计算几何板子题。研究模拟赛某题的凸包,感觉增删的凸包还是太困难了,即使条件弱化很多了也不太好做。nmd。晚上看lpl,怎么IG把BLG给虐了。和网友聊八卦,激情输出观点,得出的结论是恋爱太......
  • 【李宏毅机器学习2021】(一)引入机器学习和深度学习
    引入机器学习MachineLearning概括来说就是LookingforFunction,即让机器具备找一个函数的能力这些函数显然非常复杂,要依靠机器自动找出该函数。随着要找的函数不同,机器学习有不同的类别:Regression,回归:函数输出的是数值。Classification,分类:函数从给定选项(类别)中选择一个......
  • 部署K8S-1-26
    DEVops入门1部署K8S1.1节点准备节点名ip功能k8s-master10.0.0.153k8s-node110.0.0.154k8s-node210.0.0.1551.2初始操作在所有节点执行#1关闭防火墙systemctldisablefirewalldsystemctlstopfirewalldfirewall-cmd--state#2关闭seli......
  • 文心一言 VS 讯飞星火 VS chatgpt (202)-- 算法导论15.3 1题
    一、对于矩阵链乘法问题,下面两种确定最优代价的方法哪种更高效?第一种方法是穷举所有可能的括号化方案,对每种方案计算乘法运算次数,第二种方法是运行RECURSIVE-MATRIX-CHAIN。证明你的结论。如果写代码,请用go语言。对于矩阵链乘法问题,下面两种确定最优代价的方法哪种更高效?第一种......
  • Excelize 开源基础发布 2.8.1 版本,2024 年首个更新
    Excelize是Go语言编写的用于操作电子表格办公文档的开源基础库,基于ISO/IEC29500、ECMA-376国际标准。可以使用它来读取、写入由MicrosoftExcel、WPS、ApacheOpenOffice、LibreOffice等办公软件创建的电子表格文档。支持XLAM/XLSM/XLSX/XLTM/XLTX等多种文档格......
  • 【2024-02-16】连岳摘抄
    23:59要紧的是,我们首先应该善良,其次要诚实,再其次是以后永远不要互相遗忘。                                                 ——陀思妥耶夫斯基读书是为了获得理论(......
  • 【2024-02-15】连岳摘抄
    23:59无论她拥有伟大的智慧,还是平凡的天真,生活都不会伤害一个懂得活在当下,懂得亲近生命,能温柔仔细地欣赏沿途的每朵小花,珍惜每个游戏瞬间的人。                                         ......