2024-02-26 闲话

时间：2024-02-26 16:22:53浏览次数：32

标签：02 dots 26 task sequence 知识 2024 pap input

Course 不是 Undergraduate Research.

Plug-and-Play Knowledge Injection for Pre-trained Language Models

建议以后写完文章拿 ChatGPT 跑一遍语法错误

metioned 不是 mentions 谢谢。

设计了 “plug - and - play” 的 paradigm。下文记作 pap 范式

主打 map-tuning。

有一个通用 LLM（我的理解是掌握了语义能力） P 微调得到的 LLM D（能独立应付一些 down-stream task 比如情感分析等等），B 是知识库，我们希望训练一个知识插件 M 实现 D 在inference 时能有效使用 B 中的知识。显然 M 的体量极其小，否则直接微调 D 即可。

这里当然有 constraints：对于通用的 pap，我们不希望 M 在训练中见过来自 D 的信息，也不希望 M 中的信息在训练过程中被 D 见过；对于 task-specific 的 pap，我们可以允许 M 见到过来自 D 的信息，但是训练 M 的过程中需要保证 D 的参数是 frozen 的。

叫 map-tuning 的原因其实是对 input sequence 做了一些手脚。在 inference 过程中，我们将 input sequence （token 序列 \(w_1,\dots w_n\)）中找到若干区间 \([l_1,r_1]\dots [l_k,r_k]\)，将它们和 B 中的“知识 \(e_1,\dots e_k\)” Match 起来，也就是说用 M 将知识映射为一个向量，然后 \(\forall p\in[1,k],w_{l_p},\dots w_{r_p}\) 换成 \(M(e_p),/ w_{l_p} \dots w_{r_p}\)。对 input sequence 增强之后再喂给模型 D 来 complete down stream task.

现在问题就是：

知识如何 embedding。
embedding 的知识怎么用 M 映射。
\([l_1,r_1]\dots [l_k,r_k]\) 怎么选择，怎么实现它们和 B 中知识的 matching

标签：02,dots,26,task,sequence,知识,2024,pap,input
From： https://www.cnblogs.com/yspm/p/18034372/WasteWords20240226

Ncast盈可视高清智能录播系统RCE漏洞（CVE-2024-0305）复现
0x00漏洞简介Ncast盈可视高清智能录播系统是广东盈科电子公司的一款产品。该系统2017及之前版本/classes/common/busiFacade.php接口存在RCE漏洞。0x01资产测绘：zoomeye-query:title:"高清智能录播系统"fofa-query:app="Ncast-产品"&&title=="高清智能录播系统"0x02漏......
【李宏毅机器学习2021】(二）Tips for training
这一节主要讲解机器学习、类神经网络训练不起来怎么办？讲解一些训练的tips。先来回顾下机器学习的步骤：接下来将介绍在机器学习过程中，遇到问题时如何判断原因并解决：在训练数据上Loss值很大ModelBias在训练数据上Loss值很大，有可能是发生了Model问题。问题原因：模型太......
SketchUp Pro 2023：颠覆传统，重塑设计世界mac/win版
SketchUpPro2023是一款强大的三维建模软件，专为设计师、建筑师和创意专业人士打造。这款软件以其直观易用的界面和强大的功能而著称，为用户提供了无限的创意空间。→→↓↓载SketchUpPro2023mac/win版 SketchUpPro2023在用户体验方面进行了全面的优化，界面更加简洁明了，操......
GDOI2024 游记
加训睡觉/fendou。Day-10|2024.2.20早上打了icpc2022hangzhou。拷打钱哥怎么没过计算几何板子题。研究模拟赛某题的凸包，感觉增删的凸包还是太困难了，即使条件弱化很多了也不太好做。nmd。晚上看lpl，怎么IG把BLG给虐了。和网友聊八卦，激情输出观点，得出的结论是恋爱太......
【李宏毅机器学习2021】（一）引入机器学习和深度学习
引入机器学习MachineLearning概括来说就是LookingforFunction，即让机器具备找一个函数的能力这些函数显然非常复杂，要依靠机器自动找出该函数。随着要找的函数不同，机器学习有不同的类别：Regression，回归：函数输出的是数值。Classification，分类：函数从给定选项（类别）中选择一个......
部署K8S-1-26
DEVops入门1部署K8S1.1节点准备节点名ip功能k8s-master10.0.0.153k8s-node110.0.0.154k8s-node210.0.0.1551.2初始操作在所有节点执行#1关闭防火墙systemctldisablefirewalldsystemctlstopfirewalldfirewall-cmd--state#2关闭seli......
文心一言 VS 讯飞星火 VS chatgpt （202）-- 算法导论15.3 1题
一、对于矩阵链乘法问题，下面两种确定最优代价的方法哪种更高效?第一种方法是穷举所有可能的括号化方案，对每种方案计算乘法运算次数，第二种方法是运行RECURSIVE-MATRIX-CHAIN。证明你的结论。如果写代码，请用go语言。对于矩阵链乘法问题，下面两种确定最优代价的方法哪种更高效?第一种......
Excelize 开源基础发布 2.8.1 版本，2024 年首个更新
Excelize是Go语言编写的用于操作电子表格办公文档的开源基础库，基于ISO/IEC29500、ECMA-376国际标准。可以使用它来读取、写入由MicrosoftExcel、WPS、ApacheOpenOffice、LibreOffice等办公软件创建的电子表格文档。支持XLAM/XLSM/XLSX/XLTM/XLTX等多种文档格......
【2024-02-16】连岳摘抄
23:59要紧的是，我们首先应该善良，其次要诚实，再其次是以后永远不要互相遗忘。 ——陀思妥耶夫斯基读书是为了获得理论（......
【2024-02-15】连岳摘抄
23:59无论她拥有伟大的智慧，还是平凡的天真，生活都不会伤害一个懂得活在当下，懂得亲近生命，能温柔仔细地欣赏沿途的每朵小花，珍惜每个游戏瞬间的人。 ......

2024-02-26 闲话

相关文章

赞助商

阅读排行