Dated Data: Tracing Knowledge Cutoffs in Large Language Models

时间：2024-06-04 14:30:49浏览次数：27

标签：Cutoffs Knowledge Language 模型知识 Large 日期 LLM 截止

本文是LLM系列文章，针对《Dated Data: Tracing Knowledge Cutoffs in Large Language Models
》的翻译。

日期数据：追踪大型语言模型中的知识截断

摘要
1 引言
2 相关工作
3 方法
4 结果
5 为什么模型与截止日期不一致？
6 结论

摘要

已发布的大型语言模型（LLM）通常与声称的知识截止日期或收集训练数据的日期配对。这些信息对于LLM必须提供最新信息的应用程序至关重要。然而，这种说法只触及了表面：训练数据中的所有资源是否共享相同的知识截止日期？模型证明的这些子集的知识是否与它们的截止日期密切相关？在这项工作中，我们定义了有效截止的概念。这与LLM设计者报告的截止值不同，并分别适用于子资源和主题。我们提出了一种简单的方法，通过在不同版本的数据之间进行探测来估计LLM的资源级时间对齐的有效截止点。通过这种分析，我们发现有效的截止值往往与报告的截止值不同。为了了解这种观察的根本原因，我们对开放的预训练数据集进行了直接的大规模分析。我们的分析揭示了这些不一致的两个原因：（1ÿ

标签：Cutoffs,Knowledge,Language,模型,知识,Large,日期,LLM,截止
From： https://blog.csdn.net/c_cpp_csharp/article/details/139430368

Optimizing Language Augmentation for Multilingual Large Language Models: A Case
本文是LLM系列文章，针对《OptimizingLanguageAugmentationforMultilingualLargeLanguageModels:ACaseStudyonKorean》的翻译。优化多语言大型语言模型的语言增强——以朝鲜语为例摘要1引言2相关工作3丰富MLLM词汇4LIMA上的指令调整5定量评估6定......
Efficient Pruning of Large Language Model with Adaptive Estimation Fusion
本文是LLM系列文章，针对《EfficientPruningofLargeLanguageModelwithAdaptiveEstimationFusion》的翻译。基于自适应估计融合的大型语言模型的高效修剪摘要1引言2相关工作3方法4实验5结论摘要大型语言模型（LLM）已经成为许多生成下游任务的关键，这......
Large Language Models are Zero-Shot Rankers for Recommender Systems论文阅读笔记
LargeLanguageModelsareZero-ShotRankersforRecommenderSystems论文阅读笔记Abstract 本工作旨在调查作为推荐系统的排名模型的LLM的能力。我们首先将推荐问题形式化为一个条件排序任务，将顺序交互历史作为条件，并将其他候选生成模型检索到的项目作为候选项。为了解决LL......
A Novel Paradigm Boosting Translation Capabilities of Large Language Models
本文是LLM系列文章，针对《ANovelParadigmBoostingTranslationCapabilitiesofLargeLanguageModels》的翻译。提升大型语言模型翻译能力的新范式摘要1引言2相关工作3新的训练策略4实验5结果和分析6消融研究：如果我们直接使用大量的翻译数据进行SFT会......
Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文
LargeLanguageModelsasDataAugmentersforCold-StartItemRecommendation论文阅读笔记Abstract LLM的推理和泛化能力可以帮助我们更好地理解用户的偏好和项目特征。我们建议利用LLM作为数据增强器，来弥补在训练过程中对冷启动项目的知识差距。我们使用LLM根据用户历史行......
Re-Search for The Truth Multi-round Retrieval-augmented Large Language Models ar
本文是LLM系列文章，针对《Re-SearchforTheTruth:Multi-roundRetrieval-augmentedLargeLanguageModelsareStrongFakeNewsDetectors》的翻译。重新寻找真相：多轮检索增强的大型语言模型是强大的假新闻检测器摘要1引言2相关工作3方法4实验5结论局限......
Unmasking the Shadows of AI: Investigating Deceptive Capabilities in Large Langu
本文是LLM系列文章，针对《UnmaskingtheShadowsofAI:InvestigatingDeceptiveCapabilitiesinLargeLanguageModels》的翻译。揭开人工智能的阴影：大型语言模型中的欺骗能力研究摘要2023年人工智能安全峰会：它实际实现了什么？AI欺骗的意义LLM和LLM中的偏见关于......
Learning Transferable Visual Models From Natural Language Supervision
郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！Proceedingsofthe38thInternationalConferenceonMachineLearning,PMLR139,2021. Abstract 1.IntroductionandMotivatingWork 2.Approach 2.1.CreatingaSufficientlyLargeDataset ......
DDL（Data Definition Language）数据定义语句
DDL语句的主要作用是定义或修改数据表的结构或数据类型。数据表的创建：CREATETABLE{表名}({字段名}{数据类型}{限制条件1}{限制条件2}...,{字段名}{数据类型}{限制条件1}{限制条件2}...);注：*每个字段之间需要写逗号*限制条件可以不加示例：#创......
FEL - Fast Expression Language
开源好用的表达式计算语言FEL，可惜了官网文档不在国内，我来个过来。Fel是轻量级的高效的表达式计算引擎Fel在源自于企业项目，设计目标是为了满足不断变化的功能需求和性能需求。Fel是开放的，引擎执行中的多个模块都可以扩展或替换。Fel的执行主要是通过函数实现,运算符(+、-等都是F......

Dated Data: Tracing Knowledge Cutoffs in Large Language Models

日期数据：追踪大型语言模型中的知识截断

摘要

相关文章

赞助商

阅读排行