ArXiv

2024-09-05paper 管理
这些文章放到这里我估计我也就不会读了。移动端agenthttps://arxiv.org/pdf/2406.11896DigiRL:TrainingIn-The-WildDevice-ControlAgentswithAutonomousReinforcementLearningagent相关的环境https://arxiv.org/pdf/2308.04026Anopen-sourcesandboxforlargel
2024-08-21ACL 2024奖项公布：华科大破译甲骨文最佳论文之一、GloVe时间检验奖
为期六天的ACL2024正在泰国曼谷举办。ACL是计算语言学和自然语言处理领域的顶级国际会议，由国际计算语言学协会组织，每年举办一次。一直以来，ACL在NLP领域的学术影响力都位列第一，它也是CCF-A类推荐会议。今年的ACL大会已是第62届，接收了400余篇NLP领域的前沿
2024-07-292024年7月29日Arxiv语言模型相关论文
在将差分隐私应用于文本时，粒度是至关重要的：神经机器翻译的研究。原标题:Granularityiscrucialwhenapplyingdifferentialprivacytotext:Aninvestigationforneuralmachinetranslation作者:DoanNamLongVu,TimourIgamberdiev,IvanHabernal机构:德国
2024-07-19Arena Learning: 构建大语言模型的数据飞轮
大语言模型(LLMs)正在快速发展,但如何有效评估和持续改进这些模型仍面临巨大挑战。本文提出了一种名为ArenaLearning的创新方法,通过模拟聊天机器人竞技场来构建高效的数据飞轮,从而实现LLMs的持续优化。让我们深入了解这种方法的核心思想和关键技术。1.背景与挑战近年
2024-07-11AI推介-大语言模型LLMs之RAG（检索增强生成）论文速览（arXiv方向）：2024.06.20-2024.07.01
文章目录～1.AStudyonEffectofReferenceKnowledgeChoiceinGeneratingTechnicalContentRelevanttoSAPPhIREModelUsingLargeLanguageModel2.FromRAGtoRICHES:RetrievalInterlacedwithSequenceGeneration3.SK-VQA:SyntheticKnowledgeGeneration
2024-07-10KAN: Kolmogorov-Arnold Networks (arXiv 2024)
KAN官方代码库：https://github.com/KindXiaoming/pykan官方tutorials：https://kindxiaoming.github.io/pykan/目录AbstractKolmogorov–ArnoldNetworks(KAN)Kolmogorov-ArnoldRepresentationtheoremKANarchitectureImplementationdetailsKAN’sApproximation
2024-07-10CvT：微软提出结合CNN的ViT架构 | 2021 arxiv
CvT将Transformer与CNN在图像识别任务中的优势相结合，从CNN中借鉴了多阶段的层级结构设计，同时引入了ConvolutionalTokenEmbedding和ConvolutionalProjection操作增强局部建模能力，在保持计算效率的同时实现了卓越的性能。此外，由于卷积的引入增强了局部上下文建模能力，CvT不再需要
2024-07-09DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv
作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，计算量和内存开销都很少，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer论文地址：https://arxiv.org/abs/2103.11886论文代码
2024-07-08订阅arXiv每日最新论文
邮箱订阅论文arXiv参考如何利用邮箱订阅arxiv,接收每日最新的arxiv文章订阅订阅它的论文，需要用自己的邮箱像arXiv发送邮件。To:[email protected]:subscribeYourNameaddArtificialIntelligencedelSystemsandControl我们需要从arxiv.org上查找自己
2024-07-072024年7月1日Arxiv人工智能相关论文
cs.AI:极端事件建模和理解的人工智能：方法和挑战原标题:AIforExtremeEventModelingandUnderstanding:MethodologiesandChallenges作者:GustauCamps-Valls,Miguel-ÁngelFernández-Torres,Kai-HendrikCohrs,AdrianHöhl,AndreaCastelletti,AytacPac
2024-07-072024年7月3日Arxiv人工智能相关论文
在FPGA上实现快速、可扩展、能效高的非逐元素矩阵乘法原标题:Fast,Scalable,Energy-EfficientNon-element-wiseMatrixMultiplicationonFPGA作者:XuqiZhu,HuaizhiZhang,JunKyuLee,JiachengZhu,ChandrajitPal,SangeetSaha,KlausD.McDonald-Maier,
2024-07-072024年7月4日Arxiv语言模型相关论文
使用增量机器翻译系统评估自动评估指标原标题:EvaluatingAutomaticMetricswithIncrementalMachineTranslationSystems作者:GuojunWu,ShayB.Cohen,RicoSennrich机构:苏黎世大学爱丁堡大学计算语言学系信息学院摘要:我们介绍了一个数据集，包括在12个翻
2024-07-042024年7月3日Arxiv语言模型相关论文
RankRAG：在大语言模型中统一上下文排名与检索增强生成原标题:RankRAG:UnifyingContextRankingwithRetrieval-AugmentedGenerationinLLMs作者:YueYu,WeiPing,ZihanLiu,BoxinWang,JiaxuanYou,ChaoZhang,MohammadShoeybi,BryanCatanzaro机构:乔治
2024-06-21一个简单的python脚本，把latex项目的调用资源放在同一级，以便arxiv
据说上传arxiv时所有资源需要在同一目录，也就是不能有文件夹(只是据说，有人说有文件夹也行，我没试过)，所以写了一个简单的小脚本把latex项目的资源（主要是图片）放在和.tex一个路径下:importosimportshutiltex_file='main.tex'img_folder='imgs'encoding_type='utf-8'withopen
2024-06-18Ragas实践问题记录1 ValueError: Directory ./arxiv-papers/ does not exist.
纯小白，记录一下在尝试ragas时遇到的一些问题。尝试官方文档“CompareLLMsusingRagasEvaluations”时，在Createsynthetictestdata步骤复制github中的代码时，遇到了以下问题：ragas官方文档查看请点此解决方法是前往openxlab下载数据集，再使用本地的路径替换掉报错的地方
2024-06-112024年6月11日Arxiv大语言模型相关论文
cs.CL:在Token经济中的推理：大语言模型推理策略的预算感知评估原标题:ReasoninginTokenEconomies:Budget-AwareEvaluationofLLMReasoningStrategies作者:JunlinWang,SiddharthaJain,DejiaoZhang,BaishakhiRay,VarunKumar,BenAthiwaratkun摘要:
2024-06-07今日arXiv最热大模型论文：大模型都能怎么用？中南大学最新综述：大模型时代的自然语言处理
还记得2022年末ChatGPT的横空出世，带来了整个NLP乃至AI领域的震动，随后如LLaMA、ChatGLM、Qwen等类ChatGPT大模型（LLM）开始如雨后春笋般涌现，这些先进的模型不仅展示了在零样本学习中的出色表现，还在多种NLP任务中展示了其强大的能力，例如文本摘要、机器翻译、信息提取和情感分析等，使
2024-06-05AI推介-多模态视觉语言模型VLMs论文速览（arXiv方向）：2024.05.25-2024.05.31
文章目录～1.EmpoweringVisualCreativity:AVision-LanguageAssistanttoImageEditingRecommendations2.Bootstrap3D:Improving3DContentCreationwithSyntheticData3.Video-MME:TheFirst-EverComprehensiveEvaluationBenchmarkofMulti-modalLLMsin
2024-05-29The stuff make you know 90% of what matters today
ThetechnicalpaperstoshowyouthekeyunderthehoodtechnologiesinAI-2024-05-101.TheAnnotatedTransformer(AttentionisAllYouNeed-https://arxiv.org/pdf/1706.03762)https://nlp.seas.harvard.edu/annotated-transformer/TheTransformerhasbee
2024-05-27MachineUnlearn 的一种方法
MachineUnlearnMethod半白盒攻击LLMunlearning[1][2]可以视为RLHF的替代方案,用于消除LLM的幻觉,删除受版权保护的内容等,也可以视为事后防御策略,用于防止JailBreak在Eraser:JailbreakingDefense[2:1]文章中,作者直观地认为同一个问题的多个答案应当有相似之处
2024-05-23CeiT：商汤提出结合CNN优势的高效ViT模型 | 2021 arxiv
论文提出CeiT混合网络，结合了CNN在提取低维特征方面的局部性优势以及Transformer在建立长距离依赖关系方面的优势。CeiT在ImageNet和各种下游任务中达到了SOTA，收敛速度更快，而且不需要大量的预训练数据和额外的CNN蒸馏监督，值得借鉴来源：晓飞的算法工程笔记公众号论文:Incorpora
2024-04-29VIT模型压缩综述（Comprehensive Survey of Model Compression and Speed up for Vision Transformers）
摘要: VIT是计算机视觉的开山之作,在不同的领域都表现了优越的性能.但是过大的计算量和内存需求,限制了其使用.该篇综述研究了并评估了四种模型压缩的方法,在VIT上的作用:量化,低秩分解,知识蒸馏,剪枝.系统的分析并比较了这些方法在资源受限的环境下,优化VIT方面的效果.我们
2024-04-23如何提升大模型的Agent推理规划等能力？
参考地址：https://mp.weixin.qq.com/s/0qkMbzlU9ks6DNS5MBiU8g论文地址：（1）cot：https://arxiv.org/pdf/2201.11903.pdf（2）tot：https://arxiv.org/pdf/2305.10601.pdf（3）react：https://arxiv.org/pdf/2210.03629.pdf（4）reflexion：https://arxiv.org/pdf/2303.11366.pdf（5）agenttunin
2024-04-23大语言模型（LLM）评价指标小汇总
大语言模型（LLM）评价指标小汇总（也许会更新）from：https://zhuanlan.zhihu.com/p/641416694目录总之就是接了个小项目，这些天统计了一些LLM评价指标，不算很全面，很多方法的具体操作都不是很熟悉，参考论文也没找全，大家就凑合着看：1.榜单、论文统计方法描述
2024-04-09EI 抽象作品集
2023年ComputingPermanentsandCountingHamiltonianCyclesFaster(计算积和式和Hamilton路计数的更快算法)arXiv:2309.15422一句话:积和式和Hamilton路计数可以在\(2^{n-\Omega(\sqrtn)}\)时间内完成,之前的最好复杂度是\(2^{n-\Omega(\sqrt{n/\log\logn}