• 2024-11-0351c大模型~合集13
     我自己的原文哦~  https://blog.51cto.com/whaosoft/11580286#SearchGPTOpenAI大杀器SearchGPT横空出世,单挑谷歌千亿美元搜索帝国OpenAI真来撼动谷歌的搜索帝国了?深夜悄悄上线的AI搜索引擎产品——SearchGPT,在同一问题的演示上,直接原地吊打谷歌和Perplexity。谷歌的AIO
  • 2024-10-20论文翻译:arxiv-2024.Dillon Bowen.Scaling Laws for Data Poisoning in LLMs
    ScalingLawsforDataPoisoninginLLMshttps://arxiv.org/pdf/2408.02946论文主要研究了大型语言模型在数据中毒威胁下的脆弱性,发现模型规模越大,对有害行为的学习速度越快,强调了在更大模型中建立健全数据保护措施的必要性。在大型语言模型(LLMs)中数据投毒的规模法则
  • 2024-09-29计算机视觉小目标检测模型
    本文内容持续更新,敬请关注~开源模型1、FPN被应用于FasterR-CNN、RetinaNet等检测器中,改善了不同尺度目标的检测性能。​https://arxiv.org/abs/1506.01497https://github.com/ShaoqingRen/faster_rcnn2、SRCNN(Super-ResolutionConvolutionalNeuralNetwork)是一个典
  • 2024-09-25AI推介-大语言模型LLMs论文速览(arXiv方向):2024.08.25-2024.08.31
    文章目录~1.LongRecipe:RecipeforEfficientLongContextGeneralizationinLargeLanguageModels2.GenAI-poweredMulti-AgentParadigmforSmartUrbanMobility:OpportunitiesandChallengesforIntegratingLargeLanguageModels(LLMs)andRetrieval-Augm
  • 2024-09-05paper 管理
    这些文章放到这里我估计我也就不会读了。移动端agenthttps://arxiv.org/pdf/2406.11896DigiRL:TrainingIn-The-WildDevice-ControlAgentswithAutonomousReinforcementLearningagent相关的环境https://arxiv.org/pdf/2308.04026Anopen-sourcesandboxforlargel
  • 2024-08-21ACL 2024奖项公布:华科大破译甲骨文最佳论文之一、GloVe时间检验奖
    为期六天的ACL2024正在泰国曼谷举办。ACL是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL在NLP领域的学术影响力都位列第一,它也是CCF-A类推荐会议。今年的ACL大会已是第62届,接收了400余篇NLP领域的前沿
  • 2024-07-292024年7月29日Arxiv语言模型相关论文
    在将差分隐私应用于文本时,粒度是至关重要的:神经机器翻译的研究。原标题:Granularityiscrucialwhenapplyingdifferentialprivacytotext:Aninvestigationforneuralmachinetranslation作者:DoanNamLongVu,TimourIgamberdiev,IvanHabernal机构:德国
  • 2024-07-19Arena Learning: 构建大语言模型的数据飞轮
    大语言模型(LLMs)正在快速发展,但如何有效评估和持续改进这些模型仍面临巨大挑战。本文提出了一种名为ArenaLearning的创新方法,通过模拟聊天机器人竞技场来构建高效的数据飞轮,从而实现LLMs的持续优化。让我们深入了解这种方法的核心思想和关键技术。1.背景与挑战近年
  • 2024-07-11AI推介-大语言模型LLMs之RAG(检索增强生成)论文速览(arXiv方向):2024.06.20-2024.07.01
    文章目录~1.AStudyonEffectofReferenceKnowledgeChoiceinGeneratingTechnicalContentRelevanttoSAPPhIREModelUsingLargeLanguageModel2.FromRAGtoRICHES:RetrievalInterlacedwithSequenceGeneration3.SK-VQA:SyntheticKnowledgeGeneration
  • 2024-07-10KAN: Kolmogorov-Arnold Networks (arXiv 2024)
    KAN官方代码库:https://github.com/KindXiaoming/pykan官方tutorials:https://kindxiaoming.github.io/pykan/目录AbstractKolmogorov–ArnoldNetworks(KAN)Kolmogorov-ArnoldRepresentationtheoremKANarchitectureImplementationdetailsKAN’sApproximation
  • 2024-07-10CvT:微软提出结合CNN的ViT架构 | 2021 arxiv
    CvT将Transformer与CNN在图像识别任务中的优势相结合,从CNN中借鉴了多阶段的层级结构设计,同时引入了ConvolutionalTokenEmbedding和ConvolutionalProjection操作增强局部建模能力,在保持计算效率的同时实现了卓越的性能。此外,由于卷积的引入增强了局部上下文建模能力,CvT不再需要
  • 2024-07-09DeepViT:字节提出深层ViT的训练策略 | 2021 arxiv
    作者发现深层ViT出现的注意力崩溃问题,提出了新颖的Re-attention机制来解决,计算量和内存开销都很少,在增加ViT深度时能够保持性能不断提高来源:晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer论文地址:https://arxiv.org/abs/2103.11886论文代码
  • 2024-07-08订阅arXiv每日最新论文
    邮箱订阅论文arXiv参考如何利用邮箱订阅arxiv,接收每日最新的arxiv文章订阅订阅它的论文,需要用自己的邮箱像arXiv发送邮件。To:[email protected]:subscribeYourNameaddArtificialIntelligencedelSystemsandControl我们需要从arxiv.org上查找自己
  • 2024-07-072024年7月1日Arxiv人工智能相关论文
    cs.AI:极端事件建模和理解的人工智能:方法和挑战原标题:AIforExtremeEventModelingandUnderstanding:MethodologiesandChallenges作者:GustauCamps-Valls,Miguel-ÁngelFernández-Torres,Kai-HendrikCohrs,AdrianHöhl,AndreaCastelletti,AytacPac
  • 2024-07-072024年7月3日Arxiv人工智能相关论文
    在FPGA上实现快速、可扩展、能效高的非逐元素矩阵乘法原标题:Fast,Scalable,Energy-EfficientNon-element-wiseMatrixMultiplicationonFPGA作者:XuqiZhu,HuaizhiZhang,JunKyuLee,JiachengZhu,ChandrajitPal,SangeetSaha,KlausD.McDonald-Maier,
  • 2024-07-072024年7月4日Arxiv语言模型相关论文
    使用增量机器翻译系统评估自动评估指标原标题:EvaluatingAutomaticMetricswithIncrementalMachineTranslationSystems作者:GuojunWu,ShayB.Cohen,RicoSennrich机构:苏黎世大学爱丁堡大学计算语言学系信息学院摘要:我们介绍了一个数据集,包括在12个翻
  • 2024-07-042024年7月3日Arxiv语言模型相关论文
    RankRAG:在大语言模型中统一上下文排名与检索增强生成原标题:RankRAG:UnifyingContextRankingwithRetrieval-AugmentedGenerationinLLMs作者:YueYu,WeiPing,ZihanLiu,BoxinWang,JiaxuanYou,ChaoZhang,MohammadShoeybi,BryanCatanzaro机构:乔治
  • 2024-06-21一个简单的python脚本,把latex项目的调用资源放在同一级,以便arxiv
    据说上传arxiv时所有资源需要在同一目录,也就是不能有文件夹(只是据说,有人说有文件夹也行,我没试过),所以写了一个简单的小脚本把latex项目的资源(主要是图片)放在和.tex一个路径下:importosimportshutiltex_file='main.tex'img_folder='imgs'encoding_type='utf-8'withopen
  • 2024-06-18Ragas实践问题记录1 ValueError: Directory ./arxiv-papers/ does not exist.
    纯小白,记录一下在尝试ragas时遇到的一些问题。尝试官方文档“CompareLLMsusingRagasEvaluations”时,在Createsynthetictestdata步骤复制github中的代码时,遇到了以下问题:ragas官方文档查看请点此解决方法是前往openxlab下载数据集,再使用本地的路径替换掉报错的地方
  • 2024-06-112024年6月11日Arxiv大语言模型相关论文
    cs.CL:在Token经济中的推理:大语言模型推理策略的预算感知评估原标题:ReasoninginTokenEconomies:Budget-AwareEvaluationofLLMReasoningStrategies作者:JunlinWang,SiddharthaJain,DejiaoZhang,BaishakhiRay,VarunKumar,BenAthiwaratkun摘要:
  • 2024-06-07今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理
    还记得2022年末ChatGPT的横空出世,带来了整个NLP乃至AI领域的震动,随后如LLaMA、ChatGLM、Qwen等类ChatGPT大模型(LLM)开始如雨后春笋般涌现,这些先进的模型不仅展示了在零样本学习中的出色表现,还在多种NLP任务中展示了其强大的能力,例如文本摘要、机器翻译、信息提取和情感分析等,使
  • 2024-06-05AI推介-多模态视觉语言模型VLMs论文速览(arXiv方向):2024.05.25-2024.05.31
    文章目录~1.EmpoweringVisualCreativity:AVision-LanguageAssistanttoImageEditingRecommendations2.Bootstrap3D:Improving3DContentCreationwithSyntheticData3.Video-MME:TheFirst-EverComprehensiveEvaluationBenchmarkofMulti-modalLLMsin
  • 2024-05-29The stuff make you know 90% of what matters today
    ThetechnicalpaperstoshowyouthekeyunderthehoodtechnologiesinAI-2024-05-101.TheAnnotatedTransformer(AttentionisAllYouNeed-https://arxiv.org/pdf/1706.03762)https://nlp.seas.harvard.edu/annotated-transformer/TheTransformerhasbee
  • 2024-05-27MachineUnlearn 的一种方法
    MachineUnlearnMethod半白盒攻击LLMunlearning[1][2]可以视为RLHF的替代方案,用于消除LLM的幻觉,删除受版权保护的内容等,也可以视为事后防御策略,用于防止JailBreak在Eraser:JailbreakingDefense[2:1]文章中,作者直观地认为同一个问题的多个答案应当有相似之处
  • 2024-05-23CeiT:商汤提出结合CNN优势的高效ViT模型 | 2021 arxiv
    论文提出CeiT混合网络,结合了CNN在提取低维特征方面的局部性优势以及Transformer在建立长距离依赖关系方面的优势。CeiT在ImageNet和各种下游任务中达到了SOTA,收敛速度更快,而且不需要大量的预训练数据和额外的CNN蒸馏监督,值得借鉴来源:晓飞的算法工程笔记公众号论文:Incorpora