arxiv

2025-01-05YOLOv11改进策略【Neck】| ArXiv 2023，基于U - Net v2中的的高效特征融合模块：SDI
一、本文介绍本文聚焦于利用U-Netv2中的SDI模块优化YOLOv11的目标检测网络模型。SDI模块相较于传统模块独具特色，它融合了先进的特征融合思想，借助精心设计的结构，在确保计算资源高效利用的前提下，巧妙地融合不同层级特征的语义信息与细节，实现特征的全方位增强。在应用于YOL
2024-12-30arxiv：多元时间序列推断的深度学习：一项调查
代码地址：https://github.com/wenjiedu/awesome_imputation?tab=readme-ov-file摘要普遍存在的缺失值导致多元时间序列数据被部分观测到，破坏了时间序列的完整性，阻碍了有效的时间序列数据分析。最近，深度学习插补方法在提高损坏的时间序列数据的质量方面取得了显著成功，从而提高了下
2024-12-18拿到一篇论文，如何查看该论文提交到arXiv上的时间【科研小技巧】
1、打开arXiv官方网站：https://arxiv.org/。2、在右上角的搜索框输入要检索的文章标题并进行检索，以UnderstandingDiffusionModels:AUnifiedPerspective这篇论文为例。3、检索到文章后，可以看到文章标题的正上方有个[Submittedon25Aug2022]，表示该文章在2022年8月25日提
2024-12-17人工智能语言模型起源全景探究：终章。
上一篇：《人工智能规模法则的起源、分析、内幕以及对齐方法》（18）《人工智能的宪法：用AI的反馈来确保AI的无害性》（2022年），作者：Yuntao、Saurav、Sandipan、Amanda、Jackson、Jones、Chen、Anna、Mirhoseini、McKinnon、Chen、Olsson、Olah、Hernandez、Drain、Ganguli、Li、Tran-Johns
2024-12-16人工智能规模法则的起源、分析、内幕以及对齐方法
上一篇：《人工智能大语言模型起源篇，低秩微调（LoRA）》（14）Rae和同事（包括78位合著者！）于2022年发表的《ScalingLanguageModels:Methods,Analysis&InsightsfromTrainingGopher》，https://arxiv.org/abs/2112.11446《Gopher》是篇特别好的论文，包含了大量分析来帮助理解大型语言模
2024-12-15人工智能大语言模型起源篇，低秩微调（LoRA）
上一篇:《规模法则（ScalingLaw）与参数效率的提高》序言：您在找工作时会不会经常听到LoRA微调，这项技术的来源就是这里了。（12）Hu、Shen、Wallis、Allen-Zhu、Li、LWang、SWang和Chen于2021年发表的《LoRA:Low-RankAdaptationofLargeLanguageModels》，https://arxiv.org/a
2024-12-14arXiv-2024 | 具身智能体要上天！CITYNAV：基于地理信息的无人机视觉语言导航数据集
作者：JungdaeLee,TaikiMiyanishi,ShuheiKurita,KoyaSakamoto,DaichiAzuma,YutakaMatsuo,NakamasaInoue单位：东京科学，东京大学，NII，ATR，京都大学AIP，京都大学，索尼半导体解决方案原文链接：CITYNAV:LANGUAGE-GOALAERIALNAVIGATIONDATASETWITHGEOGRAPHICINFORM
2024-12-14人工智能大语言模型起源篇（二），从通用语言微调到驾驭LLM
上一篇：《人工智能大语言模型起源篇（一），从哪里开始》（5）Howard和Ruder于2018年发表的《UniversalLanguageModelFine-tuningforTextClassification》，https://arxiv.org/abs/1801.06146这篇论文从历史的角度来看非常有意思。尽管它是在原始的《AttentionIsAllYouNeed
2024-12-14规模法则（Scaling Law）与参数效率的提高，
上一篇：《人工智能大语言模型起源篇（三），模型规模与参数效率》规模法则与效率提高如果你想了解更多关于提高变换器效率的各种技术，我推荐阅读2020年的《EfficientTransformers:ASurvey》https://arxiv.org/abs/2009.06732论文，接着是2023年的《ASurveyonEfficientTraining
2024-12-14规模法则（Scaling Law）与参数效率的提高，
上一篇：《人工智能大语言模型起源篇（三），模型规模与参数效率》规模法则与效率提高如果你想了解更多关于提高变换器效率的各种技术，我推荐阅读2020年的《EfficientTransformers:ASurvey》https://arxiv.org/abs/2009.06732论文，接着是2023年的《ASurveyonEfficientTrainingof
2024-12-13人工智能大语言模型起源篇（二），从通用语言微调到驾驭LLM
上一篇：《人工智能大语言模型起源篇（一），从哪里开始》（5）Howard和Ruder于2018年发表的《UniversalLanguageModelFine-tuningforTextClassification》，https://arxiv.org/abs/1801.06146这篇论文从历史的角度来看非常有意思。尽管它是在原始的《AttentionIsAllYouNeed》变
2024-12-04Voice Agent 开发者必读，2024 最前沿语音模型梳理
今天推荐的是我们的社区成员BoJack创建的GitHub仓库，如果你在关注VoiceAgent开发，想了解最前沿的语音模型都有哪些，这个仓库的列表就非常值得关注。 BoJack正在上海交大读博，研究方向为语音多模态，语音交互系统，自监督预训练。他也是近期发布的语音全双工模型LSLM、TTS语音
2024-11-25从入门到略懂 - 深入了解提示词工程
提示工程，也称为上下文提示，是指如何与LLM进行沟通，以在不更新模型权重的情况下引导其行为以实现所需结果的方法。这是一门经验科学，提示工程方法的效果在不同模型之间可能存在很大差异，因此需要大量的实验和启发式方法。这篇文章只关注自回归语言模型的快速工程，因此不涉及Cl
2024-11-24猫头虎分享：18种写AI 提示词 Prompt Engineering方法大集合
猫头虎分享：18种写AI提示词PromptEngineering方法大集合大家好，我是猫头虎！今天为大家整理了PromptEngineering（提示工程）的18种方法，并为每种方法提供了实际案例及对应论文参考链接。希望大家能从中受益！目录Top1猫头虎提示词Top2Zero-shotPromptTop3Few-shotPro
2024-11-24深入理解索引（二）
1.引言在数据库和数据结构中，索引（Index）是一种用于提高数据检索速度的重要机制。本文将详细深入介绍索引。2.为什么要使用索引大家在使用索引之前一定要搞清楚使用索引的目的，因为索引的不当使用可能不但起不到正向作用，反而会带来灾难性后果。一般来说使用索引的目的有以下
2024-09-25AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.08.25-2024.08.31
文章目录～1.LongRecipe:RecipeforEfficientLongContextGeneralizationinLargeLanguageModels2.GenAI-poweredMulti-AgentParadigmforSmartUrbanMobility:OpportunitiesandChallengesforIntegratingLargeLanguageModels(LLMs)andRetrieval-Augm
2024-09-05paper 管理
这些文章放到这里我估计我也就不会读了。移动端agenthttps://arxiv.org/pdf/2406.11896DigiRL:TrainingIn-The-WildDevice-ControlAgentswithAutonomousReinforcementLearningagent相关的环境https://arxiv.org/pdf/2308.04026Anopen-sourcesandboxforlargel
2024-08-21ACL 2024奖项公布：华科大破译甲骨文最佳论文之一、GloVe时间检验奖
为期六天的ACL2024正在泰国曼谷举办。ACL是计算语言学和自然语言处理领域的顶级国际会议，由国际计算语言学协会组织，每年举办一次。一直以来，ACL在NLP领域的学术影响力都位列第一，它也是CCF-A类推荐会议。今年的ACL大会已是第62届，接收了400余篇NLP领域的前沿
2024-07-292024年7月29日Arxiv语言模型相关论文
在将差分隐私应用于文本时，粒度是至关重要的：神经机器翻译的研究。原标题:Granularityiscrucialwhenapplyingdifferentialprivacytotext:Aninvestigationforneuralmachinetranslation作者:DoanNamLongVu,TimourIgamberdiev,IvanHabernal机构:德国
2024-07-19Arena Learning: 构建大语言模型的数据飞轮
大语言模型(LLMs)正在快速发展,但如何有效评估和持续改进这些模型仍面临巨大挑战。本文提出了一种名为ArenaLearning的创新方法,通过模拟聊天机器人竞技场来构建高效的数据飞轮,从而实现LLMs的持续优化。让我们深入了解这种方法的核心思想和关键技术。1.背景与挑战近年
2024-07-11AI推介-大语言模型LLMs之RAG（检索增强生成）论文速览（arXiv方向）：2024.06.20-2024.07.01
文章目录～1.AStudyonEffectofReferenceKnowledgeChoiceinGeneratingTechnicalContentRelevanttoSAPPhIREModelUsingLargeLanguageModel2.FromRAGtoRICHES:RetrievalInterlacedwithSequenceGeneration3.SK-VQA:SyntheticKnowledgeGeneration
2024-07-10KAN: Kolmogorov-Arnold Networks (arXiv 2024)
KAN官方代码库：https://github.com/KindXiaoming/pykan官方tutorials：https://kindxiaoming.github.io/pykan/目录AbstractKolmogorov–ArnoldNetworks(KAN)Kolmogorov-ArnoldRepresentationtheoremKANarchitectureImplementationdetailsKAN’sApproximation
2024-07-10CvT：微软提出结合CNN的ViT架构 | 2021 arxiv
CvT将Transformer与CNN在图像识别任务中的优势相结合，从CNN中借鉴了多阶段的层级结构设计，同时引入了ConvolutionalTokenEmbedding和ConvolutionalProjection操作增强局部建模能力，在保持计算效率的同时实现了卓越的性能。此外，由于卷积的引入增强了局部上下文建模能力，CvT不再需要