• 2024-09-191-bit 大模型(LLM)时代的到来
     人工智能咨询培训老师叶梓转载标明出处模型规模的扩大带来了部署上的挑战,并因其高能耗引对环境和经济产生了影响。为了应对这些挑战,研究者们开始探索使用低位宽量化技术来降低模型的推理成本,同时保持模型性能。微软公司和中国科学院大学的研究团队提出了一种名为BitNetb1.
  • 2024-09-10个性化推荐系统
    博主介绍:✌专注于VUE,小程序,安卓,Java,python,物联网专业,有17年开发经验,长年从事毕业指导,项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题,我会尽力帮助你。研究的背景:在互联网和数字化时代,个性化推荐系统已成为电商、社交媒体、音乐和视频等领域的
  • 2024-08-31计算机组成原理教学小程序计算机毕设
    博主介绍:✌专注于VUE,小程序,安卓,Java,python,物联网专业,有16年开发经验,长年从事毕业指导,项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题,我会尽力帮助你。研究的背景:计算机组成原理教学小程序的研究背景主要源于计算机科学教育中计算机组成原理课
  • 2024-08-28LongAlign:大模型长文本处理能力提升之道
     人工智能咨询培训老师叶梓转载标明出处大模型(LLMs)在处理长文本时,需要在输入序列上进行指令微调(instructionfinetuning),以确保它们能够有效地处理长文本。现有的方法主要集中在上下文扩展(contextextension),即通过位置编码扩展和对长文本的持续训练来提升模型的上下文长度。
  • 2024-08-21支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
    点击访问我的技术博客https://ai.weoknow.comhttps://ai.weoknow.com现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更
  • 2024-08-20交互式智能代理基础模型:迈向通用人工智能的新途径
     人工智能咨询培训老师叶梓转载标明出处传统的AI系统主要集中在收集有用的感官信息上,而新一代的通用AI系统不仅要能够理解环境,还要能够以有意义的方式与之交互。交互式智能代理基础模型代表了开发具有跨任务和数据模态单一神经模型训练能力的通用AI系统的重要一步,这种方法
  • 2024-07-13AutoKG:为语言模型打造高效自动化知识图谱
    在人工智能领域,大型语言模型(LLMs)如BERT、RoBERTa、T5和PaLM等,以其在自然语言处理(NLP)任务中的卓越性能而著称。然而,这些模型在提供信息时可能会产生“幻觉”,即提供看似合理但与事实不符的预测。同时它们的“黑箱”特性也影响了模型的可解释性和准确性。为了解决这些问题,研究者们
  • 2024-07-01自动驾驶新篇章:基于大模型的协作驾驶与终身学习框架
    自动驾驶技术受到了学术界和工业界的广泛关注,但当前的自动驾驶系统大多基于数据驱动的方法,存在可解释性、泛化能力和持续学习能力方面的显著不足。而且单车自动驾驶系统缺乏与其他车辆协作和协商的能力,这对于提高驾驶安全性和效率至关重要。交通路口的场景:其中车1(veh1)和
  • 2024-06-21274. H 指数
    给你一个整数数组citations,其中citations[i]表示研究者的第i篇论文被引用的次数。计算并返回该研究者的h指数。根据维基百科上h指数的定义:h代表“高引用次数”,一名科研人员的h指数是指他(她)至少发表了h篇论文,并且至少有h篇论文被引用次数大于等于h。如果h
  • 2024-06-18目标检测——室内服务机器人LifelongSLAM数据集
    引言亲爱的读者们,您是否在寻找某个特定的数据集,用于研究或项目实践?欢迎您在评论区留言,或者通过公众号私信告诉我,您想要的数据集的类型主题。小编会竭尽全力为您寻找,并在找到后第一时间与您分享。OpenLORIS-SceneDataset推动室内服务机器人定位技术的新里程碑随着科技
  • 2024-05-31大模型之知识库构建
    在学术研究领域,时间是非常宝贵的资源。而大模型的应用,能够显著提升研究效率,帮助研究者节省宝贵的时间。通过大模型快速整理和分析论文,可以迅速提炼出论文的核心知识,这在学术应用中是一种非常高效的手段。首先,大模型能够处理和分析大量的文献资料。研究者可以利用这一优势,快速获取
  • 2024-05-27CVPR 2024 | 谷歌提出OmniGlue:特征匹配新工作
    前言 第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享,若侵权请联系删除CV方向的准研究生们,未来三年如何度过?招聘高光谱图像、语
  • 2023-12-01简化版Transformer来了,网友:年度论文
    前言 从大模型的根源开始优化。本文转载自机器之心仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文
  • 2023-11-24海量数据处理的强大模型
    随着科学研究的不断深入,数据驱动的决策在各个领域中的应用越来越广泛。在医学、生物学、环境科学、天文学等领域中,研究者们正在利用海量数据探索未知的领域和现象。然而,如何有效地处理这些数据并从中提取有价值的信息,一直是科研人员面临的一个难题。为此,一种名为BigScienceBloom模
  • 2023-11-19全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50%
    前言 本文介绍了一项近似注意力机制新研究,耶鲁大学、谷歌研究院等机构提出了HyperAttention,使ChatGLM2在32k上下文长度上的推理时间快了50%。本文转载自机器之心仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典
  • 2023-08-21BERT模型的历史
    BERT(BidirectionalEncoderRepresentationsfromTransformers)是自然语言处理领域的一个重要里程碑。以下是BERT的发展历史概述:背景:在BERT之前,研究者们已经开始认识到预训练模型在多种任务中的潜力。例如,UlmFit、ELMo和OpenAI的GPT都是使用大型文本数据进行预训练,然后微调到
  • 2023-07-19Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强
    前言 Transformer的训练并行性是以低效推理为代价的:每一步的复杂度为O(N)且键值缓存受内存限制,让Transformer不适合部署。不断增长的序列长度会增加GPU内存消耗和延迟,并降低推理速度。研究者们一直在努力开发下一代架构,希望保留训练并行性和Transformer的性能,同时实现
  • 2023-07-06盘点!国内隐私计算学者在 USENIX Security 2023 顶会上的成果
    USENIXSecurity是国际公认的网络安全与隐私计算领域的四大顶级学术会议之一、CCF(中国计算机学会)推荐的A类会议。每年的USENIXSecurity研讨会都会汇集大量研究人员、从业人员、系统管理员、系统程序员和其他对计算机系统、网络安全和隐私最新进展感兴趣的人。近日,在
  • 2023-05-28首个大规模使用工具的大模型来了:伯克利发布Gorilla
    前言 OneAItorulethemall.本文转载自机器之心欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线!!大型语言模型
  • 2023-05-24Meta发布650亿参数语言模型LIMA,媲美GPT-4、Bard
    前言 作为首个全面介绍基于SAM基础模型进展的研究,本文聚焦于SAM在各种任务和数据类型上的应用,并讨论了其历史发展、近期进展,以及对广泛应用的深远影响。本文转载自机器之心欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
  • 2023-05-07斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
    前言 大模型出现后,涌现这一术语开始流行起来,通常表述为在小规模模型中不存在,但在大规模模型中存在的能力。但斯坦福大学的研究者对LLM拥有涌现能力的说法提出了质疑,他们认为是人为选择度量方式的结果。本文转载自机器之心欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结
  • 2023-03-17Opensim下载中在SimTK中的注册问题
    中间有一项是填写oricd.要去官网注册一下,相当于学术身份证。ORCID(Open Researcher and Contributor ID),即开放研究者与贡献者身份识别码。 ORCID会保留特定的ISNI识别
  • 2023-03-01AI自动生成prompt媲美人类,网友:工程师刚被聘用又要淘汰了
    机器之心报道机器之心编辑部来自多伦多大学、滑铁卢大学等机构的研究者受promptengineering的启发,提出一种使用大型语言模型自动生成和选择指令的新算法,在24项任务
  • 2022-12-20扩散模型背后数学太难了,啃不动?谷歌用统一视角讲明白了
    视学算法报道机器之心编辑部扩散模型背后的数学可是难倒了一批人。最近一段时间,AI作画可谓是火的一塌糊涂。在你惊叹AI绘画能力的同时,可能还不知道的是,扩散模型在其中起
  • 2022-10-18又更新!CBNetV2:复合主干网络的目标检测架构(附源代码)
    计算机视觉研究院专栏作者:Edison_G现代性能最佳的目标检测器在很大程度上依赖于主干网络,其进步通过探索更有效的网络结构带来一致的性能提升。然而,设计或搜索新的主干并在Im