slm

2024-09-28北邮&剑桥最新SLM（小语言模型）研究综述
今天介绍的这篇文章是关于小型语言模型（SmallLanguageModels,SLMs）的研究综述，作者团队来自北京邮电大学、鹏城实验室、HelixonResearch、剑桥大学等机构。语言模型的发展目前呈现出分歧，一方面是追求人工通用智能的LLMs，在训练和推理双scalinglaw的指引下不断加大计算量；另一
2024-09-28小模型(SLM)的效率、性能和潜力
关于小语言模型小语言模型(slm)是为在桌面、智能手机和可穿戴设备上进行资源高效部署而设计的。其目标是使先进的机器智能能够为每个人所使用和负担得起，就像人类认知的普遍性一样。小语言模型(slm)已经广泛集成到商业设备中。例如，最新的谷歌和三星智能手机内置了大型语言模型(
2024-09-28小模型在LLM时代的作用
最近的一项研究广泛探讨了小语言模型(slm)在现代AI中的作用。该研究对slm进行了全面分析，重点关注其功能、应用和潜在优势，特别是与大型模型相比。本研究强调了slm在需要效率和可解释性的领域中的重要性，同时也讨论了它们在大型模型可能不实用的特定任务中的相关性。最近的一
2024-09-2321 种 AI 小模型
近年来，人工智能取得了显著的进步，像GPT-4这样的大型语言模型上了头条。然而，一个新的趋势正在出现:小型语言模型(smalllanguagemodels,SLMs)。这些模型虽然更紧凑和高效，但提供了重要的功能，并且越来越多地被各行业采用。以下是21种正在塑造AI未来的小型语言模型。1.DistilB
2024-09-22小语言模型:为业务需求定制AI
规模越大并不总是越好:从llm到slm的转变当我们想到AI时，经常会想到像GPT-4或BERT这样的大型模型。这些巨人被称为大型语言模型(LargeLanguageModels,llm)，由于其庞大的参数大小和广泛的训练数据，它们具有令人印象深刻的能力。然而，并不总是越大越好。llm可能成本高昂，需
2024-09-04支持大模型的小模型
https://www.arxiv.org/pdf/2408.12748 （SLMMeetsLLM:BalancingLatency,InterpretabilityandConsistencyinHallucinationDetection）平衡会话AI幻觉检测中的延迟、可解释性和一致性介绍大型语言模型(llm)在实时任务(如同步的会话ui)中与延迟作斗争。当额外的开
2024-07-12王牌站士Ⅱ--针对 LLM/SLM 的高级 RAG
前言检索增强生成(RAG)已成为一种增强语言模型能力的强大技术。通过检索和调整外部知识，RAG可让模型生成更准确、更相关、更全面的文本。RAG架构主要有三种类型：简单型、模块化和高级RAG：NaiveRAG采用GPT-3这样的单片模型，并简单地根据检索到的证据段落对其进行条件化
2024-04-03SMILETrack——ByteTrack与外观特征的融合实现高效的多目标跟踪方法
概述ByteTrack在多目标跟踪领域取得了显著成就，但依赖运动信息（IoU）进行关联的机制存在局限性。为了弥补这一不足，SMILETrack提出一种集成了外观特征的最先进的多目标跟踪（SoTA）模型。在多目标跟踪的两大类别中，单独检测与嵌入模型（SDE）和联合检测与嵌入模型（JDE）各有优势与挑战。SDE
2024-02-15[SLM]我的世界联机指南
基于PCL2β的联机原理：将房主的主机映射为公网的MC服务器房主，加入者作为客户加入PCLβ基于Windows10系统房主的准备工作MC本体（forge）必须和加入者一样内网穿透前往量子互联等内网穿透网站注册账号，下载客户端按照操作提示获取token进入MC单人游戏，开启对局域网开放配置穿
2024-02-03WIP: SLM-DB:Single-Level Key-Value Store with Persistent Memory
论文原文：https://www.usenix.org/system/files/fast19-kaiyrakhmet.pdf摘要：本文调查了如何利用新出现的可按照字节寻址的持久化内存（PersistentMemory）来增强KV存储的性能。我们充分利用PM，提出了一种新型的KV存储，SLM-DB，这种存储同时利用到了B+树索引和LSM-tree的优点。我们提出