SLM
  • 2024-12-13A Comprehensive Survey of Small Language Models in the Era of Large Language Models
    本文是LLM系列文章,针对《AComprehensiveSurveyofSmallLanguageModelsintheEraofLargeLanguageModels:Techniques,Enhancements,Applications,CollaborationwithLLMs,andTrustworthiness》的翻译。大模型时代小模型的全面综述:技术、增强、应用、与LL
  • 2024-09-28北邮&剑桥最新SLM(小语言模型)研究综述
    今天介绍的这篇文章是关于小型语言模型(SmallLanguageModels,SLMs)的研究综述,作者团队来自北京邮电大学、鹏城实验室、HelixonResearch、剑桥大学等机构。语言模型的发展目前呈现出分歧,一方面是追求人工通用智能的LLMs,在训练和推理双scalinglaw的指引下不断加大计算量;另一
  • 2024-09-28小模型在LLM时代的作用
    最近的一项研究广泛探讨了小语言模型(slm)在现代AI中的作用。该研究对slm进行了全面分析,重点关注其功能、应用和潜在优势,特别是与大型模型相比。本研究强调了slm在需要效率和可解释性的领域中的重要性,同时也讨论了它们在大型模型可能不实用的特定任务中的相关性。最近的一
  • 2024-09-22小语言模型:为业务需求定制AI
    规模越大并不总是越好:从llm到slm的转变当我们想到AI时,经常会想到像GPT-4或BERT这样的大型模型。这些巨人被称为大型语言模型(LargeLanguageModels,llm),由于其庞大的参数大小和广泛的训练数据,它们具有令人印象深刻的能力。然而,并不总是越大越好。llm可能成本高昂,需
  • 2024-07-12王牌站士Ⅱ--针对 LLM/SLM 的高级 RAG
    前言检索增强生成(RAG)已成为一种增强语言模型能力的强大技术。通过检索和调整外部知识,RAG可让模型生成更准确、更相关、更全面的文本。RAG架构主要有三种类型:简单型、模块化和高级RAG:NaiveRAG采用GPT-3这样的单片模型,并简单地根据检索到的证据段落对其进行条件化
  • 2024-04-03SMILETrack——ByteTrack与外观特征的融合实现高效的多目标跟踪方法
    概述ByteTrack在多目标跟踪领域取得了显著成就,但依赖运动信息(IoU)进行关联的机制存在局限性。为了弥补这一不足,SMILETrack提出一种集成了外观特征的最先进的多目标跟踪(SoTA)模型。在多目标跟踪的两大类别中,单独检测与嵌入模型(SDE)和联合检测与嵌入模型(JDE)各有优势与挑战。SDE
  • 2024-02-15[SLM]我的世界联机指南
    基于PCL2β的联机原理:将房主的主机映射为公网的MC服务器房主,加入者作为客户加入PCLβ基于Windows10系统房主的准备工作MC本体(forge)必须和加入者一样内网穿透前往量子互联等内网穿透网站注册账号,下载客户端按照操作提示获取token进入MC单人游戏,开启对局域网开放配置穿
  • 2024-02-03WIP: SLM-DB:Single-Level Key-Value Store with Persistent Memory
    论文原文:https://www.usenix.org/system/files/fast19-kaiyrakhmet.pdf摘要:本文调查了如何利用新出现的可按照字节寻址的持久化内存(PersistentMemory)来增强KV存储的性能。我们充分利用PM,提出了一种新型的KV存储,SLM-DB,这种存储同时利用到了B+树索引和LSM-tree的优点。我们提出