SLM

2024-12-13A Comprehensive Survey of Small Language Models in the Era of Large Language Models
本文是LLM系列文章，针对《AComprehensiveSurveyofSmallLanguageModelsintheEraofLargeLanguageModels:Techniques,Enhancements,Applications,CollaborationwithLLMs,andTrustworthiness》的翻译。大模型时代小模型的全面综述：技术、增强、应用、与LL
2024-09-28北邮&剑桥最新SLM（小语言模型）研究综述
今天介绍的这篇文章是关于小型语言模型（SmallLanguageModels,SLMs）的研究综述，作者团队来自北京邮电大学、鹏城实验室、HelixonResearch、剑桥大学等机构。语言模型的发展目前呈现出分歧，一方面是追求人工通用智能的LLMs，在训练和推理双scalinglaw的指引下不断加大计算量；另一
2024-09-28小模型在LLM时代的作用
最近的一项研究广泛探讨了小语言模型(slm)在现代AI中的作用。该研究对slm进行了全面分析，重点关注其功能、应用和潜在优势，特别是与大型模型相比。本研究强调了slm在需要效率和可解释性的领域中的重要性，同时也讨论了它们在大型模型可能不实用的特定任务中的相关性。最近的一
2024-09-22小语言模型:为业务需求定制AI
规模越大并不总是越好:从llm到slm的转变当我们想到AI时，经常会想到像GPT-4或BERT这样的大型模型。这些巨人被称为大型语言模型(LargeLanguageModels,llm)，由于其庞大的参数大小和广泛的训练数据，它们具有令人印象深刻的能力。然而，并不总是越大越好。llm可能成本高昂，需
2024-07-12王牌站士Ⅱ--针对 LLM/SLM 的高级 RAG
前言检索增强生成(RAG)已成为一种增强语言模型能力的强大技术。通过检索和调整外部知识，RAG可让模型生成更准确、更相关、更全面的文本。RAG架构主要有三种类型：简单型、模块化和高级RAG：NaiveRAG采用GPT-3这样的单片模型，并简单地根据检索到的证据段落对其进行条件化
2024-04-03SMILETrack——ByteTrack与外观特征的融合实现高效的多目标跟踪方法
概述ByteTrack在多目标跟踪领域取得了显著成就，但依赖运动信息（IoU）进行关联的机制存在局限性。为了弥补这一不足，SMILETrack提出一种集成了外观特征的最先进的多目标跟踪（SoTA）模型。在多目标跟踪的两大类别中，单独检测与嵌入模型（SDE）和联合检测与嵌入模型（JDE）各有优势与挑战。SDE
2024-02-15[SLM]我的世界联机指南
基于PCL2β的联机原理：将房主的主机映射为公网的MC服务器房主，加入者作为客户加入PCLβ基于Windows10系统房主的准备工作MC本体（forge）必须和加入者一样内网穿透前往量子互联等内网穿透网站注册账号，下载客户端按照操作提示获取token进入MC单人游戏，开启对局域网开放配置穿
2024-02-03WIP: SLM-DB:Single-Level Key-Value Store with Persistent Memory
论文原文：https://www.usenix.org/system/files/fast19-kaiyrakhmet.pdf摘要：本文调查了如何利用新出现的可按照字节寻址的持久化内存（PersistentMemory）来增强KV存储的性能。我们充分利用PM，提出了一种新型的KV存储，SLM-DB，这种存储同时利用到了B+树索引和LSM-tree的优点。我们提出