slm
  • 2024-09-2321 种 AI 小模型
    近年来,人工智能取得了显著的进步,像GPT-4这样的大型语言模型上了头条。然而,一个新的趋势正在出现:小型语言模型(smalllanguagemodels,SLMs)。这些模型虽然更紧凑和高效,但提供了重要的功能,并且越来越多地被各行业采用。以下是21种正在塑造AI未来的小型语言模型。1.DistilB
  • 2024-09-22小语言模型:为业务需求定制AI
    规模越大并不总是越好:从llm到slm的转变当我们想到AI时,经常会想到像GPT-4或BERT这样的大型模型。这些巨人被称为大型语言模型(LargeLanguageModels,llm),由于其庞大的参数大小和广泛的训练数据,它们具有令人印象深刻的能力。然而,并不总是越大越好。llm可能成本高昂,需
  • 2024-09-04支持大模型的小模型
    https://www.arxiv.org/pdf/2408.12748 (SLMMeetsLLM:BalancingLatency,InterpretabilityandConsistencyinHallucinationDetection)平衡会话AI幻觉检测中的延迟、可解释性和一致性介绍大型语言模型(llm)在实时任务(如同步的会话ui)中与延迟作斗争。当额外的开
  • 2024-07-12王牌站士Ⅱ--针对 LLM/SLM 的高级 RAG
    前言检索增强生成(RAG)已成为一种增强语言模型能力的强大技术。通过检索和调整外部知识,RAG可让模型生成更准确、更相关、更全面的文本。RAG架构主要有三种类型:简单型、模块化和高级RAG:NaiveRAG采用GPT-3这样的单片模型,并简单地根据检索到的证据段落对其进行条件化
  • 2024-04-03SMILETrack——ByteTrack与外观特征的融合实现高效的多目标跟踪方法
    概述ByteTrack在多目标跟踪领域取得了显著成就,但依赖运动信息(IoU)进行关联的机制存在局限性。为了弥补这一不足,SMILETrack提出一种集成了外观特征的最先进的多目标跟踪(SoTA)模型。在多目标跟踪的两大类别中,单独检测与嵌入模型(SDE)和联合检测与嵌入模型(JDE)各有优势与挑战。SDE
  • 2024-02-15[SLM]我的世界联机指南
    基于PCL2β的联机原理:将房主的主机映射为公网的MC服务器房主,加入者作为客户加入PCLβ基于Windows10系统房主的准备工作MC本体(forge)必须和加入者一样内网穿透前往量子互联等内网穿透网站注册账号,下载客户端按照操作提示获取token进入MC单人游戏,开启对局域网开放配置穿
  • 2024-02-03WIP: SLM-DB:Single-Level Key-Value Store with Persistent Memory
    论文原文:https://www.usenix.org/system/files/fast19-kaiyrakhmet.pdf摘要:本文调查了如何利用新出现的可按照字节寻址的持久化内存(PersistentMemory)来增强KV存储的性能。我们充分利用PM,提出了一种新型的KV存储,SLM-DB,这种存储同时利用到了B+树索引和LSM-tree的优点。我们提出