shot

2025-01-16上海人工智能实验室：书生·浦语大模型升级
上海人工智能实验室宣布其书生大模型迎来了重要版本升级，推出了书生・浦语3.0（InternLM3）。据实验室介绍，新的版本通过精炼的数据框架，显著提升了数据使用效率，从而实现了思维密度的提升。此次升级的InternLM3-8B-Instruct模型仅使用4T的数据进行训练，官方表示其综合性能超过
2024-12-31【超详细】ChatGPT原理介绍
文章目录前言一、大语言模型进化树1.1Encoder-only模型1.2Encoder-Decoder模型1.3Decoder-only模型1.4GPT系列模型的独特定位二、GPT-1：生成式预训练的开端2.1背景与创新2.2技术特点（1）模型架构（2）单向语言模型（3）两阶段训练①无监督预训练②有监督微调2.3模型特点
2024-12-31使用few-shot Prompt template让大模型更懂你
在本教程中，我们将学习如何创建一个使用少量示例的提示模板(Prompttemplate)。少量示例的提示模板可以从一组示例(examples)或一个示例选择器(Exampleselector)对象构建。使用示例集首先，创建一个少量示例的列表。每个示例应该是一个字典，键是输入变量，值是这些输入变量的值。
2024-12-29【论文带读】LLMs as Zero-shot Graph Learners: Alignment of GNN Representations with LLM Token Embeddings
目录：TEA-GLM(TokenEmbedding-AlignedGraphLanguageModel）（NeurlPS2024）1背景介绍1.1GNN的局限性1.2LLM解决Graph问题的方案1.3LLMs与GNN结合中的关键问题1.4文章贡献2方法2.1模型框架2.2GNN的对比学习2.2.1GNN的实例对比学习2.2.2GNN的特征对比学习2.3
2024-12-24Java多态--上转型对象
Java多态概念实现方式上转型对象概念多态：面向对象的三大特性之一多态一句话概括就是，一个类下面的不同子类的实例，对同一个参数输入，得到不同的输出举例：动物类下的小猫、小狗，两只动物分别拍一下，小猫输出“喵喵喵”，小狗输出“汪汪汪”。实现方式多态的方式：类的继承，方
2024-12-17NX-AI xLSTM-7b 的崛起：大型语言模型的革命性变革
奥地利研究公司NX-AI最近发布了突破性的xLSTM-7b模型，展示了xLSTM架构的巨大潜力。即使不进行微调，这个预训练模型也能迅速跃升为7B模型联盟中的佼佼者。在下一个单词预测任务和大规模多任务语言理解（MMLU）等标准基准测试中，它的卓越性能显而易见。速度与效率的力量xLS
2024-12-16CVPR离群值检测论文ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection
标题期刊年份关键词项目地址ID-likePromptLearningforFew-ShotOut-of-DistributionDetectionCVPR2024OOD检测、Few-Shot学习、CLIP、ID-like样本项目地址概览今天我们来分享一篇来自CVPR2024的论文：ID-likePromptLearningforFew-ShotOut-of-Di
2024-12-13SparseGPT: Massive Language Models Can be Accurately Pruned in One-Shot
本文是LLM系列文章，针对《SparseGPT:MassiveLanguageModelsCanbeAccuratelyPrunedinOne-Shot》的翻译。SparseGPT：大规模语言模型可以一次性精确修剪摘要1引言2背景3SparseGPT算法4实验5相关工作6讨论摘要我们首次证明，大规模生成预训练Transfo
2024-12-12[论文阅读] Radical Analysis Network for Zero-Shot Learning in Printed Chinese Character Recognition
Pretitle:RadicalAnalysisNetworkforZero-ShotLearninginPrintedChineseCharacterRecognitionaccepted:ICME2018paper:https://arxiv.org/abs/1711.01889code:https://github.com/JianshuZhang/RAN(onlyIDSdictionary)ref:RANforPrintedChineseCh
2024-12-11ProCom: A Few-shot Targeted Community Detection Algorithm翻译
ProCom:AFew-shotTargetedCommunityDetectionAlgorithm翻译ProCom:一种少样本目标社区检测算法XixiWu；KaiyuXiongKDD2024复旦大学YunXiong通信作者社区检测方法标注数据较少，论文通过预训练提示学习的方法解决该问题。3方法在本节中，将介绍提议的ProCo
2024-12-09从代码解析Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text
本文是对一篇ICML2024文章SpottingLLMsWithBinoculars:Zero-ShotDetectionofMachine-GeneratedText进行计算过程的讲解该文章主要提供了一种zero-shot的AIGC文本检测方法，在文章中所说，使用较少的计算量就起到了不错的效果主要计算过程如下图所示：perplexityperp
2024-12-09Langchain Chain Agent - Zero-shot ReAct
LangchainChainAgent-Zero-shotReActhttps://zhuanlan.zhihu.com/p/645216766 "ReAct"一词源于ReAct:SynergizingReasoningandActinginLanguageModels(react-lm.github.io)，它由单词“Reason”和“Act”组合而成，这两个词代表了两类不同的LLM应用： 1.“Reas
2024-12-05CLIP-LoRA: Low-Rank Few-Shot Adaptation of Vision-Language Models
文章汇总当前的问题当前的视觉语言模型(VLMs)小样本的研究主要在提示学习和适配器上，这通常依赖于繁重的训练程序(提示学习)和/或精心选择的任务特定超参数(适配器)，这可能会阻碍其适用性。作者在VLMs的小样本学习中引入了低秩自适应(LoRA)，并与当前最先进的基于提示和基于适
2024-11-27SSD（Single Shot MultiBox Detector）目标检测
**SSD（SingleShotMultiBoxDetector）**是一种广泛使用的目标检测算法，它能够在单个前向传递过程中同时进行目标的分类和定位，从而实现实时、高效的目标检测。SSD是一种基于卷积神经网络（CNN）的目标检测方法，它的创新点在于通过多个尺度的特征图来检测目标，这使得SSD在速度和精度之
2024-12-06爬虫 - xpath
xpath常用规则|表达式|功能||-----------|---------------------------------------------||nodename |选取此节点的所有子节点||/ |从根节点选取（取子节点）||// |从匹配的节
2024-12-04git学习
分支（branch）查看当前所在分支gitbranch查看文件状态（status）查看文件状态gitstatus#代表已修改，但未提交（远程仓库上有该文件）Changesnotstagedforcommit#代表新增的文件（远程仓库上没有该文件）Untrackedfiles切换分支（checkout）如果pro分支已经存在且你需要切换到
2024-12-04Jenkins介绍和安装
目录1.jenkins介绍历史与发展：主要功能：架构与组件：社区支持与活跃度：安装与启动：Jenkins的特征：工作流程：Jenkins安装和持续集成环境配置2jenkins安装1.下载jdk172上传至/opt/java下3解压4配置环境变量5刷新环境变量2.安装jenkins下载war包 [根据jdk选择版本]
2024-12-04rcu的实例、注意事项及原理讲解
一、背景在之前的内核模块里获取当前进程和父进程的cmdline的方法及注意事项，涉及父子进程管理，和rcu的初步介绍-CSDN博客里我们讲到了如何在rcu锁保护的情况下获取一个进程的父进程的pid和comm，另外也贴了一张浓缩了rcu相关概念精华的整理的思维导图。这篇博客里，我们先不涉及rcu
2024-11-29AppContext GetData SetData的使用
AppContext.GetData方法在.NET中用于获取应用程序上下文相关的数据。以下是关于它的详细使用介绍：1.所在命名空间及相关背景AppContext.GetData方法位于System.AppContext命名空间下。它提供了一种机制，允许在应用程序的不同部分（比如不同的程序集或者类库之间）以一种标准的方
2024-11-25如何开通向量检索服务？
本文主要介绍如何开通向量检索服务。**前提条件**完成注册阿里云账号，如未注册，请单击注册阿里云账号注册阿里云账号进行注册。完成个人或企业实名认证，如未认证，请单击实名认证账号认证进行认证。操作步骤登录阿里云官网阿里云官网。进入向量检索服务产品详情页向量
2024-10-13Splatt3R: Zero-shot Gaussian Splatting from Uncalibrated Image Pairs 论文解读
目录一、概述二、相关工作1、近期工作2、DUSt3R3、MASt3R三、Splatt3R1、MASt3R的Backbone 2、高斯预测头3、点云与3D高斯参数结合4、3D高斯渲染5、损失函数四、实验 1、对比实验2、消融实验一、概述该论文首次提出了一种无需任何相机参数和深
2024-09-20Phi-2: The surprising power of small language models
Phi-2:Thesurprisingpowerofsmalllanguagemodelshttps://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/ Phi-2EvaluationBelow,wesummarizePhi-2performanceonacademicbenchmarkscomparedtopopularla