inference

2025-01-06什么是 Inference Scaling Laws?为什么说 Inference Scaling 是未来AGI发展的方向？
OpenAI近期发布的O1模型无疑在AI领域掀起了一股新的浪潮。不同于以往专注于预训练规模的竞赛，O1模型似乎预示着一个新时代的到来：推理为王。这背后的核心理念，正是近年来逐渐受到重视的InferenceScalingLaws(推理扩展定律)。传统的预训练扩展定律告诉我们，模型性能随着
2025-01-055.3 Type inference 类型推断
https://lalrpop.github.io/lalrpop/tutorial/003_type_inference.htmlOK,nowthatweunderstandthecalculator1example,let'slookatsomeoftheshorthandsthatLALRPOPofferstomakeitmoreconcise.Thiscodeisfoundinthecalculator2demo.GPT
2024-12-22强化学习SQL算法（soft q learning）—— SVGD的实现（Stein Variational Gradient Descent: A General Purpo
代码实现地址：https://openi.pcl.ac.cn/devilmaycry812839668/softlearning/src/branch/master/softlearning/misc/kernel.pyfromdistutils.versionimportLooseVersionimportnumpyasnpimporttensorflowastfdefadaptive_isotropic_gaussian_kernel(xs,ys,h_min
2024-12-14An Active Inference Strategy for Prompting Reliable Responses from Large Language Models in Medical
本文是LLM系列文章，针对《AnActiveInferenceStrategyforPromptingReliableResponsesfromLargeLanguageModelsinMedicalPractice》的翻译。在医疗实践中促进大型语言模型做出可靠响应的主动推理策略摘要1引言2方式3方法4结果5讨论摘要人工
2024-12-08怎样把单位cm转换成px呢（在打印时有时会用到）？
厘米(cm)到像素(px)的转换取决于DPI（每英寸点数）或PPI（每英寸像素数）。没有固定的转换率，因为像素不是绝对的物理单位。在网页显示中，通常假设DPI为96。然而，这只是一个约定，实际的DPI取决于用户的屏幕和操作系统设置。对于打印，DPI通常更高，例如300DPI或600DPI，以确保
2024-12-07你前面一位面试者是清华的，为什么我要录取你。。。
最近看到一个挺有意思的面试问题，面试官问应聘者：“你前面那位面试者是清华毕业的，为什么我要录取你而不是他？”这种问题听着有点挑衅意味，面试者也差点失控了。不过，我觉得这其实是个考察应聘者情绪管理和临场反应能力的好问题。要说面对这种问题，保持冷静、理智地回应，真的是挺重
2024-09-28Explicit Inductive Inference using Large Language Models
本文是LLM系列文章，针对《ExplicitInductiveInferenceusingLargeLanguageModels》的翻译。使用大型语言模型进行显式归纳推理摘要1引言2相关工作3显示归纳推理4实验设置5结果和讨论6结论局限性摘要据报道，大型语言模型(LLM)在推理任务上存在不
2024-09-25如何在生成式AI里使用 Ray Data 进行大规模 RAG 应用的 Embedding Inference
检索增强生成(RAG，即RetrievalAugmentedGeneration)是企业级生成式AI（GenAI）应用的热门案例之一。多数RAG教程演示了如何利用OpenAIAPI结合Embedding模型和大语言模型（LLM）来进行推理（Inference）。然而，在开发过程中，如果能使用开源工具，就可以免去访问自己数据的费用，同时也能加
2024-09-06SciTech-Mathmatics-Probability+Statistics: Statistical Inference统计推断- Estimation估计 + Testing Hypothe
轻松学统计:https://zh-cn.statisticseasily.com/词汇表/什么是统计推断/StatisticalInference:SI(统计推断)的类型SI(统计推断)主要有两种类型：Estimation:根据样本数据确定总体的特征;PointEstimation:提供总体参数的单一值估计;ConfidenceInterval:提供
2024-08-10推理延迟：解决PyTorch模型Inference阶段的RuntimeError ⏳⚡
推理延迟：解决PyTorch模型Inference阶段的RuntimeError⏳⚡推理延迟：解决PyTorch模型Inference阶段的RuntimeError⏳⚡摘要引言正文内容什么是RuntimeError？⏳RuntimeError的常见成因⚠️数据格式不一致内存不足模型参数不匹配解决RuntimeError的方法
2024-08-07pytorch和deep learning技巧和bug解决方法短篇收集
有一些几句话就可以说明白的观点或者解决的的问题，小虎单独收集到这里。torch.hub.loadhowdoesitwork下载预训练模型再载入，用程序下载链接可能失效。model=torch.hub.load('ultralytics/yolov5','yolov5s')model=torch.hub.load('ultralytics/yolov3','yolov3
2024-07-27llama-agentic-system
文章目录一、关于llama-agentic-system二、LLama代理系统安装和设置指南1、创建Conda环境2、运行FP83、作为包安装4、测试安装5、下载检查点（或使用现有模型）6、配置推理服务器配置7、运行推理服务器8、配置代理系统9、为工具添加API密钥10、启动应用程序并与服务器交互11
2024-07-24LMDeploy
LMDeployhttps://lmdeploy.readthedocs.io/en/latest/index.htmlLMDeployhasthefollowingcorefeatures:EfficientInference:LMDeploydeliversupto1.8xhigherrequestthroughputthanvLLM,byintroducingkeyfeatureslikepersistentbatch(a.k.a.cont
2024-07-08Open-Sora1.2环境搭建&推理测试
引子前阵子写了一篇Open-Sora1.0环境搭建&推理测试（Open-Sora1.0环境搭建&推理测试_自己搭建sora服务-CSDN博客，感兴趣的童鞋，请移步）。Open-Sora1.1发布的时候，撇了一眼新闻。后面一转头，忘记这个事情了。无意间翻到其开源网站上，发现2024.6.17发布1.2版本了，那还是过来看看有什么长足
2024-07-07（一）变分推断与变分自编码器
本文主要介绍变分自编码器(VariationalAuto-Encoder,VAE)及其推导过程，但变分自编码器涉及一些概率统计的基础知识，因此为了更好地理解变分自编码器，首先介绍变分推断(VariationalInference)与期望最大化(Expectation-Maximization,EM)算法，进而介绍变分自编码器，并给出另一种理
2024-06-07【因果推断】【Introduction to Causal Inference from a Machine Learning Perspective】从机器学习的角度介绍因果推断第一章
第一章动机：为什么你可能关心1.1辛普森悖论考虑一个纯粹假设的未来，有一种被称为COVID-27的新疾病在人类中流行。在这个纯粹假设的未来，有两种治疗方法已经被开发出来：治疗A和治疗B。治疗B比治疗A更稀缺，因此目前接受治疗A和治疗B的比例大致为73%/27%。在一个只关心最大限度
2024-06-05成员推理攻击（Membership Inference Attacks Against Machine Learning Models）通俗易懂
成员推理攻击是一种面向AI模型的数据隐私窃取，攻击者以判断==数据是否来源于AI模型的训练集==为目标，本质上是对未知来源的数据进行==二分类==，给出成员数据或者非成员数据的判定。攻击者训练一个二分类器，该分类器将==目标分类器==预测的数据样本的置信度分数向量作为输入，预测该
2024-06-05Scalable Membership Inference Attacks via Quantile Regression
我们使用以下六个分类标准：动机：隐私问题：许多研究背后的主要动机是对机器学习模型相关的隐私风险日益增长的担忧。例如，Shokri等人(2017)和Carlini等人(2022)专注于开发和改进成员推理攻击，以评估模型对隐私泄露的脆弱性。模型理解：一些研究深入了解机器学习模型的固有属性。Y
2024-04-18Causal Inference理论学习篇-Tree Based-From Uplift Tree to Uplift Forest
upliftTree和causaltree一样，uplifttree[8]作为一种以分类任务为主的，同样是将因果效应apply到节点分割的标准中。区别是：causaltree：1）使用honest的方法；2)从effect的偏差和方差的角度切入指导树的构建，把分类问题转化为回归问题去做。3）逻辑上只支持两个treatment而uplifttree
2024-04-18Causal Inference理论学习篇-Tree Based-Causal Forest
广义随机森林了解causalforest之前，需要先了解其forest实现的载体：GENERALIZEDRANDOMFORESTS[6]（GRF)其是随机森林的一种推广，经典的随机森林只能去估计labelY，不能用于估计复杂的目标，比如causaleffect，CausalTree、CauaslForest的同一个作者对其进行了改良。先定义一下矩估计
2024-04-16PP-HumanSeg安装、运行、基于PP-HumanSegV2-Lite训练、测试(ubuntu虚拟机 cpu版本)
参考paddleseg官网【PaddleSeg实践范例】PP-HumanSegV2SOTA人像分割方案github的readme: https://github.com/PaddlePaddle/PaddleSeg/blob/release/2.9/README_CN.md零、准备工作0.安装Anacondaubantu下安装Anaconda、pycharm1.用conda创建虚拟环境#1.查询conda环
2024-04-14Causal Inference理论学习篇-Tree Based-Causal Tree
Tree-BasedAlgorithmsTree-based这类方法，和之前meta-learning类的方法最明显的区别是:这类方法把causaleffect的计算显示的加入了到了树模型节点分裂的标准中从response时代过渡到了effect时代。大量的这类算法基本围绕着树节点分裂方式做文章，普遍采用的是兼容性比较高
2024-02-13Tacotron2 Inference教程
https://www.dandelioncloud.cn/article/details/1601780566695559170目录结构本教程实验环境为GoogleColab，文件目录结构如下ALL└──tacotron2├──audio_processing.py├──checkpoint_269000├──data_utils.py├──demo.wav├──distributed.py