- 2025-01-10第三届智能决策论坛|决策大模型专题报告——随笔(1)
前言这次汇报的有四位老师,其中我比较感兴趣的是上海交通大学张伟楠老师、北京大学梁一韬老师和清华大学高宸老师的报告,其中张老师之前已经记录过,本文主要作为对梁一韬老师的分享的记录与思考。CRAFTJARVIS:TowardsGeneralistAgentsinanOpenWorldMotivation研究趋势:构
- 2025-01-04基于不变学习的分布外泛化时间序列预测
论文学习:基于不变学习的分布外泛化时间序列预测论文:Time-SeriesForecastingforOut-of-DistributionGeneralizationUsingInvariantLearning代码:https://github.com/AdityaLab/FOIL?tab=readme-ov-file来自ICML(CCF—A会议)1摘要(Abstract)文章的主要研究内容是针对
- 2025-01-03清华:通过编辑思维链实现LLM知识更新
- 2025-01-03清华:傅里叶位置嵌入优化LLM长度泛化
- 2024-12-31UML之泛化、特化和继承
在UML(统一建模语言)中,泛化(Generalization)和特化(Specialization)是面向对象思想中继承(Inheritance)关系的重要概念,它们描述类与类(或用例与用例、参与者与参与者等)之间的一般与特殊的关系。泛化是一种表示类之间继承关系的方式,它指定了子类如何特化超类(父类)的所有特征和行为。在UML中,
- 2024-12-29用例图
用例图(UseCaseDiagram)是统一建模语言(UML,UnifiedModelingLanguage)中的一种图表,用于捕捉系统的行为需求,特别是从用户交互的角度来描述系统的功能性。它主要用来展示系统与外部参与者(如用户、其他系统或硬件设备)之间的交互,并标识这些参与者如何通过使用系统提供的服务来实现其
- 2024-12-28NLP论文速读(NeurIPS 2024)|树状结构两阶段推荐系统的泛化误差边界Generalization Error Bounds for Two-stage Recommender System
论文速读|GeneralizationErrorBoundsforTwo-stageRecommenderSystemswithTreeStructure论文信息:简介: 本文讨论的是两阶段推荐系统(Two-stageRecommenderSystems)在具有树结构的情况下的泛化误差界限。两阶段推荐系统在许多在线服务中扮演着重要角色,例
- 2024-12-269.17
今天是中秋节,这是机器学习二作业一.单选题(共2题,40分)1. (单选题) 在评价模型的性能时,一般是更希望算法模型的(C) A 训练误差小 B 测试误差小 C 泛化误差小 D 以上都是 2. (单选题) 算法模型“过拟合”会发生的现象有(A) A
- 2024-12-23用例图
对于用例图来说我们需要了解的是什么叫用例图,构成用例图的要素,用例图有哪些重要的元素,各个用例之间的关系。当然最重要的是如何根据需求创建用例图。具体的创建通过一个简单的学生管理的例子说明创建的过程和例子。我的所有例子都是是使用Rose这个软件来画的,现在虽然有新的UML
- 2024-12-20泛化能力、过拟合、鲁棒性、敏感度、特征依赖
1.定义:泛化能力是指模型在新数据(即测试集或真实世界数据)上预测准确性的能力,这些数据与模型在训练过程中使用的数据不同。过拟合(Overfitting)是指模型在训练数据上表现得很好,但在新数据上表现差,这表明模型缺乏泛化能力。一个具有良好泛化能力的模型能够很好地适应新情况,而不仅仅
- 2024-12-05利用自监督学习解决二级类中出现的长尾问题
文章目录概要自监督学习知识蒸馏自监督+知识蒸馏核心代码相关文献概要为了提高机械臂采摘苹果的效率,需要对可采摘苹果进行精准识别。通过对苹果、树叶、树枝以及它们之间的空间关系进行细致分析,我们将苹果识别问题细分为八个类别,由此引发了类别间数量严重不
- 2024-12-02对于分类算法来说,过拟合到底是什么?
过拟合问题:训练误差(trainingerror)&泛化误差(generalizationerror)通常,对于分类算法可能产生两种类型的误差:训练误差&泛化误差。训练误差:就是你的模型,对于现有的训练样本集,他们之间的拟合程度;泛化误差:就是你模型的泛化能力。就是对于新的样本数据的分类能力是
- 2024-11-25解读Graph+AI白皮书:LLM浪潮下,Graph尚有何为?
历时半年,由蚂蚁集团和之江实验室牵头,联合北京邮电大学、浙江大学、西湖大学、东北大学、杭州悦数科技、浙江创邻科技、北京大学、北京交通大学、复旦大学、北京海致星图科技、腾讯、信雅达科技、北京枫清科技等单位编写的《Graph+AI:大模型浪潮下的图计算》白皮书,在11月2日全国智
- 2024-11-24【拥抱AI】对比embedding模型gte-Qwen2-7B-instruct和bge-m3:latest(三)
为了更全面地评估gte-Qwen2-7B-instruct和bge-m3:latest的性能,我们可以从以下几个方面进行详细比较:1.模型架构和规模gte-Qwen2-7B-instruct架构:基于Transformer的大型语言模型。参数量:7B参数,具有较强的表达能力和泛化能力。训练数据:经过大量指令-响应对的训练,特别适
- 2024-12-04好诗相伴,千金不换
唐代诗人李贺的《南园十三首·其五》 // 没想到少年天才的李贺是如此这般的命运多舛男儿何不带吴钩,收取关山五十州。请君暂上凌烟阁,若个书生万户侯?蒋捷的《虞美人·听雨》少年听雨歌楼上,红烛昏罗帐。壮年听雨客舟中,江阔云低、断雁叫西风。而今听雨僧庐下,鬓已星
- 2024-11-282024.11.28周四
2024.11.28周四Q1.1200给定a,b。构造一数组,满足平均值为a,中位数为b。Q2.1300给定4个数字,输出1~5中未出现的数字。Q3.1500给定一数组,每次操作你可以选择一个元素ai在数组右边添加i-1个0。问任意操作数组长度的最大值。A1.9mins考虑等差数列,3个元素便能构造出来
- 2024-11-23【大模型智能客服背景下】知识图谱笔记
【背景】 在数字化飞速发展的时代,客户服务的质量和效率成为企业立足市场、赢得客户信赖的关键因素之一。随着人工智能技术的不断革新,智能客服应运而生,为企业与客户之间搭建起了更为便捷、高效的沟通桥梁。 传统的智能客服系统往往基于预设规则
- 2024-10-11论文分享---CVPR2024:用于单源域泛化目标检测的无偏 Faster R-CNN
论文地址https://arxiv.org/pdf/2405.15225简介:此论文由刘亚静,周世军,刘希尧,郝春辉,范宝杰,田建东,中国科学院沈阳自动化研究所机器人国家重点实验室、中国科学院机器人与智能制造研究所、中国科学院大学、南京邮电大学在CVPR2024上发表。摘要单源域泛化(SDG)物体检测是一项
- 2024-10-10Open X-Embodiment: Robotic Learning Datasets and RT-X Models
OpenX-Embodiment:RoboticLearningDatasetsandRT-XModels启发:在不同数据集上训练大规模、高容量模型以处理下游应用方面取得显著成功。是否能将所有数据整合在高容量机器人操作模型上使其有效适应新的机器人、任务、环境?贡献:提供了标准化数据格式和模型的数据集,收