训练

2025-01-23legged-robot关于locomotion、Navigation任务主要文章速览
0.前言目前leggedrobot包括locomotion（怎么走）、navigation（往哪走）、人形机器人的wholebodycontrol以及基于机械臂的manipulation的任务。本文章特此记录一方面便于日后自己的温故学习，另一方面也便于大家的学习和交流。如有不对之处，欢迎评论区指出错误，你我共同进步学习！警告
2025-01-22【vjudge训练记录】大一寒假专项训练——前缀和/差分
训练情况A题前缀和模板题，我们输入完\(a_i\)后直接求前缀和\(a_i=a_i+a_{i-1}\)，求区间\([l,r]\)的和就为\(a_r-a_{l-1}\)点击查看代码#include<bits/stdc++.h>#defineintlonglong#defineendl'\n'usingnamespacestd;voidsolve(){intn,m;c
2025-01-21AIGC视频生成明星产品：SD模型的视频版SVD
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍StabilityAI的视频生成模型SVD(StableVideoDiffusion)模型，这家公司在图像生成领域富有盛名，开发并维护了知名开源项目SD系列图像生成模型。SVD是他们在视频生成领域的尝试，主要贡献是：系统的视频数据
2025-01-20【PyTorch】使用回调和日志记录来监控模型训练
就像船长依赖仪器来保持航向一样，数据科学家需要回调和日志记录系统来监控和指导他们在PyTorch中的模型训练。在本教程中，我们将指导您实现回调和日志记录功能，以成功训练模型。一、理解回调和日志记录回调和日志记录是PyTorch中有效管理和监控机器学习模型训练过程的基本工具。1
2025-01-20人脸识别【java-基于OpenCV】思维导图-java架构
为了创建一个关于基于OpenCV的Java人脸识别项目的思维导图，可以围绕项目的主要组成部分进行组织：环境搭建、数据准备、人脸检测、特征提取、模型训练、识别与验证、以及优化和部署。以下是一个结构化的建议框架，你可以根据这个框架使用任何思维导图软件来创建具体的图形化版本
2025-01-20精通Stable Diffusion画图，理解LoRA、Dreambooth、Hypernetworks四大模型差异
随着生成型AI技术的能力提升，越来越多的同行开始将注意力放在了通过AI模型提升研发效率上。业内比较火的AI模型有很多，比如画图神器Midjourney、用途多样的StableDiffusion，以及OpenAI此前刚刚迭代的DALL-E2，除了后者使用人数有限之外，前两个都有很多的开发者尝试。不过，对于研
2025-01-20【大模型面试必备】20道大模型经典问题及答案：助你成功通过面试！
我总结了可能会遇到的20个LLM面试问题。初级LLM面试问题Q1.简单来说，什么是大型语言模型（LLM）？大型语言模型（LLM）是一种通过大量文本材料训练的人工智能系统，能够像人类一样理解和生成语言。通过使用机器学习技术识别训练数据中的模式和关联，这些模型能够提供逻辑上和上下文上
2025-01-202025版最新大模型微调指南，零基础入门到精通，收藏这篇就够了
前言Prompt工程技术文章专栏系列已更新七章，涵盖了AI开发生态中的多种使用场景，并提供了足够实用的Prompt技巧。而现在，随着大模型调用变得越来越简单，tokens成本也大幅降低，AI开发者可以轻松进行API封装与二次开发。部分平台更是支持定制场景微调，推动着“AI+”模式在市场上蓬勃
2025-01-202025版最新开发一款大模型需要经过哪些步骤？开发一款大模型的完整流程，收藏这篇就够了
“打造一款模型是一件非常复杂的事情，设计的问题也非常非常多，因此大家要做好心理准备”这段时间写的文章主要都在讲大模型的应用问题，以及自己在工作中遇到的一些问题；而今天我们就从大模型服务的角度，来思考一下打造一款大模型需要经过哪些步骤，也就是怎么打造一款大模型。
2025-01-20大模型入门书籍分享（附PDF）大模型时代：ChatGPT开启通用人工智能浪潮
近期工作中有一些涉及到大模型等的应用，刚好在微信读书上看到了这本《大模型时代：ChatGPT开启通用人工智能浪潮》，本月看完了这本书与大家分享下。ChatGPT火爆全球，但大语言模型（LargeLanguageModel）才是幕后真正的智能“大脑”！生成式大模型正在开创新的时代，基于生成式预训练
2025-01-20Amazon SageMaker
AmazonSageMaker是AmazonWebServices（AWS）提供的全托管机器学习平台，旨在帮助开发人员和数据科学家快速构建、训练和部署机器学习（ML）模型。它提供了一整套从数据预处理、模型训练、优化到部署和监控的工具，简化了机器学习生命周期的每一个环节。SageMaker的目标是降低机器学习
2025-01-19【开源】一款基于JAVA的国产化自主可控的人工智能开源平台
一、项目简介人工智能开源平台是由联合国内顶尖科研力量共同打造的国产化自主可控的人工智能开源平台。平台面向人工智能研究中的数据处理、算法开发、模型训练、算力管理和推理应用等各个流程的技术难点，研发了包括一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库
2025-01-18【LLM】Openai-o1及o1类复现方法
note可以从更为本质的方案出发，通过分析强化学习的方法，看看如何实现o1，但其中的核心就是在于，如何有效地初始化策略、设计奖励函数、实现高效的搜索算法以及利用强化学习进行学习和优化。文章目录note一、Imitate,Explore,andSelf-Improve:AReproductionReportonS
2025-01-18利用离散世界模型掌握 Atari Dreamer github 强化学习
利用离散世界模型掌握Atari在TensorFlow2中实现DreamerV2代理。包含全部55款游戏的训练曲线。如果您发现此代码有用，请在您的论文中引用：<spanstyle="background-color:var(--bgColor-muted,var(--color-canvas-subtle))"><spanstyle="color:#1f2328"><spanstyle
2025-01-18腾讯混元发布浮点量化训练新理论，揭示大模型训练的极限
在大模型（LargeLanguageModel，LLM）快速发展的今天，模型的训练和推理成本日益成为研究和应用的关注焦点。最近，腾讯混元团队发布了一项重要研究，深入探讨了低比特浮点量化训练的“ScalingLaws”，即浮点数量化训练的规模法则。此项研究的核心在于通过降低模型的精度，探索如何在不
2025-01-18深度学习中的迁移学习：使用预训练模型进行图像分类
深度学习中的迁移学习：使用预训练模型进行图像分类介绍迁移学习是一种机器学习方法，其中一个模型在某个任务上进行预训练，并将该知识转移到新的但相关的任务中。深度学习中的迁移学习常用于图像分类，通过利用预训练模型（例如VGG、ResNet、Inception等）显著减少新任务所需的训
2025-01-17深度学习框架大比拼：TensorFlow vs PyTorch，亦菲彦祖的选择
深度学习框架大比拼：TensorFlowvsPyTorch，亦菲彦祖的选择亲爱的亦菲彦祖，欢迎来到这次的深度学习框架擂台！在我们之前的讨论中，你已经学习了深度学习的核心概念、神经网络的基本原理、卷积神经网络（CNN）和循环神经网络（RNN）等技术。但要想真正落地实践，还需要一个合适、易用且高效的深
2025-01-17【vjudge训练记录】大一寒假专项训练——字符串
训练情况A题第十届中国大学生程序设计竞赛（济南）-（CCPC2024-Jinan）签到题我们取第一行第一个和后面的进行比较，如果不同的次数超过1次，就说明第一行第一个是不同的那个，如果不同的次数刚好为1次，比较的那个字符串是不同的那个。#include<bits/stdc++.h>#defineintlonglong#defi
2025-01-17LossVal：一种集成于损失函数的高效数据价值评估方法
在机器学习领域，训练数据的价值并非均等：部分训练数据点对模型训练的影响显著高于其他数据点。评估单个数据点的影响程度通常需要反复重训练模型，计算效率低下。LossVal提出了一种创新方法，通过将数据价值评估过程直接集成到神经网络的损失函数中，实现了高效的数据价值评估。现代机器
2025-01-172025实战指南大模型AI产品经理：从零基础到精通的详细步骤与技巧，一文收藏即可开始学习！
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基
2025-01-17视觉语言模型——原理、模型架构、训练方法
1.概述近年来深度学习在计算机视觉(CV)和自然语言处理(NLP)等单模态领域都取得了十分优异的性能。随着技术的发展，多模态学习的重要性和必要性已经慢慢展现。视觉语言学习作为多模态学习的重要部分，得到国内外研究人员的广泛关注。得益于Transformer框架的发展，越来越多的预
2025-01-17【论文阅读】GROOT：Learning to Follow Instructions by Watching Gameplay Viedos
GROOT：LearningtoFollowInstructionsbyWatchingGameplayViedos.作者为北京大学梁一韬所在的TeamCraftJarvis,发表时间为2023Background在开放世界下开发类人级别的具身智能体以解决开放式任务一直是人工智能领域长期以来追求的目标。随着ChatGPT的流行，近年来涌现了一批
2025-01-17智能关键技术二：库内AI引擎
GaussDB库内AI引擎架构如下图：图4DB4AI架构图用户接口层在用户接口层，实现SQL-like语法，提供CreateModel、Predict等关键字，支持AI算法训练和预测。当前支持的AI算法包括：GD（梯度下降法）、KMeans（聚类）、XGBoost、决策树等。查询优化层查询优化层提供AI训练执行计划和AI预测执行计划
2025-01-16【深度学习教程】Python 如何用 LSTM 做情感分析？小白也能上手！
【深度学习教程】如何用LSTM做情感分析？小白也能上手！Hello大家好，今天我们来聊一个超热门的话题——LSTM网络在情感分析中的应用！想象一下，通过深度学习，你的代码可以读懂人类情绪，知道“我爱你”和“我讨厌你”的区别，是不是很酷？今天这篇文章，我会手把手教你从零开始，用Python和Ke
2025-01-16Hyperparameter
Hyperparameterhttps://blog.csdn.net/2401_85377976/article/details/141598610 Hyperparameter超参数（Hyperparameter），是机器学习算法中的调优参数，用于控制模型的学习过程和结构。与模型参数（ModelParameter）不同，模型参数是在训练过程中通过数据学习得到的，而超参数是在训练之