• 2024-10-02题解:AT_abc373_d [ABC373D] Hidden Weights
    可以发现一个性质:对于图的每个连通分量,一旦在其中任何顶点上的值固定,则所有写入的值都是确定的。我们可以逐个DFS每个连通分量,按照题目的要求给每个点赋值,初始搜索的点值设成\(0\)即可。代码:#include<bits/stdc++.h>#defineintlonglongusingnamespacestd;intn,m;
  • 2024-09-27Element UI 自定义Layout前端页面布局
    1.layout下新建front文件夹index.vue中内容<template><divclass="frontLayout"><el-container><el-header><divclass="navBar"><divclass="navBarLeft">
  • 2024-09-27uniapp h5端地图导航功能
    <template> <viewclass="container"> <viewclass="content"> <map:scale="14":show-location="true":show-compass="true"class="map-content" :latitude="position.lati
  • 2024-09-25前端开发必须了解的css知识
    文本过长省略显示单行.ellipsis{overflow:hidden;text-overflow:ellipsis;white-space:nowrap;}多行方法一:.ellipsis{overflow:hidden;text-overflow:ellipsis;-webkit-line-clamp:3;word-break:break-all;}方法二:.ellipsis{
  • 2024-09-24AI大模型推理性能优化之KV Cache
    前言本篇介绍KVCache。KVCache(键-值缓存)是一种在大模型推理中广泛应用的优化技术,其核心思想是利用缓存key和value来避免重复计算,从而提高推理效率。代价是显存占用会增加。核心思想在自注意力层的计算中,对于给定的输入序列,模型会计算每个token的key和value向量。这些向量的值
  • 2024-09-24详解Diffusion扩散模型:理论、架构与实现
    本文深入探讨了Diffusion扩散模型的概念、架构设计与算法实现,详细解析了模型的前向与逆向过程、编码器与解码器的设计、网络结构与训练过程,结合PyTorch代码示例,提供全面的技术指导。关注TechLead,复旦AI博士,分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智
  • 2024-09-23完整的端到端的中文聊天机器人
    这段代码是一个完整的端到端的中文聊天机器人的实现,包括数据处理、模型训练、预测和图形用户界面(GUI),下面是对各个部分功能的详细说明:1.导入必要的库importosos.environ['CUDA_LAUNCH_BLOCKING']='1'importtorchimporttorch.nnasnnimporttorch.optimasopti
  • 2024-09-17跟着问题学10——RNN详解及代码实战
    1循环神经网络RecurrentNeuralNetwork什么是序列信息呢?通俗理解就是一段连续的信息,前后信息之间是有关系地,必须将不同时刻的信息放在一起理解。比如一句话,虽然可以拆分成多个词语,但是需要将这些词语连起来理解才能得到一句话的意思。RNN就是用来处理这些序列信息的任务
  • 2024-09-16Transformer-Attention机制
    出现Attention机制的原因:基于循环神经网络(RNN)的seq2seq模型,在处理长文本时遇到了挑战,而对长文本中不同位置的信息进行attention有助于提升RNN的模型效果。1seq2seq框架seq2seq:从一个文本序列得到一个新的文本序列。典型的seq2seq任务包括:机器翻译任务、文本摘要任务。简而言之就是
  • 2024-09-16Datawhale------Tiny-universe学习笔记——Qwen
    1.Qwen整体介绍    对于一个完全没接触过大模型的小白来说,猛一听这个名字首先会一懵:Qwen是啥。这里首先解答一下这个问题。下面是官网给出介绍:Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。其实随着大模型领域的发展,这类产品已经有很多了例如:由
  • 2024-09-08CodeForces Round #621 ABC (1307A+1307B+1307C) 题解
    A.CowandHaybales题面TheUSAConstructionOperation(USACO)recentlyorderedFarmerJohntoarrangearowofnhaybalepilesonthefarm.The\(i\)-thpilecontains\(a_i\)haybales.However,FarmerJohnhasjustleftforvacation,leavingBessieal
  • 2024-09-04【HuggingFace Transformers】OpenAIGPTModel源码解析
    OpenAIGPTModel源码解析1.GPT介绍2.OpenAIGPTModel类源码解析说到ChatGPT,大家可能都使用过吧。2022年,ChatGPT的推出引发了广泛的关注和讨论。这款对话生成模型不仅具备了强大的语言理解和生成能力,还能进行非常自然的对话,给用户带来了全新的互动体验。然而,ChatGPT
  • 2024-08-28NLP从零开始------15.文本中阶序列处理之语言模型(3)
    4. 注意力机制4.1 注意力机制        循环神经网络的一个主要局限是不能很好地建模长距离依赖,即使像长短期记忆这样的变体也只是改善而不是完全解决了长距离依赖的问题。其根本原因在于,如果序列中的第i个词需要对第j个词(假设j>i)产生影响,需经过j-i个计算步骤, 而
  • 2024-08-27NLP从零开始------14.文本中阶序列处理之语言模型(2)
    3.2长短期记忆        梯度消失问题的一个解决方案是使用循环神经网络的变体——长短期记忆( long short- term memory, LSTM)。        长短期记忆的原理是, 在每一步t, 都保存一个隐状态和一个单元状态( cell state) , 通过单元状态来存储长距离
  • 2024-08-25【HuggingFace Transformers】BertSelfAttention源码解析
    BertSelfAttention源码解析1.BertSelfAttention类介绍1.1关键组件1.2主要方法2.BertSelfAttention类源码解析(核心简版)3.BertSelfAttention类源码解析1.BertSelfAttention类介绍BertSelfAttention类是BERT模型的核心组件之一,主要负责实现多头自注意力
  • 2024-08-25图伸神经网络GCN实现图内点云分类任务(物体的部件分类)
    点云分类任务数据集下载关键代码数据集结构网络模型模型训练测试模型+可视化结果可能会出现的问题pyg没有配置好懒人专属(代码链接)本项目是一个简单的使用图中点分类代码,内涵完整的网络搭建、模型训练、模型保存、模型调用、可视化、的全过程。可以帮助初学者快速熟
  • 2024-08-24使用Appium执行自动化测试遇到的问题记录
    ‌Appium‌是一个开源的移动端自动化测试框架,它支持原生的、混合的以及移动端的web项目测试,并且能够测试iOS和Android应用程序。在使用中有时会遇到问题,特此记录:问题一:设备:Android一加问题描述:adb连接成功,执行测试脚本时AppiumDesktopsession报如下错误:settingsdeleteg
  • 2024-08-24一个可以搜索页面内超链接的HTML页面
    页面效果如上,含有标题,搜索框和一些超链接,在搜索框输入一些文字可以在下方显示含有这些文字的超链接。这里的搜索不仅可以中文,还可以是英文,数字HTML代码如下<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=d
  • 2024-08-21Blocked aria-hidden on a <input> element because the element that just received focus must not be hi
    bug查资料找到三种解决方案1.第一种在main.js中加入,然后在报错的组件上加,但我没有解决Vue.directive('removeAriaHidden',{bind(el,binding){letariaEls=el.querySelectorAll('.el-radio__original');ariaEls.forEach((item)=>{item.removeA
  • 2024-08-20隐藏元素六种方式
    使用透明度语法:opacity:0|10:透明1:不透明注意:元素消失,占据空间,不会让出原来的位置      可以使用过渡效果<style>.box{width:100px;height:100px;background-color:aquamarine;opacity:0;}</style><divclass="box"></div>
  • 2024-08-16aria-hidden="true"有什么用
     指示辅助技术忽略特定的HTML元素‌aria-hidden="true"的主要作用是指示辅助技术忽略特定的HTML元素,使其在‌屏幕阅读器等辅助设备中不可见,从而减少冗余信息的输出,提高网页的可访问性。 当一个元素被设置为aria-hidden="true"时,辅助技术将不会读取
  • 2024-08-15易优User登录注册标签-Eyoucms标签手册
    user登录注册入口标签[基础用法]名称:user功能:动态显示登录、注册、退出、会员中心的入口;语法:{eyou:usertype='login'}<ahref="{$field.url}"id="{$field.id}">登录</a>{$field.hidden}{/eyou:user}参数:type=''标签类型-
  • 2024-08-13菜单结构
    {"msg":"操作成功","code":200,"data":[{"path":"/","hidden":false,"redirect":"project",&q
  • 2024-08-12PyTorch:从零实现一个双向循环神经网络
    从零实现一个双向循环神经网络(Bi-directionalRecurrentNeuralNetwork,Bi-RNN)从零开始,可以帮助我们深入理解RNN的机制。以下是实现步骤:定义RNN单元:实现一个简单的RNN单元,能够处理单个时间步长的数据。定义双向RNN:实现前向和后向的RNN,组合它们的输出。定义损失函
  • 2024-08-09Pytorch函数基础:鸢尾花数据集分类
    博客框架引言简要介绍机器学习和分类问题介绍鸢尾花数据集简述PyTorch的作用及其在深度学习中的重要性环境准备安装所需的库(PyTorch、NumPy、Matplotlib、Pandas等)创建并激活Python虚拟环境(可选)数据加载与预处理从CSV文件读取数据数据转换和标准化将数据转换为Py