• 2024-10-29激活函数和GLU
    LLaMA系列用的FFN层现在是SwishGLU,这里Swish是个激活函数,GLU是个线性单元,二者合起来是SwishGLU。FFNTransformer中原始的FFN长这样:\[FFN(x)=ReLU(xW_1+b_1)W_2+b_2\]两个线性层中间夹了个relu激活函数写成模型代码就是:x=up_proj(x)x=relu(x)x=down_proj(x)或者
  • 2024-10-22HQQ: 快速高效的大型机器学习模型量化方法
    HQQ:革命性的模型量化技术在人工智能和机器学习领域,模型量化一直是一个重要的研究方向。随着模型规模的不断扩大,如何在有限的计算资源下高效部署大型模型成为了一个亟待解决的问题。近日,由MobiusLabs开发的Half-QuadraticQuantization(HQQ)技术为这一难题提供了一个创新的
  • 2024-09-01BEVFormer开源算法逐行解析(二):Decoder和Det部分
    写在前面:对于BEVFormer算法框架的整体理解,大家可以找到大量的资料参考,但是对于算法代码的解读缺乏详实的资料。因此,本系列的目的是结合代码实现细节、在tensor维度的变换中帮助读者对算法能有更直观的认识。本系列我们将对BEVFormer公版代码(开源算法)进行逐行解析,以结合代码理解
  • 2024-08-17vivado无工程生成固件及时序报告
    做IC一般都是使用linux系统进行编写代码,综合仿真等操作。因此没有图像化界面只跑脚本是提高效率的一种方式,笔者以前一直使用图像化界面的方式对Vivado工程进行编译综合,后来学会了windows下也可以使用脚本直接无工程生成bit文件,时序报告等。步骤大致如下,rtl.list在上文有
  • 2024-07-05解析Torch中多头注意力`MultiheadAttention`
    前沿:这部分内容是《AttentionIsAllYouNeed》出来之后就深入研究了这篇文章的模型结构,也是之后工作那一年进行实际落地的一小部分内容。最近再次使用它,顺带读了torch官方的实现,大家风范的实现,注意很多细节,值得我们学习,也顺带放在这,之后就不再了解这块内容了,过去式了。下
  • 2024-07-04【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
    目录一、引言二、模型简介2.1 Gemma2概述2.2Gemma2 模型架构三、训练与推理3.1Gemma2 模型训练3.1.1下载基座模型3.1.2 导入依赖库3.1.3量化配置3.1.4分词器和模型实例化3.1.5引入PEFT进行LORA配置 3.1.6样本数据清洗与加载3.1.7模型训练与保存3.
  • 2024-07-01vision mamba-yolov8:结合Vmamba的yolov8目标检测改进实现
    1.visionmamba结构与原理        Mamba成功的关键在于S6模型,该模型为NLP任务设计,通过选择性扫描空间状态序列模型,将二次复杂度降低至线性。但由于视觉信号(如图像)的无序性,Mamba的S6模型不能直接应用,设计了2D-selective-scan(SS2D)模块。        如上图所
  • 2024-06-19Vitis Accelerated Libraries 学习笔记--OpenCV 安装指南
    目录1.简介2.安装过程2.1安装准备2.2常见错误2.2.1核心共享库报错3.通过实例测试 4.总结1.简介使用VitisVisionLibraryVitis视觉库,为什么要安装opencv库?在使用VitisVisionLibrary时,安装OpenCV库是因为许多视觉库的功能都提供了示例设计测试平台,使用
  • 2024-06-15【机器学习】QLoRA:基于PEFT亲手微调你的第一个AI大模型
    目录一、引言二、量化与微调—原理剖析2.1 为什么要量化微调?2.2 量化(Quantization)2.2.1 量化原理2.2.2 量化代码2.3 微调(Fine-Tuning)2.3.1LoRA2.3.2QLoRA三、量化与微调—实战演练:以Qwen2为例,亲手微调你的第一个AI大模型3.1模型预处理—依赖安装、库包导
  • 2024-06-11LLM大模型: llama源码要点解读(一)
    transformer火了之后,基于transformer架构的llama也火了,可能的原因:来自meta,一线互联网大厂,质量有保证;自称70b参数的表现比chatGPT3还好(Llama2:OpenFoundationandFine-TunedChatModels)!可能会成为大模型界的Android:各种基于llama的微调和应用会越来越多(llama的模型
  • 2024-05-09openness的应用
    1.添加用户组用户2.导入openness.dll文件.dll文件位置C:\ProgramFiles\Siemens\Automation\PortalV19\PublicAPI\V19添加项目引用引用的命名空间usingSiemens.Engineering;2.TIAPortalOpenness的对象模型可以通过索引号像数组一样对列表中的对象进行寻
  • 2024-05-01bd-bc-proj-merge-0
    区块链项目构建指南(全)原文:zh.annas-archive.org/md5/e61d4f5cf7a1ecdfea6a6e32a165bf64译者:飞龙协议:CCBY-NC-SA4.0序言区块链是一个去中心化的账本,它维护着一个持续增长的数据记录列表,受到篡改和修订的保护。每个用户都可以连接到网络,向其发送新交易,验证交易,并创建新的区
  • 2024-04-02大模型架构之MOE
    transformers库里面的modeling_mistral.pyMistralModel((embed_tokens):Embedding(32000,4096)(layers):ModuleList((0-1):2xMistralDecoderLayer((self_attn):MistralSdpaAttention((q_proj):Linear(in_features=4096,out_features=4096,
  • 2024-03-28咸鱼翻身啦!咸鱼之王完美内购版架设教程
    前言我就直接开门见山啦!这次给大家带来的是最终修复版完美的咸鱼之王,暂时只有安卓版。之前给大家分享过H5版的咸鱼之王,问题很多,主要就是娱乐一下,这次的咸鱼之王绝对超乎你的想象!同样是内购版本,可以无限充值和购买游戏内的各种道具,因为是客户端版本,所以不会像之前H5版最多只
  • 2024-03-19ftok函数
    ftok函数ftok函数在Unix和Linux系统中用于生成一个唯一的键(key),这个键通常用于IPC(进程间通信)机制,如消息队列、信号量或共享内存。它基于给定的文件路径和单个字符(通常是项目的唯一标识符)来生成这个键。ftok的名字来源于"filetokey"的缩写。函数原型#include<sys/ipc
  • 2024-03-16Angr-Learn-0x2
    Angr-Learn-0x2注意本文可以理解为官方文档的简单翻译+一部分个人理解LoadingaBinary之前在Angr-Learn-0x1中,我们简单提到了CLE("CLELoadsEverything"),它的主要功能就是获取二进制依赖库来提供给angr。装载器这个代码简单说明了如何与装载器CLE交互>>importangr,monk
  • 2024-02-01在Visual Studio中部署GDAL库的C++版本(包括SQLite、PROJ等依赖)
      本文介绍在VisualStudio软件中配置、编译C++环境下GDAL库、SQLite环境与PROJ库的详细方法。  GDAL库是一个非常方便的地理数据处理库,但其在C++环境下的配置与编译流程较为复杂;尤其是最新的GDAL3及以上版本,其在C++环境中的配置更是首先需要满足许多其他的环境配置条件(包括
  • 2023-12-28OpenLayers6使用天地图“经纬度投影(CGCS2000)”和“球面墨卡托投影(EPSG:3857)”WMTS服务
    转自:https://blog.csdn.net/nudtcadet/article/details/1029084581.封装生成图层类/***@fileOverview天地图WMTS服务API*@author<ahref=”https://blog.csdn.net/nudtcadet”>老胡</a>*@version1.0*/import{getWidth,getTopLeft}from'ol/extent';impo
  • 2023-11-08原点到线段的垂足
    原理:1) 求出向量ao在ab上的投影距离2)a沿着ab方向移动投影距离就是垂足点的位置 //获得原点到直线ab的垂点publicstaticVector2GetPerpendicularToOrigin(Vector2a,Vector2b){varab=b-a;varao=Vector2.zero-a;floatproj=Vector2.D
  • 2023-11-01celery学习md笔记:从0基础到系统性掌握用法 第(2)篇:celery的配置
    Celery是一个功能完备即插即用的任务队列。它使得我们不需要考虑复杂的问题,使用非常简单。celery看起来似乎很庞大,本文我们先对其进行简单的了解,然后再去学习其他一些高级特性。完整版笔记直接地址:请移步这里共4章,12子模块,总计5628字本章节我们需要快速了解celery一
  • 2023-10-23Proj CDeepFuzz Paper Reading: POLYCRUISE: A Cross-Language Dynamic Information Flow Analysis
    Abstract本文:PolyCruiseMethod:跨编程语言的holisticdynamicinformationflowanalysis(DIFA)usealightlanguage-specificanalysis和language-agnosticonlinedataflowanalysis来计算symbolicdependencies实验:数据集:PolyBench,包含小中大三种等级的benchmarks效
  • 2023-10-21C++ 使用EPSG进行坐标转换
    场景将WGS84坐标转换为CGCS2000坐标使用epsg.io网站的坐标系转换功能可以检查转换结果是否正确下面网址是示例代码https://epsg.io/transform#s_srs=4326&t_srs=4538&x=88.0000000&y=47.0000000转换示例代码projver.9.2.0安装proj库,使用vcpkg(vcpkginstallproj:x64-wind
  • 2023-10-04Proj CDeepFuzz Paper Reading: NYX: Greybox Hypervisor Fuzzing using Fast Snapshots and Affine Types
    Abstract背景:hypervisor(virtualmachinemonitor,VMM)保障了不同虚拟机之间的安全隔离(securityboundaries)用户:攻击场景:在云服务上运行自身的VMinstances,提升权限本文:Nyx目的:coverageguidedhypervisorfuzzermethod:1.fastsnapshotrestorationmechanism2.mu
  • 2023-09-08【Python&GIS】矢量数据投影转换(坐标转换)
    ​    之前跟大家分享过面矢量数据投影转换和点矢量数据投影转换,但博主在日常工作的过程中发现之前分享的面矢量数据投影转换有时候会出现错误,或者转换后的效果不好。再一次偶然的过程中发现了新的坐标转换(投影转换)函数,所以今天和大家分享一下,大家在进行坐标转换时可以
  • 2023-09-06Proj CDeepFuzz Paper Reading: IvySyn: Automated Vulnerability Discovery in Deep Learning Frameworks
    Abstract本文:IvySynTask:discovermemoryerrorvulnerabilitiesinDLframeworksBugType:memorysafetyerrors,fatalruntimeerrorsMethod:利用nativeAPIs中静态写明的类型信息在low-levelkernelcode上执行type-awaremutation-basedfuzzingsynthesizeProofof