bit
  • 2025-01-082025-01-08:找到按位或最接近 K 的子数组。用go语言,给定一个数组 nums 和一个整数 k,你的目标是找到一个子数组,使得该子数组中所有元素进行按位或运算后的结果与 k 之间的绝对差值尽
    2025-01-08:找到按位或最接近K的子数组。用go语言,给定一个数组nums和一个整数k,你的目标是找到一个子数组,使得该子数组中所有元素进行按位或运算后的结果与k之间的绝对差值尽量小。具体地,你需要确定一个子数组nums[l..r],使得以下表达式的值最小化:|k-(nums[l]ORnums[l
  • 2025-01-07Ultra-Low Precision 4-bit Training of Deep Neural Networks
    目录概主要内容Radix-4FP4formatGradScaleTwo-PhaseRounding(TPR)SunX.,WangN.,ChenC.,NiJ.,AgrawalA.,CuiX.,VenkataramaniS.andMaghraouiK.E.andSrinivasanV.Ultra-lowprecision4-bittrainingofdeepneuralnetworks.NeurIPS,2020.概本文
  • 2025-01-07【优选算法】Bit-Samurai:位运算的算法之道
    文章目录1.常见位运算总结1.1基础位运算符号1.2给一个数n,确定它的二进制表示中的第x位是0还是11.3将一个数n的二进制表示的第x位修改成11.4将一个数n的二进制表示的第x位修改成01.5位图的思想1.6提取一个n二进制表示中最右侧的11.7干掉一个数
  • 2025-01-05参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型
    文章链接:https://arxiv.org/pdf/2412.18653项目链接:https://chenglin-yang.github.io/1.58bit.flux.github.io/git主页:https://github.com/Chenglin-Yang亮点分析1.58-bitFLUX,第一个将FLUX视觉Transformer的参数(共119亿)减少99.5%至1.58-bit的量化模型,无需
  • 2025-01-05Training Deep Neural Networks with 8-bit Floating Point Numbers
    目录概主要内容WangN.,ChoiJ.,BrandD.,ChenC.andGopalakrishnanK.Trainingdeepneuralnetworkswith8-bitfloatingpointnumbers.NeurIPS,2018.概本文提出了一种8-bit的训练方式.主要内容本文想要实现8-bit的训练,作者认为主要挑战是两个向量的
  • 2024-12-30《计算机组成及汇编语言原理》阅读笔记:p133-p159
    《计算机组成及汇编语言原理》学习第11天,p133-p159总结,总计27页。一、技术总结1.segment(1)定义Broadlyspeaking,acontiguoussectionofmemory.Morespecifically,asectionofmemoryreferencedbyoneofthesegmentregistersofthe80x86family.Theme
  • 2024-12-30记录一些蓝牙 BLE 心率服务信息
    首先是官方文档,但是感觉说的不是特别清晰:https://www.bluetooth.com/specifications/specs/heart-rate-profile-1-0/https://www.bluetooth.com/specifications/specs/heart-rate-service-1-0/然后是一个网友的总结:DeterminetheformatThe Bluetooth sitehasbeenreorga
  • 2024-12-28树状数组学习笔记
    树状数组概念\(a[i]\)数组存储当前序列数据\(s[i]\)用来存储区间和,其中下标i值代表的是一段区间,其区间长度取决于low_bit(i)例如:\(s[4]\),4对应二进制100,因此low_bit(i)=100,其长度为4,所以s[4]存储的为a[1]~a[4]的和。\(s[6]\),6对应二进制110,因此low_bit(i)=10,其长度为2,
  • 2024-12-26UE4.27, 揣摩源码, 序列化 (二) FBitReader, FBitWriter
    2. 继续看bit序列化,这个设计是网络传输的关键一环//FBitReader, FBitWriter这两个类仅被网络相关的事务使用//Thisclassisexclusivelyusedbythenetcode2.1.SVO和array的正反序列化相同,内部都存在着,对类型是TAarry<uint8>的字节单位的内存的处理
  • 2024-12-24PCIe基础篇——PCIe传输速率计算
    本节概述传输速率与带宽对应表如下,注:此表为全双工通信速率且没考虑编码方式详细说明我们在接触PCIe设备时会接触到一个词,传输速率,比如8GT/s。或者有人问你设备的带宽多少?通信速率多少?Width(带宽):通常用x1、x2、x4、x8等表示,表示该链路由几条lane组成。Speed(速率):通常用2.5GT/s
  • 2024-12-24Accurate Neural Training with 4-bit Matrix Multiplications at Standard Formats
    目录概LogarithmicUnbiasedQuantization代码ChmielB.,BannerR.,HofferE.,YaacovH.B.andSoundryD.Accurateneuraltrainingwith4-bitmatrixmultiplicationsatstandardformats.ICLR,2023.概本文希望实现4-bit的模型训练和推理.提出了一种logarithm
  • 2024-12-22【Linux内核】解锁Linux性能:位图数据结构背后的故事
    在日常使用Linux系统的过程中,你是否遇到过系统资源紧张、运行速度缓慢的情况?面对这些问题,我们往往会寻找各种方法来提升性能。而今天要介绍的位图数据结构,就是Linux系统中解决这类问题的一把利器。它以一种简洁而高效的方式,帮助Linux系统更好地管理资源、优化数据存储和处
  • 2024-12-1624-bit 音频 与 16-bit 音频 的对比,主要通过表格形式展示它们的不同:24 bit 是指音频文件的 采样深度(bit depth)。它代表了每个采样点的数据精度,也就是音频每个样本所使用
    在音频领域,16-bit、24-bit、32-bit和64-bit已经是常见的位深,这些位深代表了音频的动态范围和精度。但如果我们进一步探讨是否存在更高的位深或是否有更高的标准,可以从几个方面来回答。1. 64-bit及更高的位深在理论上,音频位深是没有固定上限的,您可以定义更高的位深,比如128-b
  • 2024-12-15DP协议:缩略词
    缩写代表的含义ACT分配更改触发(AllocationChangeTrigger)API应用程序编程接口(ApplicationProgrammingInterface)AUX辅助(Auxiliary)BER比特错误率(BitErrorRate)bpc每色比特数(BitsPerComponent)bpp每像素比特数(BitsPerPixel)BE消隐结束(BlankingEnd)BS消隐开始(BlankingSta
  • 2024-12-11二维BIT
    简介实际上是树状数组套树状数组,用二维数组维护。支持区间操作。算法流程模板题:P4514上帝造题的七分钟考虑对二维差分数组作二阶二维前缀和。考虑对\((i,j)\)加\(d\)对查询以\((x,y)\)为矩形右下角的贡献。此时对于所有的\(a_{i\simx,j\simy}\)都有\(d\)的贡献,
  • 2024-12-09位段【结构体兄弟】
    1、什么是位段?类似结构体,但又有些不同:①、成员必须是int(signed、unsigned)形(char也ok)②、成员后面有一个冒号和一个数字(成员所占bit)structA{ inta:2; intb:5; intc:10; //后面的数字是占多少比特(bite)};位段可以在一定程度上节省空间2、位段的内存分配
  • 2024-12-09使用 Clojure 实现简单的图像边缘检测
    Clojure是一门函数式编程语言,运行于JVM平台,适合处理复杂数据和并发任务。在图像处理领域,Clojure的丰富库支持和简洁的语法能够有效实现基本图像处理任务。本文将使用Clojure实现基于Sobel算子的简单边缘检测。实现代码以下代码使用clojure.java.io和clojure.core.mat
  • 2024-12-07Memory Efficient Optimizers with 4-bit States
    目录概LPMM代码LiB.,ChenJ.andZhuJ.Memoryefficientoptimizerswith4-bitstates.NeurIPS,2023.概本文介绍了一种支持4-bit的优化器量化方法.LPMM这篇文章的工作主要继承自[8-bitoptimizer].本文的针对性改进主要有:对于Firstmoment,依旧采用dy
  • 2024-12-06新手必看!小小白也能用Rust点亮LED,入门嵌入式开发(上)
    讲动人的故事,写懂人的代码"你作为编程新手,为什么要学Rust?"我在微信里问小小白。我是一名有着30多年IT从业经验的老程序员,正在创作一本Rust编程入门书,致力于降低Rust那传说中陡峭的学习曲线。小小白是我最近在社交网络上认识的朋友,他对学习Rust充满热情。作为一名
  • 2024-12-06OpenCV 创建图像时,CV_8UC1,CV_32FC3,CV_32S等参数的含义
    形式:CV_<bit_depth>(S|U|F)C<number_of_channels>bit_depth:比特数---代表8bite,16bites,32bites,64bites...举个例子吧--比如说:如果你现在创建了一个存储--灰度图片的Mat对象,这个图像的大小为宽100,高100,那么,现在这张灰度图片中有10000个像素点,它每一个像素点在内存空间所占
  • 2024-12-068-bit Optimizers via Block-wise Quantization
    目录概8-bitOptimizersDettmersT.,LewisM.,ShleiferS.andZettlemoyerL.8-bitoptimizersviablock-wisequantization.ICLR,2022.概本文提出了一种8-bit的优化器,其主要贡献算是block-wise的量化(从我的角度看一点也不novel)?8-bitOptimizers对于
  • 2024-12-05痞子衡嵌入式:简析i.MXRT1170 XECC开启及Data Swap功能对于外部RAM的访问性能影响
    大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家分享的是i.MXRT1170XECC开启及DataSwap功能对于外部RAM的访问性能影响。文接上篇《i.MXRT1170XECC功能特点及其保护串行NORFlash和SDRAM之道》,这篇文章里痞子衡给大家介绍了XECC原理及在其使能下操作NORF
  • 2024-12-01《操作系统真相还原》| 实验记录2.0【MBR,Loader,Kernel代码汇总】
    MBR.S%include"boot.inc"SECTIONMBRvstart=0x7c00 movax,cs movds,ax moves,ax movss,ax movfs,ax movsp,0x7c00 movax,0xb800 movgs,ax mov ax,0600h mov bx,0700h mov cx,0 mov dx,184fh int 10h movbyte[gs:0x00],'1
  • 2024-11-30Air780E低功耗模组的LuatOS开发:位运算(bit)示例教程!
    本文讲述的是低功耗4G模组Air780E的LuatOS开发,关于位运算(bit)的示例教程,希望大家有所收获。一、位运算概述位运算是一种在计算机系统中对二进制数位进行操作的运算。由于计算机内部数据的存储和处理都是以二进制形式进行的,位运算能够直接对整数的二进制位进行高效操作。位运算包
  • 2024-11-26网络基础知识-1
     前言:本文只是作者整理之前学习的网络内容进行分享,如有错误也欢迎各位大佬指正。一、什么是网络?网络都是为了实现最基本的目的:网络互通什么是网络?所有想要上网的设备连接在一起什么是互通?我给你发送数据包,你给我回应数据包【互通,是双向的,一发一收】任何两个设备之间通