• 2025-01-05【AI学习笔记5】用C语言实现一个最简单的MLP网络 A simple MLP Neural network in C language
    用C语言实现一个最简单的MLP网络AsimpleMLPNeural NetworkinClanguage 从图像中识别英文字母【1】从图像中识别多个不同的数字,属于多分类问题;每个图像是5*5的像素矩阵,分别包含1-5五个字母数字; 网络结构:一个隐藏层的MLP网络;       每个图像是5x5个
  • 2025-01-04Coding Our First Neurons
    Chapter1:IntroducingNeuralNetwork声明:本篇博客笔记来源于《NeuralNetworksfromscratchinPython》,作者的youtube其实关于神经网络的入门博主已经写过几篇了,这里就不再赘述,附上链接。1.一文窥见神经网络2.神经网络入门(上)3.神经网络入门(下)Chapter2:C
  • 2025-01-04Activation Functions
    Chapter4:ActivationFunctions声明:本篇博客笔记来源于《NeuralNetworksfromscratchinPython》,作者的youtube其实关于神经网络的入门博主已经写过几篇了,这里就不再赘述,附上链接。1.一文窥见神经网络2.神经网络入门(上)3.神经网络入门(下)前三章内容:1.CodingOu
  • 2024-10-08Deformable DETR改进|爆改模型|涨点|在骨干网络和可变形编码器间加入YOLOv10的PSA和SCDown模块(附代码+修改教程)
    一、文本介绍本文修改的模型是Deformable-DETR,在骨干网络和可变形编码器之间加入YOLOv10的PSA和SCDown模块。其中PSA是YOLOv10提出的一种高效的自注意力模块,为了避免注意力带来的巨额开销,本文将PSA应用于可变形编码器输入的最高层级特征图。SCConv是一种空间和通道解耦的卷积
  • 2024-09-18机器翻译之创建Seq2Seq的编码器、解码器
    1.创建编码器、解码器的基类1.1创建编码器的基类fromtorchimportnn#构建编码器的基类classEncoder(nn.Module):#继承父类nn.Moduledef__init__(self,**kwargs):#**kwargs:不定常的关键字参数super().__init__(**kwargs)defforwa
  • 2024-09-04深入理解神经网络:从基础到深度学习
    深入理解神经网络:从基础到深度学习前言1.神经元模型的构建代码示例:M-P神经元模型2.感知机与多层网络的实现代码示例:简单感知机模型3.误差逆传播算法(BP)的实践代码示例:BP算法的简化实现4.探索全局最小与局部极小5.常见的神经网络模型6.深度学习的前沿应用结语
  • 2024-08-28CrossEntropy Loss 计算实例讲解
    CrossEntropyLoss整个计算过程前提条件:分类标签labels和模型输出结果outputs=model(inputs)outputs为一个未经过softmax的logits向量
  • 2024-08-17区块链编程go(四)-交易
     part1:packageblockchainimport("bytes""crypto/sha256""encoding/gob""encoding/hex""fmt""log")typeTransactionstruct{ID[]byteInputs[]TxIn
  • 2024-07-31二十五、【机器学习】-【Python手搓3层神经网络】:从零构建深度学习模型的实战指南
    目录一、序章:为什么你需要掌握手搓神经网络二、基础篇:神经网络基础知识回顾三、实战配置:搭建3层神经网络的步骤与技巧(一)、__init__ 方法初始化神经网络(二)、train 方法实现了前向传播和反向传播(三)、query 方法(四)、全部代码四、总结一、序章:为什么你需要掌握手
  • 2024-07-02快速调用 GLM-4-9B-Chat 语言模型
    一、确认本机显卡配置二、下载大模型国内可以从魔搭社区下载,下载地址:https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat/files  三、运行官方代码 importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizerdevice="cuda"tokenizer=Aut
  • 2024-06-06GLM-4已经“低调”开源了
    GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出较高的性能。除了能进行多轮对话,GLM-4-9B-Chat还具备网页浏览、代码执行、自定义
  • 2024-05-29损失函数代码
    这个是从代码层面,详细了解损失函数!CrossEntropyLoss importtorchimporttorch.nnasnn#实际中遇到的outputs=torch.tensor([[0.5870,0.4130],[0.6517,0.3483],[0.4455,0.5545],[0.4
  • 2024-03-05AI时代:开源大模型选择
    https://docs.llamaindex.ai/en/stable/module_guides/models/llms.html可以按参数和评分来选择模型:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboardllama2-chat-7b4bit(huggingface)Llama2seemstobequitechatty,whichmakesparsingstructuredo
  • 2024-02-13risinglight-tutorial 学习笔记
    01-01hello-sql该示例提供了一个将Sql解析为语法树并返回select'hello';中字符串的逻辑其核心逻辑如下:pubfnrun(&self,sql:&str)->Result<Vec<String>,Error>{//parse--借用开源的PostgreSqlDialect进行Sql的解析//来自sqlparser-0.13.0
  • 2024-01-25(十二):Logstash简介
    1、Logstash的概念Logstash是一个开源数据收集引擎,具有实时管道功能。Logstash可以动态地将来自不同数据源的数据统一起来,并将数据标准化到选择的目的地。2、Logstash的特点2.1、日志与指标Logstash可以处理所有类型的日志数据,轻松地摄取大量的web日志(如Apache)和应
  • 2024-01-11Gradio:快速构建你的webApp
    1.什么是Gradio如果你了解web开发,一定会知道开发一款webApp需要涉及很多技术栈:前端:HTML+CSS+JS(可能会涉及不同的CSS框架和JS框架如jqueryVUEreact等)后端语言:如python/javaweb容器:如flask/tomcat如果你只会python,又不想重头学习上述技术,你要怎么办?据我所知,有两种解决方案:s
  • 2023-12-23利用Python select模块实现多路I/O复用
    在开发网络服务时,能够同时处理多个网络连接是非常重要的。传统的方法是为每个连接创建一个新线程或进程,但这在大规模时可能会导致资源耗尽。更高效的做法是使用I/O多路复用,让一个线程能够监视多个文件描述符的状态变化。在Python中,我们可以通过select模块来实现这一功能。本文将介
  • 2023-12-06神经网络Python代码完整版及其代码解析
     1、读取数据集和标签集1defloadDataSet():2data=[]3label=[]4fr=open('testSet.txt')5forlineinfr.readlines():#循环读写,fr是一个已经打开的文件对象,readline()函数会读取文件中的一行内容6lineArr=lin
  • 2023-11-20鸿蒙原生应用/元服务开发-AGC分发如何编译打包应用
    软件包规范在正式打包应用前,请确保已了解HarmonyOS应用软件包规范。操作步骤1.打开DevEcoStudio,菜单选择“Build>BuildHap(s)/APP(s)>BuildAPP(s)”。2.等待编译构建。编译完成后,将在工程目录“build>outputs>default”目录下,获取可用于发布的应用包。APIVersion4至7
  • 2023-11-19简单神经网络(py)
    1importnumpy2#激活函数库3importscipy.special45importmatplotlib.pyplot67#neutralnetworkclassdefinition8classneutralNetwork:9def__init__(self,inputnodes,hiddennodes,outputnodes,learningrate):10#定义各个
  • 2023-11-10polygraphy介绍
    Polygraphy目录Polygraphy工具说明依赖&安装功能&Toolsrunloggingrunnermodelonnxtensorrtdataloadercomparator使用示例convertdebuginspectsurgeonruncomparisonmetricsgenerating_comparison_scriptcomparing_onnx&engine1comparing_onnx&engine2comparing_onnx&eng
  • 2023-08-30NLP原理系列1-说清楚transformer原理
    NLP原理系列1-说清楚transformer原理来用思维导图和截图描述。思维导图的本质是变化(解决问题)->更好的,或者复杂问题拆分为小问题以及拆分的思路。 参考链接:李宏毅transformer原理。 一tansformer的推理及训练过程1tf训练过程红框部分是训练得grandtruth,
  • 2023-08-20 a build cache key that uniquely defines the task’s outputs based on its inputs
    BuildCachehttps://docs.gradle.org/current/userguide/build_cache.htmlTheGradle buildcache isacachemechanismthataimstosavetimebyreusingoutputsproducedbyotherbuilds.Thebuildcacheworksbystoring(locallyorremotely)buildoutputsan
  • 2023-06-02使用GAN进行异常检测——可以进行网络流量的自学习哇,哥哥,人家是半监督,无监督的话,还是要VAE,SAE。
    实验了效果,下面的还是图像的异常检测居多。https://github.com/LeeDoYup/AnoGANhttps://github.com/tkwoo/anogan-keras看了下,本质上是半监督学习,一开始是有分类模型的。代码如下,生产模型和判别模型:###generatormodeldefinedefgenerator_model():inputs=Input((10,))