首页 > 其他分享 >Blas xGEMV launch failed : a.shape=[1,2048000,50], b.shape=[1,50,1], m=2048000, n=1, k=50

Blas xGEMV launch failed : a.shape=[1,2048000,50], b.shape=[1,50,1], m=2048000, n=1, k=50

时间:2023-09-12 14:56:02浏览次数:59  
标签:launch xGEMV 50 failed shape 2048000

Blas xGEMV launch failed : a.shape=[1,2048000,50], b.shape=[1,50,1], m=2048000, n=1, k=50

  • 问题描述:使用tensorflow2运行模型时报错:

    2 root error(s) found.
      (0) Internal:  Blas xGEMV launch failed : a.shape=[1,2048000,50], b.shape=[1,50,1], m=2048000, n=1, k=50
             [[node DIN/attention_layer/dense_2/Tensordot/MatMul (defined at /data/moto/moto_feed_recommendation/src/ranking/DIN/modules.py:28) ]]
             [[assert_greater_equal/Assert/AssertGuard/pivot_f/_3/_125]]
      (1) Internal:  Blas xGEMV launch failed : a.shape=[1,2048000,50], b.shape=[1,50,1], m=2048000, n=1, k=50
             [[node DIN/attention_layer/dense_2/Tensordot/MatMul (defined at /data/moto/moto_feed_recommendation/src/ranking/DIN/modules.py:28) ]]
    0 successful operations.
    0 derived errors ignored. [Op:__inference_train_function_12265]
    

    其中a和b相乘从数据维度来看是没问题的。

  • 解决方案:

    tensorflow-gpu的版本为2.6.0

    cudatoolkit的版本为11.2

    11.2版本的cuda中有bug,将cuda升级一下:

    conda insatll cudnn
    

    其中可以指定cudnn的版本,不指定的话就是最新的(cudnn=8.9, cudatoolkit=11.8)可以解决以上问题。

  • 其他可参考连接:

标签:launch,xGEMV,50,failed,shape,2048000
From: https://www.cnblogs.com/strolling-leisurely/p/17696175.html

相关文章

  • DC/DC电源升压模块直流线性可调高压电压控制输出升压电源5v12v24v转0-100V/110V/200V/
    特点●效率高达70%以上●1*2英寸标准封装●正负电压输出●价格低●电压控制,输出电压随控制电压线性变化●工作温度:-40℃~+85℃●阻燃封装,满足UL94-V0要求●温度特性好●可直接焊在PCB上应用GRA  系列模块电源是一种DC-DC升压变换器。该模块电源的输入电压分为:4.5~9......
  • leetcode450删除搜索二叉树的节点
    删除的二叉树节点分4种情况:叶子节点,直接删除就行左节点不为空,右节点为空;直接将左子树返回左节点为空,右节点不为空;直接将右子树返回左节点和右节点不为空;将右子树最小的节点作为根节点,返回右子树TreeNode*deleteNode(TreeNode*root,intkey){if(!root)returnn......
  • RabbitMQ - Exception (504) Reason: "channel id space exhausted"
    使用go的第三方包:github.com/rabbitmq/amqp091-go出现报错:getmqchannelerror{"error":"Exception(504)Reason:channelidspaceexhausted"}ctx:=context.Background()results,err:=global.Redis.LRange(ctx,abListName,0,-1).Result()......
  • 让Easysearch运行在LoongArch(3C5000L)上
    简介在上一次,我介绍了在国产操作系统KylinV10(Lance)-aarch64上安装单机版Easysearch/Console/Agent/Gateway/Loadgen,小伙伴们可查看原文。今天我重点介绍下在Loongnix-ServerLinuxrelease8.4.1(3C5000L)上安装Easysearch。系统配置在安装之前,需要先进行系统参数调整并......
  • 2850. 将石头分散到网格图的最少移动次数-362
    2850.将石头分散到网格图的最少移动次数给你一个大小为3*3,下标从0开始的二维整数矩阵grid,分别表示每一个格子里石头的数目。网格图中总共恰好有9个石头,一个格子里可能会有多个石头。每一次操作中,你可以将一个石头从它当前所在格子移动到一个至少有一条公共边的相邻......
  • 18、复合类型之指针(P47、P48、P49、P50);C++ primer 2.3.2
    1、C++中的“声明符”是什么?声明符是用来指定变量或函数的类型、名称和属性的符号。例如:intlist[20]; 声明了一个名为list的整型数组,它有20个元素。int是类型说明符,list[20]是声明符char*cp; 声明了一个名为cp的指向字符的指针1。*cp是声明符doublefunc(void);......
  • 相应拦截器----关注500和401
    关注相应码,不同的码对应不同的错误200没问题401说明没权限或者登录已经过期5开头的可能是后端代码出现问题了请求超时请求超时定义的毫秒来测把自己踢出去,提示登录已超时,然后报错401......
  • 【230910-1】双曲线:x^2/120^2+y^2/150^2=1图线及特征
    【图像】【代码】<!DOCTYPEhtml><htmllang="utf-8"><metahttp-equiv="Content-Type"content="text/html;charset=utf-8"/><head><title>双曲线:x^2/120^2+y^2/150^2=1</title><styletype=&qu......
  • Java基础知识面试题系列五:41~50题
    Java基础知识面试题系列三:41~50题41.值传递与引用传递有哪些区别42.不同数据类型的转换有哪些规则43.强制类型转换的注意事项有哪些44.Math类中round、ceil和floor方法的功能是什么45.++i与i++有什么区别46."<<"运算符与">>"运算符有什么异同47.char型变量中是否可以存储一个中文汉......
  • 16bit 4 通道250MS/s ADC 与 16bit 4 通道500MS/s DAC FMC AD/DA 子卡
    概要QT7351是一款高分辨率、高采样率的ADC+DACFMC子板。它同时支持4路16位250MS/s的A/D通道输入和4路16位500MS/s的D/A通道输出。板卡支持触发输入和触发输出;内参考、外参考、外时钟三种时钟方式,可通过SPI总线实现时钟源选择。通过参考时钟可实现多个板卡的同步。 QT7351板卡......