首页 > 其他分享 >RuntimeError: default_program(24): error: extra text after expected end of number

RuntimeError: default_program(24): error: extra text after expected end of number

时间:2023-10-25 19:22:05浏览次数:30  
标签:24 __ float end extra torch ids input output

详细报错

Traceback (most recent call last):
  File "eval_roberta_qa.py", line 24, in <module>
    output = model(input_ids, attention_mask, token_type_ids)
  File "/home/rzhang/miniconda3/envs/vamc/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
RuntimeError: default_program(24): error: extra text after expected end of number

default_program(29): error: extra text after expected end of number

2 errors detected in the compilation of "default_program".

nvrtc compilation failed: 

#define NAN __int_as_float(0x7fffffff)
#define POS_INFINITY __int_as_float(0x7f800000)
#define NEG_INFINITY __int_as_float(0xff800000)


template<typename T>
__device__ T maximum(T a, T b) {
  return isnan(a) ? a : (a > b ? a : b);
}

template<typename T>
__device__ T minimum(T a, T b) {
  return isnan(a) ? a : (a < b ? a : b);
}

extern "C" __global__
void fused_mul_div_add(float* t0, float* t1, float* aten_add, float* aten_mul) {
{
  float t1_1 = __ldg(t1 + (512 * blockIdx.x + threadIdx.x) % 384);
  if (blockIdx.x<1 ? 1 : 0) {
    if (512 * blockIdx.x + threadIdx.x<384 ? 1 : 0) {
      if (blockIdx.x<1 ? 1 : 0) {
        aten_mul[512 * blockIdx.x + threadIdx.x] = t1_1 * -3.402823466385289e+38.f;
      }
    }
  }
  float v = __ldg(t0 + ((512 * blockIdx.x + threadIdx.x) % 384 + 384 * (((512 * blockIdx.x + threadIdx.x) / 384) % 384)) + 147456 * (((512 * blockIdx.x + threadIdx.x) / 147456) % 12));
  aten_add[(((512 * blockIdx.x + threadIdx.x) % 384 + ((512 * blockIdx.x + threadIdx.x) / 1769472) * 1769472) + 384 * (((512 * blockIdx.x + threadIdx.x) / 384) % 384)) + 147456 * (((512 * blockIdx.x + threadIdx.x) / 147456) % 12)] = v / 8.f + t1_1 * -3.402823466385289e+38.f;
}
}

问题描述

我在尝试进行torchscri推理时, 具体代码如下, 这里output在第一次是能够正常输出的, 在第二次就出现了上面的报错

model = torch.jit.load(torchscript_path)

model.to("cuda:0")
model.eval()
with open(datalist_txt, "r")as fr:
    lines = fr.readlines()
    for index in tqdm(range(len(lines))):

        data = np.load(lines[index].strip())
       
        input_ids = torch.tensor(data["input_0"], dtype=torch.int32).to("cuda:0")
        attention_mask = torch.tensor(data["input_1"], dtype=torch.int32).to("cuda:0")
        token_type_ids = torch.tensor(data["input_2"], dtype=torch.int32).to("cuda:0")
        output = model(input_ids, attention_mask, token_type_ids)
        output = output.cpu().detach().numpy()
        out_npz = {"output_0": output}
        np.savez(f"output_path/out_{str(index).zfill(6)}.npz")

原因分析:

torch版本: torch==1.8.1+cu11

博客参考:https://discuss.pytorch.org/t/second-forward-call-of-torchscripted-module-breaks-on-cuda/124291

总结而言就是torch版本太老, 必须大于1.12.0, 这是默认设置nvFuser的第一个版本

装上1.13.1问题解决

标签:24,__,float,end,extra,torch,ids,input,output
From: https://www.cnblogs.com/xle97/p/17787946.html

相关文章

  • B1024 题解
    本着10月杂题题解只记重量级的原则,再加上这个系列好久没更新了,搞一发。原题链接发挥还可以的一场,至少比csp-s发挥的好。T1智慧概率题,考场差点出来,30pts。T2简单计数题,之前几场都卡T2,终于出来一次,100pts。T3简单数据结构题,打的30pts暴力,但是有50pts。T4智慧......
  • Media Encoder 2024:掌控未来视界的超凡编码神器
    MediaEncoder2024,这是一款尖端的视频编码软件,它将为您打开一扇全新的视界之门。这款软件不仅具备高度的灵活性和精确性,还拥有强大的功能和出色的性能,使您能够轻松应对各种复杂的视频编码需求。→→↓↓载MediaEncoder2024mac/win版MediaEncoder2024支持多种视频格式和编......
  • 2024年放假安排
    节日假期调休天数元旦12月30日~1月1日无调休共3天春节2月10日~2月17日2月4日(周日)、2月18日(周日)上班共8天清明节4月4日~4月6日4月7日(周日)上班共3天劳动节5月1日~5月5日4月28日(周日)、5月11日(周六)上班共5天端午节6月8日~6月10日无调......
  • eslint提示 xxx should be listed in the project's dependencies
    有时候手动安装了一个npm包A,npm包A里面包含了npm包B,这时候如果importxxxfrom'npm包B';eslint会报错,提示npm包B不在package.json里面 解决方法:在eslintrc.js增加配置module.exports={rules:{'import/no-extraneous-dependencies':[0,......
  • 「Log」2023.10.24 小记
    序幕/尾声昨天跑了\(1000m\),晚上享受到了优质睡眠。虽说肌肉有点疼,但无压力起床,状态拉满。下楼之后感觉没想象中那么冷,大抵跟昨天莫名其妙的霾有关系。附近在装修,到处都是尘土,但天还是很蓝。\(\text{6:50}\):慵懒到校,整整博客,今天准备写写猪国杀。\(\text{7:30}\):模拟赛开题......
  • ChatGPT 问答00024 10亿小片段文本推荐用什么数据库记录
    对于这种大规模的文本数据,一种可能的解决方案是使用分布式数据库系统,它能够有效地处理和查询大量数据。以下是一些可能的选择:ApacheCassandra:Cassandra是一个高度可扩展的分布式数据库,特别适合处理大量数据跨多个数据中心和云服务。它提供了高性能和无单点故障等特点。Goog......
  • centos7安装Docker(2023/10/24)
    centos7安装Docker(2023/10/24)一、安装前必读系统配置方面,这里使用的是Centos7Linux内核:官方建议3.10以上。注意:本文的命令使用的是root用户登录执行,非root用户所有命令前面要加sudo1.查看当前的内核版本1uname-r如图为3.10,满足条件。 2.使用root权限更......
  • 20231024学习总结
    Java抽象类在面向对象的概念中,所有的对象都是通过类来描绘的,但是反过来,并不是所有的类都是用来描绘对象的,如果一个类中没有包含足够的信息来描绘一个具体的对象,这样的类就是抽象类。抽象类除了不能实例化对象之外,类的其它功能依然存在,成员变量、成员方法和构造方法的访问方式......
  • 10.24
    今天学习了使用mybatis通过注解的方式实现对数据库最基本的增删改查定义了一个Emp的类对象Emp.javapackagecom.itheima.mybatisdatabaseexample.pojo;importlombok.AllArgsConstructor;importlombok.Data;importlombok.NoArgsConstructor;importjava.time.LocalDat......
  • 2023.10.24——每日总结
    学习所花时间(包括上课):9h代码量(行):0行博客量(篇):1篇今天,上午学习,下午学习;我了解到的知识点:1.mybatis明日计划:学习......