RuntimeError: default_program(24): error: extra text after expected end of number

时间：2023-10-25 19:22:05浏览次数：43

标签：24 __ float end extra torch ids input output

详细报错

Traceback (most recent call last):
  File "eval_roberta_qa.py", line 24, in <module>
    output = model(input_ids, attention_mask, token_type_ids)
  File "/home/rzhang/miniconda3/envs/vamc/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
RuntimeError: default_program(24): error: extra text after expected end of number

default_program(29): error: extra text after expected end of number

2 errors detected in the compilation of "default_program".

nvrtc compilation failed: 

#define NAN __int_as_float(0x7fffffff)
#define POS_INFINITY __int_as_float(0x7f800000)
#define NEG_INFINITY __int_as_float(0xff800000)


template<typename T>
__device__ T maximum(T a, T b) {
  return isnan(a) ? a : (a > b ? a : b);
}

template<typename T>
__device__ T minimum(T a, T b) {
  return isnan(a) ? a : (a < b ? a : b);
}

extern "C" __global__
void fused_mul_div_add(float* t0, float* t1, float* aten_add, float* aten_mul) {
{
  float t1_1 = __ldg(t1 + (512 * blockIdx.x + threadIdx.x) % 384);
  if (blockIdx.x<1 ? 1 : 0) {
    if (512 * blockIdx.x + threadIdx.x<384 ? 1 : 0) {
      if (blockIdx.x<1 ? 1 : 0) {
        aten_mul[512 * blockIdx.x + threadIdx.x] = t1_1 * -3.402823466385289e+38.f;
      }
    }
  }
  float v = __ldg(t0 + ((512 * blockIdx.x + threadIdx.x) % 384 + 384 * (((512 * blockIdx.x + threadIdx.x) / 384) % 384)) + 147456 * (((512 * blockIdx.x + threadIdx.x) / 147456) % 12));
  aten_add[(((512 * blockIdx.x + threadIdx.x) % 384 + ((512 * blockIdx.x + threadIdx.x) / 1769472) * 1769472) + 384 * (((512 * blockIdx.x + threadIdx.x) / 384) % 384)) + 147456 * (((512 * blockIdx.x + threadIdx.x) / 147456) % 12)] = v / 8.f + t1_1 * -3.402823466385289e+38.f;
}
}

问题描述

我在尝试进行torchscri推理时，具体代码如下，这里output在第一次是能够正常输出的，在第二次就出现了上面的报错

model = torch.jit.load(torchscript_path)

model.to("cuda:0")
model.eval()
with open(datalist_txt, "r")as fr:
    lines = fr.readlines()
    for index in tqdm(range(len(lines))):

        data = np.load(lines[index].strip())
       
        input_ids = torch.tensor(data["input_0"], dtype=torch.int32).to("cuda:0")
        attention_mask = torch.tensor(data["input_1"], dtype=torch.int32).to("cuda:0")
        token_type_ids = torch.tensor(data["input_2"], dtype=torch.int32).to("cuda:0")
        output = model(input_ids, attention_mask, token_type_ids)
        output = output.cpu().detach().numpy()
        out_npz = {"output_0": output}
        np.savez(f"output_path/out_{str(index).zfill(6)}.npz")

原因分析：

torch版本： torch==1.8.1+cu11

博客参考：https://discuss.pytorch.org/t/second-forward-call-of-torchscripted-module-breaks-on-cuda/124291

总结而言就是torch版本太老， 必须大于1.12.0，这是默认设置nvFuser的第一个版本

装上1.13.1问题解决

标签：24,__,float,end,extra,torch,ids,input,output
From： https://www.cnblogs.com/xle97/p/17787946.html

B1024 题解
本着10月杂题题解只记重量级的原则，再加上这个系列好久没更新了，搞一发。原题链接发挥还可以的一场，至少比csp-s发挥的好。T1智慧概率题，考场差点出来，30pts。T2简单计数题，之前几场都卡T2，终于出来一次，100pts。T3简单数据结构题，打的30pts暴力，但是有50pts。T4智慧......
Media Encoder 2024：掌控未来视界的超凡编码神器
MediaEncoder2024，这是一款尖端的视频编码软件，它将为您打开一扇全新的视界之门。这款软件不仅具备高度的灵活性和精确性，还拥有强大的功能和出色的性能，使您能够轻松应对各种复杂的视频编码需求。→→↓↓载MediaEncoder2024mac/win版MediaEncoder2024支持多种视频格式和编......
2024年放假安排
节日假期调休天数元旦12月30日~1月1日无调休共3天春节2月10日~2月17日2月4日(周日)、2月18日(周日)上班共8天清明节4月4日~4月6日4月7日(周日)上班共3天劳动节5月1日~5月5日4月28日(周日)、5月11日(周六)上班共5天端午节6月8日~6月10日无调......
eslint提示 xxx should be listed in the project's dependencies
有时候手动安装了一个npm包A，npm包A里面包含了npm包B，这时候如果importxxxfrom'npm包B';eslint会报错，提示npm包B不在package.json里面解决方法：在eslintrc.js增加配置module.exports={rules:{'import/no-extraneous-dependencies':[0,......
「Log」2023.10.24 小记
序幕/尾声昨天跑了\(1000m\)，晚上享受到了优质睡眠。虽说肌肉有点疼，但无压力起床，状态拉满。下楼之后感觉没想象中那么冷，大抵跟昨天莫名其妙的霾有关系。附近在装修，到处都是尘土，但天还是很蓝。\(\text{6:50}\)：慵懒到校，整整博客，今天准备写写猪国杀。\(\text{7:30}\)：模拟赛开题......
ChatGPT 问答00024 10亿小片段文本推荐用什么数据库记录
对于这种大规模的文本数据，一种可能的解决方案是使用分布式数据库系统，它能够有效地处理和查询大量数据。以下是一些可能的选择：ApacheCassandra：Cassandra是一个高度可扩展的分布式数据库，特别适合处理大量数据跨多个数据中心和云服务。它提供了高性能和无单点故障等特点。Goog......
centos7安装Docker（2023/10/24）
centos7安装Docker（2023/10/24）一、安装前必读系统配置方面，这里使用的是Centos7Linux内核：官方建议3.10以上。注意：本文的命令使用的是root用户登录执行，非root用户所有命令前面要加sudo1.查看当前的内核版本1uname-r如图为3.10，满足条件。 2.使用root权限更......
20231024学习总结
Java抽象类在面向对象的概念中，所有的对象都是通过类来描绘的，但是反过来，并不是所有的类都是用来描绘对象的，如果一个类中没有包含足够的信息来描绘一个具体的对象，这样的类就是抽象类。抽象类除了不能实例化对象之外，类的其它功能依然存在，成员变量、成员方法和构造方法的访问方式......
10.24
今天学习了使用mybatis通过注解的方式实现对数据库最基本的增删改查定义了一个Emp的类对象Emp.javapackagecom.itheima.mybatisdatabaseexample.pojo;importlombok.AllArgsConstructor;importlombok.Data;importlombok.NoArgsConstructor;importjava.time.LocalDat......
2023.10.24——每日总结
学习所花时间（包括上课）：9h代码量（行）：0行博客量（篇）：1篇今天，上午学习，下午学习；我了解到的知识点：1.mybatis明日计划：学习......

RuntimeError: default_program(24): error: extra text after expected end of number

相关文章

赞助商

阅读排行