文章结尾有最新热度的文章,感兴趣的可以去看看。
本文是经过严格查阅相关权威文献和资料,形成的专业的可靠的内容。全文数据都有据可依,可回溯。特别申明:数据和资料已获得授权。本文内容,不涉及任何偏颇观点,用中立态度客观事实描述事情本身
导读
在我学习CUDA的过程中,我决定用它来应对十亿行数据挑战。
这个挑战本身很简单,但用CUDA来实现并没有这么容易。在这里,我将分享我的解决方案,它在V100显卡上运行耗时16.8秒。当然,这绝不是最快的解决方案,但它是首个此类(不使用cudf,仅手写内核)方案。我向其他CUDA爱好者发起挑战,看谁能让它运行得更快。
纯C++基准实现
那我们就先用纯C++代码做个基准实现吧。我的CUDA代码应该比这个更快才对。
实现方法很直接:逐行读取文件,解析出城市名和温度值,然后将它们累积到一个标准模板库(STL)的map
中。
标签:17,挑战,C++,CUDA,数据,十亿
From: https://blog.csdn.net/weixin_45715405/article/details/144715554