今天继续学习spark,完成了实验三和实验四,实验三配置环境之前基本已经完成了 虚拟机截图如下
实验四上来遇到了一个问题,就是我的sparkshell找不到本地文件的路径,因此我选择把他上传到了hdfs中,查阅资料的时候发现这可能是因为spark检索文件的时候是从不同的节点上检索,所以需要保证这个文件在三台虚拟机上的同一个位置都存在才行,这样做无疑是很麻烦的,因此用hdfs会方便一些,默认也是从hdfs检索
标签:检索,2024.1,21,hdfs,日报,虚拟机,实验,spark From: https://www.cnblogs.com/Arkiya/p/17977584