• 2024-01-17Spark-Yarn模式部署
    Spark-Yarn模式部署1.解压缩文件将spark-3.0.0-bin-hadoop3.2.tgz文件上传到linux并解压缩,放置在指定位置。#在/opt/software中tar-zxvfspark-3.0.0-bin-hadoop3.2.tgz-C/opt/modulecd/opt/modulemvspark-3.0.0-bin-hadoop3.2spark2.修改配置文件修改hadoop配
  • 2023-11-30spark提交参数 [spark.yarn.dist.jars] 和 [spark.yarn.jars ]区别
    spark.yarn.dist.jars作用用于指定分发到集群节点上的JAR包的路径。工作原理Spark应用程序的执行器会将这些JAR包分发到它们的本地文件系统上。这样,应用程序可以在执行期间访问这些JAR包。使用场景适用于应用程序的依赖项,这些依赖项不需要在整个集群中共
  • 2023-10-08笨办法学Python3 习题26 恭喜你,现在可以考试了!
    下载代码learnpythonthehardway.org/python3/exercise26.txt进行修改1print("Howoldareyou?",end='')2age=input()3print("Howtallareyou?",end='')4height=input()#没有input()5prin
  • 2023-10-06笨办法学Python3 习题24 更多的练习
    根据书中的PowerShell运行结果,进行仿写 beans,jars,crates=secret_formula(start_point)#函数运算结果存储方式一print(f"We'dhave{beans}beans,{jars}jars,and{crates}crates.") formula=secret_formula(start_point)        #两种函数运
  • 2023-05-11spark-sql 启动客户端报错问题
    1.spark-sql启动报错java.lang.NoClassDefFoundError:org/apache/tez/dag/api/SessionNotRunning原因:在启动时找不到tez的jar包解决方法:将tez目录下的tez-api-0.9.1.jar复制一份到spark的jars目录下cptez-api-0.9.1.jar/usr/hdp/current/spark2-client/jars/分发到其他
  • 2023-03-31azure databricks使用external hive metastore跨工作区共享元数据
    为什么要使用externalhivemetastore可以跨workspace的共享元数据,不用每次创建workspace的时候都重复的把元数据重建一次。更好的元数据集中管理,Createonce,useeverywhere。为灾难恢复(DR)做好为准备,并降低复杂性。(PAAS一样会存在意外的,不要以为不会,所以DR是必须的)可以更好控
  • 2023-03-28Creating a new Storm project
    CreatinganewStormprojectThispageoutlineshowtosetupaStormprojectfordevelopment.Thestepsare:AddStormjarstoclasspathIfusingmultilang,add
  • 2022-12-06【原创】Databricks 更改hive metastore version
    在DatabricksRuntime7.0及更高版本上,Hive1.2.0和1.2.1不是内置的元存储。如果要将Hive1.2.0或1.2.1与DatabricksRuntime7.0及更高版本一起使用,请按照[下
  • 2022-10-06【笨方法学python】ex24 - 更多练习
    代码如下:点击查看代码#coding=utf-8#更多练习print"Let'spracticeeverything."print'You\'dneedtoknow\'boutescapeswith\\thatdo\nnewlinesand