invalidate the cache in Spark by running 'REFRESH TABLE tableName' command in SQL or by re

时间：2023-07-18 20:56:16浏览次数：36

标签：invalidate recreating Iterator scala involved anon apache org spark

	... 1 more
Caused by: java.io.FileNotFoundException: File does not exist: hdfs://ns1/user/hive/warehouse/dw.db/dw_uniswapv3_position_detail/pk_day=1689552000000/part-00000-bbe52b3b-4963-4c76-9ba9-e315305baed7.c000
It is possible the underlying files have been updated. You can explicitly invalidate the cache in Spark by running 'REFRESH TABLE tableName' command in SQL or by recreating the Dataset/DataFrame involved.
	at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.org$apache$spark$sql$execution$datasources$FileScanRDD$$anon$$readCurrentFile(FileScanRDD.scala:129)
	at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.nextIterator(FileScanRDD.scala:179)
	at org.apache.spark.sql.execution.datasources.FileScanRDD$$anon$1.hasNext(FileScanRDD.scala:103)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)
	at scala.collection.Iterator$$anon$13.hasNext(Iterator.scala:462)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:409)
	at org.apache.spark.shuffle.sort.UnsafeShuffleWriter.write(UnsafeShuffleWriter.java:187)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
	at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:55)
	at org.apache.spark.scheduler.Task.run(Task.scala:121)
	at org.apache.spark.executor.Executor$TaskRunner$$anonfun$11.apply(Executor.scala:407)
	at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1408)
	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:413)
	... 3 more

在写入之前，由于meta发生了修改，所以需要刷新表，这里需要注意的是在SQL插入和dataFrame插入下，刷新表的语句不同。

#sparksql模式
spark.sql("REFRESH TABLE db.tablename")

# dataframe模式
spark.Catalog.refreshTable("db.tablename")

标签：invalidate,recreating,Iterator,scala,involved,anon,apache,org,spark
From： https://www.cnblogs.com/30go/p/17564104.html

Oracle统计信息之NO_INVALIDATE参数
文档课题：Oracle统计信息之NO_INVALIDATE参数.1、理论知识Oracle统计信息对于CBO至关重要.RBO建立在数据结构的基础上，DDL结构、约束会将SQL语句分为不同的成本结构等级.而CBO是在数据结构的基础上加入数据表细粒度信息，将成本结构细化为成本cost值.相对于数据表的DDL结构，统计信息反......
GDI-InvalidateRect使客户区矩形区域的图形变得无效
RECTrect;::GetClientRect(m_hWnd,&rect);//获取窗口客户区的坐标BOOLb=::InvalidateRect(m_hWnd,&rect,TRUE);//使客户区矩形区域的图形变得无效/*使原来画的图像无效参数1：HWNDhWnd窗口句柄如果为NULL，则系统将在函数返......
项目一众筹网02_2_管理员登录(转发改成重定向到主页面、退出登录（转发和重定向的区别、
系列文章目录文章目录系列文章目录12-管理员登录-重定向到主页面13-管理员登录-退出登录14-管理员登录-抽取后台主页面新建jsp模板......
C# get form to invalidate when form is resized?
我刚刚接受了一个挑战，创建一个64个相同矩形或正方形的颜色交替的棋盘，从技术上来说，我已经完成了这个挑战；但是出于好奇，我注意到当用户调整窗体的大小并拖动它时，窗体会一直重......
idea每次启动后,均要执行Invalidate Caches操作,否则会有部分引入的依赖飘红；
背景:随着项目代码量的增加,某日启动idea后,部分引入的依赖漂红;每一次启动idea后,均要执行清除缓存才能使用;file-->InvalidateCaches…解决方案:help-->EditCus......
有关Idea的Invalidate Caches/Restart (Idea本地缓存异常，导致Idea无法识别Maven依赖)
分析原因：有时我们自己在编写项目后，再次打开会发现自己封装的类，导入后还是爆红。这是因为Idea本地缓存异常，导致Idea无法识别Maven依赖，从而无法找到某些类。解决方式：通过Idea......

invalidate the cache in Spark by running 'REFRESH TABLE tableName' command in SQL or by re

相关文章

赞助商

阅读排行