首页 > 其他分享 >Hive的row_number和regexp_extract结合带来的乱码问题

Hive的row_number和regexp_extract结合带来的乱码问题

时间:2024-04-01 12:22:42浏览次数:14  
标签:number Hive 乱码 regexp extract createtime row

select
            userid,
            from_unixtime(createtime,'yyyy-MM-dd') as dateid,
            regexp_extract(browser,'^([^\\(]*).*$',1) as browser,
            operationsystem,
            device,
            row_number() over (partition by userid order by createtime) as rn
        from ods_log_full
        where module='user'
        and action='login_success'
        and from_unixtime(createtime,'yyyy-MM-dd')='2023-07-26'

如果这样的话,那么中文会出现乱码。

 暂时的解决办法时,使用hive的regexp_replace函数。这个函数没有上述的问题。

 

标签:number,Hive,乱码,regexp,extract,createtime,row
From: https://www.cnblogs.com/lhk20213937/p/18108118

相关文章

  • Hive-技术补充-ANTLR的真实语法世界
    一、上下文上一篇博客<Hive-技术补充-ANTLR语法编写>,我们了解了如何使用ANTLR语法来表达词法结构和语法结构,下面我们循循渐进的处理身边用过的一些文件或语言:CSV、JSON、DOT、Cymbol、R 二、解析CSV文件有这样一份csv文件vidata.csvDetails,Month,AmountMidBonus,Ju......
  • Enumerating Rational Numbers 题解
    EnumeratingRationalNumbers题解先下结论,这道题是一道欧拉函数板子题观察题面可以发现,生成的分数有如下特性:分数都是最简分数分母与分子互质,且分子$\le$分母当然第一个除外,那个特判即可,不用纳入考虑范围我们知道,对于任意正整数n,欧拉函数,即\(\varphi(n)\)是小......
  • js的Number对象和全局对象
    文章目录1.Number对象1.1.含义1.2.属性1.3.方法2.全局对象2.1.含义2.2.特点2.3.属性2.4.方法3.函数的本质1.Number对象1.1.含义Number对象是原始数值的包装对象。constnum=2.334;constobj=newNumber(num);console.log(obj);//Numberco......
  • (day 22)JavaScript学习笔记(内置对象1之Number、Math、Date)
    概述         这是我的学习笔记,记录了JavaScript的学习过程。在写博客的时候我会尽量详尽的记录每个知识点。如果你完全没接触过JavaScript,那么这一系列的学习笔记可能会对你有所帮助。    今天学习JavaScript内置的对象,主要是Number、Math、Date。1.内置......
  • Hive 刷题—— 每年的在校人数
    问题描述 year表示学生入学年度,num表示对应年度录取学生人数,stu_len表示录取学生的学制;说明:例如录取年度2018学制是3年,表示该批学生在校年份为2018~2019、2019~2020、2020-2021,在算每年的在校人数时,2018/2019/2020/2021年份都需要算上。示例数据 idyearnumstu_l......
  • 获取中国周的自定义函数 GetChinaWeekNumber
    报表开发,无意发现SQLServer数据库计算周跟中国周有一点不一样,一般来讲,如果新年的1月1日开始落在的周不满4天,就需要把这几天归集到上一年的周,中国周是从周一~周日,国外的是周日~周六,所以中西方周有点不一样(网上说还有闰年不一样,我没有深入了解,先了解大概,有错误请忽喷,可以用下面的函......
  • 交叉引用时产生的乱码怎么处理
    写论文时碰见一个问题,就是交叉引用后出现的不是域结果而是域代码,看着很不舒服,应该咋办呢?鼠标右键可以切换域代码,但是每次改比较麻烦,最简单的方法是直接在Word里设置。打开word-------选择“文件”----------最下面选择“更多”--------“选项”,打开Word选项窗口;如图选择“......
  • Hive 刷题——HiveSql 实现分钟级的趋势图
    问题描述在Hive中,怎么用sql实现分钟级的趋势图?比如从交易表中,如何统计0点到每分钟的交易趋势图?原表:trade_A(trade_id,pay_time(格式是2020-08-0510:30:28),pay_gmv)。希望用sql实现分钟级的0点到当前分钟的GMV。结果表:result_A(minute_rn(分钟顺序),pay_gmv_td(每分钟的交易额,都是......
  • Oracle重做日志文件clear logfile与clear unarchived logfile浅析
    首先,从v$log动态视图中观察到ARC和STATUS两个字段STATUS:分为CURRENT、ACTIVE和INACTIVE三种,当数据库进程DBWn进行一次写入,脏数据从内存刷写到redologfile中,这时承载数据写入的redologfile状态即为CURRENT;而数据从redologfile拷贝到归档目录下时处于ACTIVE状态,完成数据从内存......
  • hiveserver2拒绝连接
    一、报错内容 二、解决办法基本都是core-site.xml文件中没做好代理导致的。在文件中添加如下配置<property><name>hadoop.proxyuser.xxx.hosts</name><value>*</value></property><property><name>hadoop.proxyuser.x......