-
学习了解数据仓库中的分层概念
=Start= 缘由: 以下关于数据仓库分层的内容,基本都是引用文章【数据仓库–通用的数据仓库分层…
-
Hive SQL中的单引号和双引号
=Start= 缘由: 最近又花费了一些时间在处理Hive SQL中的单双引号问题上,感觉需要再专门记录一下,…
-
从Hive SQL的一个正则表达式说起
=Start= 缘由: 目标,用Hive SQL的正则表达式匹配出IPv4中 172 段的私有IP地址(172…
-
Hive SQL如何找出连续日期数据之间的较大波动
=Start= 缘由: 用Hive SQL做一些异常分析时经常会面临的几个问题,比如: 简单的说,就是拿各自当…
-
Hive SQL如何找出最大的连续操作天数
=Start= 缘由: 数据运营人员常常会需要查找活跃用户名单,而活跃用户很多情况下被定义为连续在线n天及以上…
-
Hive SQL 中的分号、下划线等tips整理
=Start= 缘由: 简单整理一下近期在进行 Hive SQL 查询时碰到的一些问题和经验,方便后面有需要的…
-
Hive 中 map 类型字段的常用方法学习
=Start= 缘由: Hive支持原始数据类型和复杂类型,原始类型包括数值型,Boolean,字符串,时间戳…
-
Flink的简单学习和macOS系统上的本地环境搭建
=Start= 缘由: 上周有时间的时候又重新简单学习了一下Flink的相关知识,并根据网上的文章尝试在mac…
-
Hive array_except GenericUDF编写
=Start= 缘由: 简单整理一下如何快速将 Apache Hive 在 GitHub 上新加的 UDF/G…