-
Hive SQL中的regexp_extract_all函数的学习
=Start= 缘由: 之前没怎么用过 regexp_extract_all 这个函数,用的比较多的是 reg…
-
在Python中尽量避免使用sys.setdefaultencoding(‘utf-8’)方法
=Start= 缘由: 之前在写与中文字符处理有关的Python代码中总喜欢使用: import sysrel…
-
Python 2 和 3 的正则匹配
=Start= 缘由: 这个标题其实起的不太准确,因为Python 2 和Python 3中的官方正则模块re…
-
如何判断字符串的编码
其实文章的标题取得有点大了,因为程序是无法准确的判断出某一字符串究竟是使用了何种编码方式的(因为一个字符串中可…
-
Unicode汉字范围[bak]
原文链接:关于unicode汉字范围正则的写法 原来我使用的一直是: \u4e00-\u9fa5 今天在匹配中…
-
获取客户端/服务端IP及地理位置信息
还是在OutOfMemory上看到的一段代码,自己修改了一下,其中的unescape()函数值得学习和搜藏,另…
-
Unicode编码解码的PHP脚本[bak]
Unicode 是基于通用字符集(Universal Character Set)的标准来发展,并且同时也以书…