msgbartop
平凡的生活,默默的期待,等待蜕变的到来……
msgbarbottom

12 一 10 中文汉字的正则字符编码范围

中文编码范围,中文汉字的正则也许用的着。

双字节字符编码范围:

1. GBK (GB2312/GB18030)

1
2
3
4
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文gb2312
\x80-\xff 中文 gbk

2. UTF-8 (Unicode)

1
2
3
4
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文)
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)

Leave a Comment