1
|
|
經常遇到這樣內容的json字符串,原來是把其中的漢字做了Unicode編碼轉換。
Unicode編碼:
將漢字進行UNICODE編碼,如:“王”編碼后就成了“\王”,UNICODE字符以\u開始,后面有4個數字或者字母,所有字符都是16進制的數字,每兩位表示的256以內的一個數字。而一個漢字是由兩個字符組成,于是就很容易理解了,“738b”是兩個字符,分別是“73”“8b”。但是在將 UNICODE字符編碼的內容轉換為漢字的時候,字符是從后面向前處理的,所以,需要把字符按照順序“8b”“73”進行組合得到漢字。
Unicode/漢字互轉實現:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
/// <summary> /// <summary> /// 字符串轉Unicode /// </summary> /// <param name="source">源字符串</param> /// <returns>Unicode編碼后的字符串</returns> public static string String2Unicode( string source) { byte [] bytes = Encoding.Unicode.GetBytes(source); StringBuilder stringBuilder = new StringBuilder(); for ( int i = 0; i < bytes.Length; i += 2) { stringBuilder.AppendFormat( "\\u{0}{1}" , bytes[i + 1].ToString( "x" ).PadLeft(2, '0' ), bytes[i].ToString( "x" ).PadLeft(2, '0' )); } return stringBuilder.ToString(); } /// <summary> /// Unicode轉字符串 /// </summary> /// <param name="source">經過Unicode編碼的字符串</param> /// <returns>正常字符串</returns> public static string Unicode2String( string source) { return new Regex( @"\\u([0-9A-F]{4})" , RegexOptions.IgnoreCase | RegexOptions.Compiled).Replace( source, x => string .Empty + Convert.ToChar(Convert.ToUInt16(x.Result( "$1" ), 16))); } |
以上這篇.Net(c#)漢字和Unicode編碼互相轉換實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持服務器之家。