在工作中經常讀寫文本文件,在讀文件時,需要按開頭的兩個字節判斷文件格式,然后按該格式讀文件中的內容。
寫文件時,也要按目標文件指定的格式來寫入,只有這樣才能讓后續的環境正確讀入。
1 查看格式
在vs2010開發環境打開某個文件,然后從菜單上, 文件--高級保存選項,就可看到當前文件的編碼格式。
比如,xx.cs,xx.cshtml文件看到的是[簡體中文(GB2312)-代碼頁936],就是GB2312。
xx.xml文件看到的是[Unicode(UTF-8帶簽名)-代碼頁65001],就是UTF-8。
常用的格式有:ASCII,UTF-8,UTF-7,UTF-32,Unicode,GB2312 。
2 讀格式文件為
1
2
3
4
|
Encoding encode=Encoding.GetEncoding( "GB2312" )); 可以使用后附的類,先讀文件的編碼格式 encode = fileEncode.GetFileEncodeType( "in_file.txt" ); string strStr1 = File.ReadAllText( "in.txt" , encode); |
3 寫格式文件為
1
2
3
|
StreamWriter sw = new StreamWriter( "out.txt" , false , Encoding.GetEncoding( "ASCII" )); sw.Write( "12.3" ); sw.Close(); |
4 根據文件的編碼格式讀寫文件的完整代碼
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
|
using System; using System.Collections.Generic; using System.Linq; using System.Xml; using System.IO; using System.Configuration; using System.Text; namespace WebApplication1 { //=1=按文件編碼格式讀寫 public partial class _Default : System.Web.UI.Page { string proj_name = "" ; protected void Page_Load( object sender, EventArgs e) { string xml_in_file= "c:\\part.xml" ; //輸入片段,其它程序生成的是一個節點 string xml_out_file= "c:\\all.xml" ; //整體,新節點片段,要追加到其尾部 //1 讀入輸入文件的編碼格式,并按其編碼全部讀入文本 Encoding encode1 = fileEncode.GetFileEncodeType(xml_in_file); StringBuilder strSb1 = new StringBuilder(); string strStr1 = File.ReadAllText(xml_in_file, encode1); // StringBuilder strSb = new StringBuilder(); strSb.Clear(); //2 讀入輸出文件的編碼格式,并按其編碼全部讀入文本 Encoding encode6 = fileEncode.GetFileEncodeType(xml_out_file); strSb.AppendFormat( "{0} \r\n" , File.ReadAllText(xml_out_file, encode6)); strSb.Replace(strStr1, "" ); //舊的同名段落替換為空 //新節點片段,替換整體末尾標簽,即是加入到末尾 strSb.Replace( "</object_set>" , strStr1 + "\r\n" + "</object_set>" ); //新的插入到末尾 // FileInfo myFile = new FileInfo(xml_out_file); // StreamWriter sw = myFile.CreateText(); StreamWriter sw = new StreamWriter(xml_out_file, false , encode6); //Encoding.GetEncoding("GB2312")); sw.Write(strSb.ToString()); sw.Close(); } } //=2=獲得文件編碼格式的類 public class fileEncode { //獲得文件編碼格式的類 public static System.Text.Encoding GetFileEncodeType( string filename) { System.IO.FileStream fs = new System.IO.FileStream(filename, System.IO.FileMode.Open, System.IO.FileAccess.Read); System.IO.BinaryReader br = new System.IO.BinaryReader(fs); Byte[] buffer = br.ReadBytes(2); br.Close(); fs.Close(); if (buffer[0] >= 0xEF) { if (buffer[0] == 0xEF && buffer[1] == 0xBB) { return System.Text.Encoding.UTF8; } else if (buffer[0] == 0xFE && buffer[1] == 0xFF) { return System.Text.Encoding.BigEndianUnicode; } else if (buffer[0] == 0xFF && buffer[1] == 0xFE) { return System.Text.Encoding.Unicode; } else { return System.Text.Encoding.Default; } } else { return System.Text.Encoding.Default; } } } } |
以上就是C#讀寫指定編碼格式文本文件的方式方法,希望對大家的學習有所幫助。