問題
怎樣將C中的字符串轉換為Python字節(jié)或一個字符串對象?
解決方案
C字符串使用一對 char *
和 int
來表示, 你需要決定字符串到底是用一個原始字節(jié)字符串還是一個Unicode字符串來表示。 字節(jié)對象可以像下面這樣使用 Py_BuildValue()
來構建:
1
2
3
4
5
|
char *s; /* Pointer to C string data */ int len; /* Length of data */ /* Make a bytes object */ PyObject *obj = Py_BuildValue( "y#" , s, len); |
如果你要創(chuàng)建一個Unicode字符串,并且你知道 s 指向了UTF-8編碼的數據,可以使用下面的方式:
1
|
PyObject *obj = Py_BuildValue( "s#" , s, len); |
如果 s
使用其他編碼方式,那么可以像下面使用 PyUnicode_Decode()
來構建一個字符串:
1
2
3
4
5
|
PyObject *obj = PyUnicode_Decode(s, len, "encoding" , "errors" ); /* Examples /* obj = PyUnicode_Decode(s, len, "latin-1" , "strict" ); obj = PyUnicode_Decode(s, len, "ascii" , "ignore" ); |
如果你恰好有一個用 wchar_t *, len
對表示的寬字符串, 有幾種選擇性。首先你可以使用 Py_BuildValue()
:
1
2
3
4
|
wchar_t *w; /* Wide character string */ int len; /* Length */ PyObject *obj = Py_BuildValue( "u#" , w, len); |
另外,你還可以使用 PyUnicode_FromWideChar()
:
1
|
PyObject *obj = PyUnicode_FromWideChar(w, len); |
對于寬字符串,并沒有對字符數據進行解析——它被假定是原始Unicode編碼指針,可以被直接轉換成Python。
討論
將C中的字符串轉換為Python字符串遵循和I/O同樣的原則。 也就是說,來自C中的數據必須根據一些解碼器被顯式的解碼為一個字符串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你并不確定編碼方式或者數據是二進制的,你最好將字符串編碼成字節(jié)。 當構造一個對象的時候,Python通常會復制你提供的字符串數據。 如果有必要的話,你需要在后面去釋放C字符串。 同時,為了讓程序更加健壯,你應該同時使用一個指針和一個大小值, 而不是依賴NULL結尾數據來創(chuàng)建字符串。
以上就是C語言字符串轉換為Python字符串的方法的詳細內容,更多關于C語言字符串轉換為Python字符串的資料請關注服務器之家其它相關文章!
原文鏈接:https://python3-cookbook.readthedocs.io/zh_CN/latest/c15/p15_converting_c_string_to_python.html