成人免费观看网欧美片-成人免费观看视频-成人免费观看男女羞羞视频-成人免费观看的视频黄页-成人免费高清视频-成人免费福利片在线观看

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > python怎么處理字符編碼問題

python怎么處理字符編碼問題

來源:千鋒教育
發布人:xqq
時間: 2023-11-11 17:57:07 1699696627

python中可以使用base64來處理字符編碼問題,Base64是一種用64個字符來表示任意二進制數據的方法。

用記事本打開exe、jpg、pdf這些文件時,我們都會看到一大堆亂碼,因為二進制文件包含很多無法顯示和打印的字符,所以,如果要讓記事本這樣的文本處理軟件能處理二進制數據,就需要一個二進制到字符串的轉換方法。Base64是一種最常見的二進制編碼方法。

Base64的原理很簡單,首先,準備一個包含64個字符的數組:

['A','B','C',...'a','b','c',...'0','1',...'+','/']

然后,對二進制數據進行處理,每3個字節一組,一共是3x8=24bit,劃為4組,每組正好6個bit

這樣我們得到4個數字作為索引,然后查表,獲得相應的4個字符,就是編碼后的字符串。

所以,Base64編碼會把3字節的二進制數據編碼為4字節的文本數據,長度增加33%,好處是編碼后的文本數據可以在郵件正文、網頁等直接顯示。

如果要編碼的二進制數據不是3的倍數,最后會剩下1個或2個字節怎么辦?Base64用\x00字節在末尾補足后,再在編碼的末尾加上1個或2個=號,表示補了多少字節,解碼的時候,會自動去掉。

Python內置的base64可以直接進行base64的編解碼:

>>>importbase64

>>>base64.b64encode('binary\x00string')

'YmluYXJ5AHN0cmluZw=='

>>>base64.b64decode('YmluYXJ5AHN0cmluZw==')

'binary\x00string'

由于標準的Base64編碼后可能出現字符+和/,在URL中就不能直接作為參數,所以又有一種"urlsafe"的base64編碼,其實就是把字符+和/分別變成-和_:

>>>base64.b64encode('i\xb7\x1d\xfb\xef\xff')

'abcd++/'

>>>base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')

'abcd--__'

>>>base64.urlsafe_b64decode('abcd--__')

'i\xb7\x1d\xfb\xef\xff'

還可以自己定義64個字符的排列順序,這樣就可以自定義Base64編碼,不過,通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法,不能用于加密,即使使用自定義的編碼表也不行。

Base64適用于小段內容的編碼,比如數字證書簽名、Cookie的內容等。

由于=字符也可能出現在Base64編碼中,但=用在URL、Cookie里面會造成歧義,所以,很多Base64編碼后會把=去掉:

#標準Base64:

'abcd'->'YWJjZA=='

#自動去掉=:

'abcd'->'YWJjZA'

去掉=后怎么解碼呢?因為Base64是把3個字節變為4個字節,所以,Base64編碼的長度永遠是4的倍數,因此,需要加上=把Base64字符串的長度變為4的倍數,就可以正常解碼了。

請寫一個能處理去掉=的base64解碼函數:

>>>base64.b64decode('YWJjZA==')

'abcd'

>>>base64.b64decode('YWJjZA')

Traceback(mostrecentcalllast):

...

TypeError:Incorrectpadding

>>>safe_b64decode('YWJjZA')

'abcd'

小結

Base64是一種任意二進制到文本字符串的編碼方法,常用于在URL、Cookie、網頁中傳輸少量二進制數據。

以上內容為大家介紹了Python培訓之怎么處理字符編碼問題,希望對大家有所幫助,如果想要了解更多Python相關知識,請關注IT培訓機構:千鋒教育。

tags: python培訓
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT