91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python轉(zhuǎn)義字符的表示方法

python爬蟲知識(shí)分享 ? 來源:python爬蟲知識(shí)分享 ? 作者:python爬蟲知識(shí)分享 ? 2022-04-11 15:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 為什么要有轉(zhuǎn)義?

ASCII 表中一共有 128 個(gè)字符。這里面有我們非常熟悉的字母、數(shù)字、標(biāo)點(diǎn)符號(hào),都可以直接使用鍵盤輸入。除此之外,還有一些非常特殊的字符,這些字符,通常很難在鍵盤上的找到,比如制表符、響鈴這種。

為了能將那些特殊字符都能寫入到字符串變量中,就規(guī)定了一個(gè)用于轉(zhuǎn)義的字符 \ ,有了這個(gè)字符,你在字符串中看的字符,print 出來后就不一定是你原來看到的了。

舉個(gè)例子

>>> msg = "hello\013world\013hello\013python"
>>> print(msg)
hello
     world
          hello
               python

是不是有點(diǎn)神奇?變成階梯狀的輸出了。

那個(gè) \013 又是什么意思呢?

\ 是轉(zhuǎn)義符號(hào),上面已經(jīng)說過

013 是 ASCII 編碼的八進(jìn)制表示,注意前面是 0 且不可省略,而不是字母 o

把八進(jìn)制的 13 轉(zhuǎn)成 10 進(jìn)制后是 11

對(duì)照查看 ASCII 碼表,11 對(duì)應(yīng)的是一個(gè)垂直定位符號(hào),這就能解釋,為什么是階梯狀的輸出字符串。

2. 轉(zhuǎn)義字符的 5 種表示法

ASCII 有 128 個(gè)字符,如果用 八進(jìn)制表示,至少得有三位數(shù),才能將其全部表示。這就是為什么說上面的首位 0 不能省略的原因,即使現(xiàn)在用不上,我也得把它空出來。

而如果使用十六進(jìn)制,只要兩位數(shù)就能把 ASCII 的字符全部表示出來。同時(shí)為了避免和八進(jìn)制的混淆起來,所以在 \ 后面要加上英文字母 x 表示十六進(jìn)制,后面再接兩位十六進(jìn)制的數(shù)值。

\ 開頭并接三位 0-7 的數(shù)值,表示 8 進(jìn)制

\x 開頭并接兩位 0-f 的數(shù)值,表示 16進(jìn)制

因此,當(dāng)我定義一個(gè)字符串的值為 hello + 回車 + world 時(shí),就有了多種方法:

# 第一種方法:8進(jìn)制
>>> msg = "hello\012world"
>>> print(msg)
hello
world

# 第二種方法:16 進(jìn)制
>>> msg = "hello\x0aworld"
>>> print(msg)
hello
world

通常我們很難記得住一個(gè)字符的 ASCII 編號(hào),即使真記住了,也要去轉(zhuǎn)換成八進(jìn)制或者16進(jìn)制,實(shí)在是太難了。

因此對(duì)于一些常用并且比較特殊字符,我們習(xí)慣用另一種類似別名的方式,比如使用 \n 表示換行,它與 \012 、\x0a 是等價(jià)的。

于是,要實(shí)現(xiàn) hello + 回車 + world ,就有了第三種方法

# 第三種方法:使用類似別名的方法
>>> msg = "hello\nworld"
>>> print(msg)
hello
world

到目前為止,我們掌握了 三種轉(zhuǎn)義的表示法。

已經(jīng)非常難得了,讓我們的腦洞再大一點(diǎn)吧,接下來再介紹兩種。

ASCII 碼表所能表示字符實(shí)在太有限了,想打印一個(gè)中文漢字,抱歉,你得借助 Unicode 碼。

Unicode 編碼由 4 個(gè)16進(jìn)制數(shù)值組合而成

>>> print("\u4E2D")
中

什么?我為什么知道 的 unicode 是 \u4E2D?像下面這樣打印就知道啦

# Python 2.7
>>> a = u"中"
>>> a
u'\u4e2d'

由此,要實(shí)現(xiàn) hello + 回車 + world ,就有了第四種方法。

# 第四種方法:使用 unicode ,\u000a 表示換行
>>> print('hello\u000aworld')
hello
world

看到這里,你是不是以為要結(jié)束啦?

不,還沒有。下面還有一種。

Unicode 編碼其實(shí)還可以由 8 個(gè)32進(jìn)制數(shù)值組合而成,為了與前面的區(qū)分開來,這里用 \U 開頭。

# 第五種方法:使用 unicode ,\U0000000A 表示換行
>>> print('hello\U0000000Aworld')
hello
world

好啦,目前我們掌握了五種轉(zhuǎn)義的表示法。

總結(jié)一下:

\ 開頭并接三位 0-7 的數(shù)值(八進(jìn)制) — 可以表示所有ASCII 字符

\x 開頭并接兩位 0-f 的數(shù)值(十六進(jìn)制) — 可以表示所有ASCII 字符

\u 開頭并接四位 0-f 的數(shù)值(十六進(jìn)制) — 可以表示所有 Unicode 字符

\U 開頭并接八位 0-f 的數(shù)值(三十二進(jìn)制) — 可以表示所有 Unicode 字符

\ 開頭后接除 x、u、U 之外的特定字符 — 僅可表示部分字符

為什么標(biāo)題說,轉(zhuǎn)義也可以炫技呢?

試想一下,假如你的同事,在打印日志時(shí),使用這種 unicode 編碼,然后你在定位問題的時(shí)候使用這個(gè)關(guān)鍵詞去搜,卻發(fā)現(xiàn)什么都搜不到?這就撲街了。

雖然這種行為真的很 sb,但在某些人看來也許是非常牛逼的操作呢?

五種轉(zhuǎn)義的表示法到這里就介紹完成,接下來是更多轉(zhuǎn)義相關(guān)的內(nèi)容,也是非常有意思的內(nèi)容,有興趣的可以繼續(xù)往下看。

3. raw 字符串

當(dāng)一個(gè)字符串中具有轉(zhuǎn)義的字符時(shí),我們使用 print 打印后,正常情況下,輸出的不是我們?cè)瓉碓谧址锌吹降哪菢幼印?/p>

那如果我們需要輸出 hello\nworld ,不希望 Python 將 \n 轉(zhuǎn)義成 換行符呢?

這種情況下,你可以在定義時(shí)將字符串定義成 raw 字符串,只要在字符串前面加個(gè) r 或者 R 即可。

>>> print(r"hello\nworld")
hello\nworld
>>>
>>> print(R"hello\nworld")
hello\nworld

然而,不是所有時(shí)候都可以加 r 的,比如當(dāng)你的字符串是由某個(gè)程序/函數(shù)返回給你的,而不是你自己生成的

# 假設(shè)這個(gè)是外來數(shù)據(jù),返回 "hello\nworld"
>>> body = spider()
>>> print(body)
hello
world

這個(gè)時(shí)候打印它,\n 就是換行打印。

4. 使用 repr

對(duì)于上面那種無法使用 r 的情況,可以試一下 repr 來解決這個(gè)需求:

>>> body = repr(spider())
>>> print(body)
'hello\nworld'

經(jīng)過 repr 函數(shù)的處理后,為讓 print 后的結(jié)果,接近字符串本身的樣子,它實(shí)際上做了兩件事

\ 變?yōu)榱?\\

在字符串的首尾添加 ' 或者 "

你可以在 Python Shell 下敲入 變量 回車,就可以能看出端倪。

首尾是添加 ' 還是 " ,取決于你原字符串。

>>> body="hello\nworld"
>>> repr(body)
"'hello\\nworld'"
>>>
>>>
>>> body='hello\nworld'
>>> repr(body)
"'hello\\nworld'"

5. 使用 string_escape

如果你還在使用 Python 2 ,其實(shí)還可以使用另一種方法。

那就是使用 string.encode('string_escape') 的方法,它同樣可以達(dá)到 repr 的效果

>>> "hello\nworld".encode('string_escape')
'hello\\nworld'

6. 查看原生字符串

綜上,想查看原生字符串有兩種方法:

如果你在 Python Shell 交互模式下,那么敲擊變量回車

如果不在 Python Shell 交互模式下,可先使用 repr 處理一下,再使用 print 打印

>>> body="hello\nworld"
>>>
>>> body
'hello\nworld'
>>>
>>> print(repr(body))
'hello\nworld'

7. 恢復(fù)轉(zhuǎn)義:轉(zhuǎn)成原字符串

經(jīng)過 repr 處理過或者 \\ 取消轉(zhuǎn)義過的字符串,有沒有辦法再回退出去,變成原先的有轉(zhuǎn)義的字符串呢?

答案是:有。

如果你使用 Python 2,可以這樣:

>>> body="hello\\nworld"
>>>
>>> body
'hello\\nworld'
>>>
>>> body.decode('string_escape')
'hello\nworld'

如果你使用 Python 3 ,可以這樣:

>>> body="hello\\nworld"
>>>
>>> body
'hello\\nworld'
>>>
>>> bytes(body, "utf-8").decode("unicode_escape")
'hello\nworld'

什么?還要區(qū)分 Python 2 和 Python 3?太麻煩了吧。

明哥教你用一種可以兼容 Python 2 和 Python 3 的寫法。

首先是在 Python 2 中的輸出

>>> import codecs
>>> body="hello\\nworld"
>>>
>>> codecs.decode(body, 'unicode_escape')
u'hello\nworld'

然后再看看 Python 3 中的輸出

>>> import codecs
>>> body="hello\\nworld"
>>>
>>> codecs.decode(body, 'unicode_escape')
'hello\nworld'

可以看到 Pyhton 2 中的輸出 有一個(gè) u ,而 Python 3 的輸出沒有了 u,但無論如何 ,他們都取消了轉(zhuǎn)義。

以上,就是我為大家整理的關(guān)于 Python 中轉(zhuǎn)義的全部?jī)?nèi)容了,整理的過程,不斷的發(fā)現(xiàn)新知識(shí),幫助到大家的同時(shí),自己也對(duì)轉(zhuǎn)義的一些內(nèi)容有了更深的理解。
審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90037
  • 轉(zhuǎn)義字符
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    857
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Termux中調(diào)試圣誕樹Python代碼

    ,先安裝并驗(yàn)證: 打開Termux,輸入以下命令安裝Python(回車執(zhí)行): pkg install python -y -y 表示自動(dòng)確認(rèn)安裝,無需手動(dòng)輸入y。 驗(yàn)證安裝是否成功
    發(fā)表于 12-09 09:02

    C語言的printf基本用法介紹

    =93.959999 要點(diǎn)提示: 1) n是一個(gè)整體,組合在一起表示一個(gè)換行字符。換行符是 ASCII 編碼中的一個(gè)控制字符,無法在鍵盤上直接輸入,只能用這種特殊的方法
    發(fā)表于 11-12 07:04

    Python調(diào)用API教程

    兩個(gè)不同系統(tǒng)之間的信息交互。在這篇文章中,我們將詳細(xì)介紹Python調(diào)用API的方法和技巧。 一、用Requests庫(kù)發(fā)送HTTP請(qǐng)求 使用Python調(diào)用API的第一步是發(fā)送HTTP請(qǐng)求,通常
    的頭像 發(fā)表于 11-03 09:15 ?887次閱讀

    定點(diǎn)數(shù)表示實(shí)數(shù)的方法以及定點(diǎn)數(shù)在硬件上的運(yùn)算驗(yàn)證

    本篇主要介紹定點(diǎn)數(shù)表示實(shí)數(shù)的方法以及定點(diǎn)數(shù)在硬件上的運(yùn)算驗(yàn)證 為什么選定點(diǎn)數(shù) 32位單精度浮點(diǎn)數(shù): 32位的單精度浮點(diǎn)數(shù)為例,IEE754標(biāo)準(zhǔn)規(guī)定,一個(gè)flaot類型的浮點(diǎn)數(shù)X可以
    發(fā)表于 10-28 08:13

    Python字符串逆序有幾種方式,代碼是什么

    對(duì)于一個(gè)給定的字符串,逆序輸出,這個(gè)任務(wù)對(duì)于python來說是一種很簡(jiǎn)單的操作,畢竟強(qiáng)大的列表和字符串處理的一些列函數(shù)足以應(yīng)付這些問題 了,今天總結(jié)了一下python中對(duì)于
    的頭像 發(fā)表于 08-28 14:44 ?1086次閱讀

    python app不能運(yùn)行怎么解決?

    ;python_agent[1241]: xmlrpc request method supervisor.stopProcess failed;python_agent[1241]: xmlrpc request method supervisor.stopProces
    發(fā)表于 08-06 06:27

    linux系統(tǒng)awk特殊字符命令詳解

    在Linux系統(tǒng)中,awk?是一種非常強(qiáng)大的文本處理工具,能夠?qū)ξ谋緮?shù)據(jù)進(jìn)行分析、格式化和篩選。利用其內(nèi)置的特殊字符和操作符,用戶可以實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)處理任務(wù)。以下對(duì)一些常見的awk特殊字符和操作符
    的頭像 發(fā)表于 07-28 16:38 ?642次閱讀

    基礎(chǔ)篇3:掌握Python中的條件語句與循環(huán)

    Python編程語言中,條件語句和循環(huán)是構(gòu)成復(fù)雜邏輯和數(shù)據(jù)處理的基石。本篇基礎(chǔ)教程將幫助您深入了解Python中的條件語句和循環(huán)結(jié)構(gòu),讓您能夠更好地控制程序流程。 條件語句 條件語句允許程序根據(jù)
    發(fā)表于 07-03 16:13

    電阻上的數(shù)字如何表示電阻大?。?/a>

    大小的方法。 一、直標(biāo)法 直標(biāo)法是最直接、最簡(jiǎn)單的電阻值表示方法。在這種方法中,電阻的阻值直接用數(shù)字和文字符號(hào)標(biāo)注在電阻體上。例如,電阻上標(biāo)
    的頭像 發(fā)表于 06-09 14:38 ?3460次閱讀
    電阻上的數(shù)字如何<b class='flag-5'>表示</b>電阻大???

    WP4000變頻功率分析儀的精度表示與常規(guī)儀表精度表示方法有什么不同?

    目前,測(cè)量?jī)x器的精度表示方法一般是“相對(duì)誤差”或者是“引用誤差”,相對(duì)來說市面上采用“引用誤差”表示方法的儀器占大部分,而WP4000變頻功率分析儀是目前市面上唯一一款采用“相對(duì)誤差”
    的頭像 發(fā)表于 05-13 09:58 ?659次閱讀

    零基礎(chǔ)入門:如何在樹莓派上編寫和運(yùn)行Python程序?

    在這篇文章中,我將為你簡(jiǎn)要介紹Python程序是什么、Python程序可以用來做什么,以及如何在RaspberryPi上編寫和運(yùn)行一個(gè)簡(jiǎn)單的Python程序。什么是Python程序?
    的頭像 發(fā)表于 03-25 09:27 ?2039次閱讀
    零基礎(chǔ)入門:如何在樹莓派上編寫和運(yùn)行<b class='flag-5'>Python</b>程序?

    復(fù)合光纜型號(hào)怎么表示

    復(fù)合光纜的型號(hào)表示方法通常遵循一定的命名規(guī)則,這些規(guī)則有助于用戶識(shí)別光纜的特性、用途和規(guī)格。以下是對(duì)復(fù)合光纜型號(hào)表示方法的詳細(xì)解釋: 一、型號(hào)構(gòu)成 復(fù)合光纜的型號(hào)通常由光纜型式的代號(hào)和
    的頭像 發(fā)表于 03-18 09:50 ?2505次閱讀

    飛凌嵌入式ElfBoard ELF 1板卡-字符驅(qū)動(dòng)之字符驅(qū)動(dòng)描述

    基本組件:設(shè)備文件:字符驅(qū)動(dòng)通過在文件系統(tǒng)中創(chuàng)建設(shè)備文件來表示字符設(shè)備。應(yīng)用程序可以通過打開設(shè)備文件來訪問字符設(shè)備。初始化和清理函數(shù):字符驅(qū)
    發(fā)表于 03-14 09:51

    飛凌嵌入式ElfBoard ELF 1板卡-字符驅(qū)動(dòng)之字符驅(qū)動(dòng)框架描述

    alloc_chrdev_region函數(shù)來動(dòng)態(tài)分配設(shè)備號(hào),或者通過cdev_add函數(shù)將設(shè)備號(hào)與字符設(shè)備關(guān)聯(lián)。 字符設(shè)備結(jié)構(gòu)(cdev):字符設(shè)備結(jié)構(gòu)cdev是在字符驅(qū)動(dòng)中用于
    發(fā)表于 03-14 09:45

    飛凌嵌入式ElfBoard ELF 1板卡-字符驅(qū)動(dòng)之字符驅(qū)動(dòng)描述

    基本組件:設(shè)備文件:字符驅(qū)動(dòng)通過在文件系統(tǒng)中創(chuàng)建設(shè)備文件來表示字符設(shè)備。應(yīng)用程序可以通過打開設(shè)備文件來訪問字符設(shè)備。初始化和清理函數(shù):字符驅(qū)
    發(fā)表于 03-13 09:49