正規表示式 (Regular Expression) 基礎教學

      正規表示式是使用一種模式 (pattern) 來描述、符合一系列符合某個句法規則的字串。他最強大的威力就在於只需要幾個簡單的符號,就可以代表許多字串共同的樣子。通常被用來收尋以及替換某個模式的文字。



以下介紹幾個常用的語法: 


.代表一個任意字元

例: .T. ,代表三個字元,中間為T,左右兩邊為任意字元。

^代表在列首

例: ^Apple,代表Apple需出現在列首,才能符合模式。

$代表在尾部

例: Apple$,代表Apple需出現在列的最後面,才能符合模式。

[...]代表字元集合 (character class)

例:[abc],代表符合 a 或 b 或 c 這三種字元中的其中一個即可符合模式。
例:[Aa]pple,代表 Apple、apple 皆符合此模式。
例:[^A-Z],代表除了大寫字母外的一個字元。 ^在集合中代表 '非/not' 的意思。 - 表字元範圍。

*代表左鄰字元出現一個以上

例:Ap*le,代表p這個字元可以有0個以上,Ale、Aple、Appppppple皆符合此模式。

\{...\}代表左鄰字元符合的個數

例:[A-Z]\{2,6\},代表以大寫字母組成的字串,長度為2~6,皆符合此模式。

留言

這個網誌中的熱門文章

python pandas 輸出 excel csv 教學 亂碼 index 標題

主力的思維-撼動日經指數的神級操盤手

為什麼我們這樣生活,那樣工作?