直播中
到現(xiàn)在為止,所看到的示例都只考慮查找任何地方出現(xiàn)的章節(jié)標(biāo)題。出現(xiàn)的任何一個(gè)字符串 'Chapter' 后跟一個(gè)空格和一個(gè)數(shù)字可能是一個(gè)真正的章節(jié)標(biāo)題,也可能是對其他章節(jié)的交叉引用。由于真正的章節(jié)標(biāo)題總是出現(xiàn)在一行的開始,因此需要設(shè)計(jì)一個(gè)方法只查找標(biāo)題而不查找交叉引用。
定位符提供了這個(gè)功能。定位符可以將一個(gè)正則表達(dá)式固定在一行的開始或結(jié)束。也可以創(chuàng)建只在單詞內(nèi)或只在單詞的開始或結(jié)尾處出現(xiàn)的正則表達(dá)式。下表包含了正則表達(dá)式及其含義的列表:
字符 描述
^ 匹配輸入字符串的開始位置。如果設(shè)置了RegExp對象的 Multiline 屬性,
^ 也匹配 '\n' 或 '\r' 之后的位置。
$ 匹配輸入字符串的結(jié)束位置。如果設(shè)置了RegExp對象的 Multiline 屬性,
$ 也匹配 '\n' 或 '\r' 之前的位置。
\b 匹配一個(gè)單詞邊界,也就是指單詞和空格間的位置。
\B 匹配非單詞邊界。
不能對定位符使用限定符。因?yàn)樵谝粋€(gè)換行符或者單詞邊界的前面或后面不會(huì)有連續(xù)多個(gè)位置,因此諸如 '^*' 的表達(dá)式是不允許的。
要匹配一行文字開始位置的文字,請?jiān)谡齽t表達(dá)式的開始處使用 '^' 字符。不要把 '^' 的這個(gè)語法與其在括號表達(dá)式中的語法弄混。它們的語法根本不同。
要匹配一行文字結(jié)束位置的文字,請?jiān)谡齽t表達(dá)式的結(jié)束處使用 '$' 字符。
要在查找章節(jié)標(biāo)題時(shí)使用定位符,下面的 Visual Basic Scripting Edition 正則表達(dá)式將匹配位于一行的開始處最多有兩個(gè)數(shù)字的章節(jié)標(biāo)題:
/^Chapter [1-9][0-9]{0,1}/
VBScript 中相同功能的正則表達(dá)式如下:
"^Chapter [1-9][0-9]{0,1}"
一個(gè)真正的章節(jié)標(biāo)題不僅出現(xiàn)在一行的開始,而且這一行中也僅有這一個(gè)內(nèi)容,因此,它必然也位于一行的結(jié)束。下面的表達(dá)式確保所指定的匹配只匹配章節(jié)而不會(huì)匹配交叉引用。它是通過創(chuàng)建一個(gè)只匹配一行文字的開始和結(jié)束位置的正則表達(dá)式來實(shí)現(xiàn)的。
/^Chapter [1-9][0-9]{0,1}$/
對 VBScript 則使用:
"^Chapter [1-9][0-9]{0,1}$"
匹配單詞邊界有少許不同,但卻給正則表達(dá)式增加了一個(gè)非常重要的功能。單詞邊界就是單詞和空格之間的位置。非單詞邊界就是其他任何位置。下面的 Visual Basic Scripting Edition 表達(dá)式將匹配單詞 'Chapter' 的前三個(gè)字符,因?yàn)樗鼈兂霈F(xiàn)在單詞邊界后:
/\bCha/
對 VBScript 為:
"\bCha"
這里 '\b' 操作符的位置很關(guān)鍵。如果它位于要匹配的字符串的開始,則將查找位于單詞開頭處的匹配;如果它位于改字符串的末尾,則查找位于單詞結(jié)束處的匹配。例如,下面的表達(dá)式將匹配單詞 'Chapter' 中的 'ter',因?yàn)樗霈F(xiàn)在單詞邊界之前:
/ter\b/
以及
"ter\b"
下面的表達(dá)式將匹配 'apt',因?yàn)樗挥?'Chapter' 中間,但不會(huì)匹配 'aptitude' 中的'apt':
/\Bapt/
以及
"\Bapt"
這是因?yàn)樵趩卧~ 'Chapter' 中 'apt' 出現(xiàn)在非單詞邊界位置,而在單詞 'aptitude' 中位于單詞邊界位置。非單詞邊界操作符的位置不重要,因?yàn)槠ヅ渑c一個(gè)單詞的開頭或結(jié)尾無關(guān)。