正規表現(せいきひょうげん、regular expression)とは、文字列の集合を一つの文字列で表現する方法の一つである(引用元:Wikipedia)とあるが、そう言われてもピンと来ないので具体例を交えながら解説する。例えば「エンターテイメント」という言葉があるが、この単語を探したいと思った時、単に「エンターテイメント」という文字列で検索しただけでは十分な結果を得られない場合がある。英単語のカナ表記によく見られることだがこの言葉は書き手によって「エンターテインメント」「エンタテイメント」などと幾つか異なった書かれ方をするため、「エンターテイメント」による検索のみではその他の表記にはマッチしてくれないからだ。この問題を通常の検索手法の範囲内で解決するには全ての表記で検索を実施してみるしかなく、しかしこれは随分と煩わしい。こんな時にこそ正規表現の出番である。正規表現を用いれば、上記のような文字列の揺らぎは次の1語で書き表すことができる。
・医者が子供を相手に
「はい、それじゃあお口をひらがなの最初の文字から最後の文字して下さいねー
・ぶりっ子の女の人が食事時に
「ひらがなの最初の文字から最後の文字、あたしトマトって食べられないの〜
・街中で不良の高校生とすれ違いざま
「てめ、この、なにジロジロ見てんだよ、ひらがなの最初の文字から最後の文字?
・胡散臭いフランス人
「ンー、トレビカタカナの最初の文字から最後の文字
・カップルのいる風景
女「はい、ひらがなの最初の文字から最後の文字
そう言って彼女は、今日の為に気合を入れて焼いたというクッキーを僕の口元に持って来た。
途端に顔が熱くなっていくのを感じたが、ここでうろたえては恰好が付かない。ここは意を決して、
男「ひらがなの最初の文字…ひらがなの最初の文字から最後の文字……パク、モグモグモグ。う、
女「う?
う、うげ、しょ、しょっぱい!
こ…こいつさては…
男「…女優あめくみちこの夫の本名を間違えたな