ITエンジニアのまずはこれだけ知っておこう【正規表現 編】

技術系

ITエンジニアとして仕事をしていると、正規表現という言葉を聞く機会があります。
正規表現は、説明を読んでもいまいち理解できない。でも、知らないのは、ちょっと恥ずかしい、そんな存在です。

ここでは、とりあえず、これだけ知っておけば恥ずかしくないよというところまでをまとめてみました。

正規表現とは?

正規表現とは、様々な文字を1つの形式で表現する表記法です。

この表現方法を使用すると、たくさんの文章の中から簡単に見つけたい文字列を検索することができます。

特に活用されている理由としては、完全に一致する文字列の検索だけではなく、あるパターンに当てはまる文字列を検索することができることです。

正規表現で使用する特殊文字

正規表現では、以下の特殊文字を使用して、表現します

. ^ $ [ ] * + ? | ( )

なんでもいい1文字 .

半角の.を使用すると、なんでもいい1桁の文字を表現することができます。

正規表現

私は.です。

検索できる文字列

私は、Aです。
私は、Bです。
私は、Cです。

これを応用して、.をいくつか繋げると複数桁の文字を表現可能です。

正規表現

私はです。

検索できる文字列

私は、佐々木です。
私は、二階堂です。
私は、長谷川です。

行の先頭、最後 ^  $

正規表現

^ありがとう

半角の^は、行の先頭を意味します。よって、上記の場合、行の先頭に存在する「ありがとう」を検索します。

正規表現

ありがとう$

は、行の終わりを意味します。よって、行の最後に存在する「ありがとう」を検索します。

正規表現

^ありがとう$

上記のように、^$の両方を指定した場合には、「ありがとう」の文字だけが存在する行を検索します。

同じ文字の繰り返し * + ?

*は、*の直前に文字が存在しないか、直前の文字が1個以上連続するという意味になります。

正規表現

おー*

検索できる文字列

おい
おーい
おーーーーい

+は、+の直前の文字が、直前に最低1個以上ないといけません。

正規表現

おー+

検索できる文字列

おーい
おーーーーい

は、直前の文字が全くないか1つだけあるという意味になります。

正規表現

Windows?

検索できる文字列

Windows
Window

下のように、スペースがある場合とない場合が混在する文字列を検索する場合にも使用できます。

正規表現

Windows ?

検索できる文字列

Windows10
Windows 10

知っておくべき正規表現のリスト

内容表現の意味
^【文字】 【文字】で始まる
【文字】$ 【文字】で終わる
【文字】*
【文字】の0回以上の繰り返し
【文字】 \? 【文字】が0回、または1回
【文字】? 【文字】が0回、または1回(拡張正規表現)
【文字】\+【文字】の1回以上繰り返し
【文字】+【文字】の1回以上の繰り返し(拡張正規表現)
【文字1】-【文字2】【文字1】から【文字2】の間の任意の文字。「a-z」などと使う
【文字1】 \|【文字2】【文字1】もしくは【文字2】
【文字】 |【文字2】【文字1】もしくは【文字2】(拡張正規表現)
[【複数の文字】]【複数の文字】のどれか1文字。「[ade]」や「[a-z0-9]」などと使う
[^【複数の文字】]【複数の文字】以外。「[^ade]」や「[^a-z0-9]」などと使う

コメント

タイトルとURLをコピーしました