web-dev-qa-db-ja.com

プレーンbashで正規表現を使用して部分文字列を抽出する

Bashを使用して文字列から時間を抽出しようとしていますが、それを理解するのに苦労しています。

私の文字列はこのようなものです:

US/Central - 10:26 PM (CST)

そして、10:26部分を抽出したいと思います。

誰もがbashでのみこれを行う方法を知っています-sed、awkなどを使用せずに?

たとえば、PHPで使用します-最良の方法ではありませんが、動作します-次のようなものです:

preg_match( ""(\d{2}\:\d{2}) PM \(CST\)"", "US/Central - 10:26 PM (CST)", $matches );

答えがsedまたはawkを使用している場合でも、助けてくれてありがとう

81
andrux

純粋な bash を使用:

$ cat file.txt
US/Central - 10:26 PM (CST)
$ while read a b time x; do [[ $b == - ]] && echo $time; done < file.txt

bash正規表現を使用した別のソリューション:

$ [[ "US/Central - 10:26 PM (CST)" =~ -[[:space:]]*([0-9]{2}:[0-9]{2}) ]] &&
    echo ${BASH_REMATCH[1]}

grepとルックアラウンドの高度な正規表現を使用した別のソリューション:

$ echo "US/Central - 10:26 PM (CST)" | grep -oP "\-\s+\K\d{2}:\d{2}"

sedを使用した別のソリューション:

$ echo "US/Central - 10:26 PM (CST)" |
    sed 's/.*\- *\([0-9]\{2\}:[0-9]\{2\}\).*/\1/'

perlを使用した別のソリューション:

$ echo "US/Central - 10:26 PM (CST)" |
    Perl -lne 'print $& if /\-\s+\K\d{2}:\d{2}/'

最後にawkを使用します:

$ echo "US/Central - 10:26 PM (CST)" |
    awk '{for (i=0; i<=NF; i++){if ($i == "-"){print $(i+1);exit}}}'
173
Gilles Quenot
    echo "US/Central - 10:26 PM (CST)" | sed -n "s/^.*-\s*\(\S*\).*$/\1/p"

-n      suppress printing
s       substitute
^.*     anything at the beginning
-       up until the dash
\s*     any space characters (any whitespace character)
\(      start capture group
\S*     any non-space characters
\)      end capture group
.*$     anything at the end
\1      substitute 1st capture group for everything on line
p       print it
69
jgshawkey

クイックアンドダーティ、正規表現フリー、低堅牢性のチョップチョップテクニック

string="US/Central - 10:26 PM (CST)"
etime="${string% [AP]M*}"
etime="${etime#* - }"
24
doubleDown