awk ファンクラブ

awk ファンクラブat LINUX

awk ファンクラブ - 暇つぶし2ch50:login:Penguin
09/08/01 15:31:08 z6H8O5Sr.net
こんなものが落ちてたw
URLﾘﾝｸ(mitya.pp.ru)

51:login:Penguin
09/08/15 20:33:21 7GY0b2Yy.net
Mac OS X Leopard 10.5.8でjgawkを使いたいのです。
ターミナルでawk '{print $0}' filenameですと日本語が悲しいです。
お使いのみなさん、使用法等教えて下さい。

52:login:Penguin
09/08/19 18:02:30 GJ3CGMhT.net
板違い。

53:login:Penguin
09/08/22 09:19:23 rmix/tng.net
Mac OS XをUnixとして使ってる人の為のスレその15
ｽﾚﾘﾝｸ(mac板)

こっちのが詳しいかもね

54:正月前
09/12/29 22:19:45 UAwxD9+5.net
awk初心者です。
awkにはperlのjoinみたいの関数ありますか？
perl:
print join(":",$_);

55:login:Penguin
09/12/30 01:06:12 Q1gMau4C.net
データ集計に便利

56:login:Penguin
09/12/30 01:44:22 jMgIWDpO.net
>>54
BEGIN {OFS=":"}{$1=$1;print}

57:正月前
09/12/31 16:45:37 z/pUNj8p.net
重複を削除するBASHスクリプトに、perlの部分はawkの連想配列で書き換えたいんですが、splitした後の処理方法が分かりません
教えて頂ければ幸いです。

-----------------------------
hoge='a:b:c:d:a:b:c:d:a'
echo -n $hoge | perl -F: -ane 'chop;foreach(@F){$s{$_}++ or push(@b,$_)}print join(":",@b)'
-----------------------------

58:login:Penguin
10/01/05 11:48:18 iQ1ypvd/.net
素人なりですけど
echo -n $hoge | awk 'BEGIN{OFS=":"}{n=split($0,a,":");m=1;for(i=1;i<=n;i++){if(!(a[i]in b)){$m=a[i];b[$m]++;m++}}print}'

59:login:Penguin
10/01/05 12:34:43 APedkSZb.net
echo -n $hoge | awk 'a[$0]++<1{printf(NR>1?RS:_)$0}' RS=:

60:login:Penguin
10/01/05 12:50:31 APedkSZb.net
a[$0]++<1 じゃなくて
!a[$0]++ とした方が1バイト短くなるな

って、そういう趣旨じゃないか

61:login:Penguin
10/01/08 21:03:31 pPQjxZAI.net
プログラミングAWK　3度目の復刊
URLﾘﾝｸ(www.fukkan.com)

62:正月前
10/01/11 22:20:00 jx5sxsA2.net
>>58,59,60
ご回答、誠に有難うございました！
まだawkの部分理解してないけど、期待通りの動作が確認できました！

63:login:Penguin
10/03/16 14:08:38 hRXCRI1I.net
Linuxじゃないんですが、Gawk on Windowsだと、
　gawk '{print $1;}' data.txt
ていうのは、クォーテーションはダブルにしないといけないんですね。。。

64:login:Penguin
10/03/16 14:27:11 OV90ZKd/.net
うん、引数文字列をどう解釈するかは awk じゃなくてシェルだから。
cmd.exe の仕様の問題であって、awk の側では対応しようにもできない。

65:login:Penguin
10/05/14 13:36:36 XjQaHos9.net
BEGIN {

printf "２５６倍のコードが提供されてる\n"
printf "URLﾘﾝｸ(books.ascii.jp) にアクセス\n"
printf "本には4756101623なんてのがついてるけど、本の通りに入れるとnot found\n"

}

END {
print "昔と本の内容が変わってるみたいだな"
}

66:login:Penguin
10/05/14 21:49:15 KfNsslph.net
END {
　　print "まだ始まってもねーよっ！"
}

BEGIN {
　　printf "・・・ごめ・・・\n"
}

67:login:Penguin
10/07/22 10:04:21 PFu3TuWN.net
{
if ($0 == "aka") print "red"
else print "blue"
}
の最も変態的な記法を教えて下さい。

68:login:Penguin
10/07/22 10:29:55 YKIn4IAK.net
$0=/aka/?"red":"blue"

69:login:Penguin
10/07/28 10:04:53 ZsEEtYoL.net
END {
system("echo " + $0 + " | perl -ne 'if(/"aka"/){print \"red\";}else{print \"blue\";}'")
}

70:初心者
10/11/04 22:16:05 UUOsCvwd.net
awkでシェルのPATH変数をマッチさせるときにスラッシュ//を使わない方法を教えていただけませんか？
perlだと＃＃で行けますが

71:login:Penguin
10/11/04 23:15:07 mFaq3KZr.net
>>70はマルチ

72:初心者
10/11/05 06:33:50 HLS9uc8i.net
ごめんなさい！
マルチがだめとは知りませんでした。

73:login:Penguin
11/02/03 07:43:56 S25iv8qF.net
アルフレッド・V・恵方

74:login:Penguin
11/02/11 03:51:35 9907NRVa.net
awk で宛名書きだそう

AWK Users JP :: OSC2011 Kagawa 特設サイト
URLﾘﾝｸ(gauc.no-ip.org)

75:login:Penguin
11/02/11 21:58:36 W6G44msP.net
awkって今時オブジェクト指向もサポートしてねぇのか。
だせぇ・・・

とか思ってたらこんなのもあるんだな。
URLﾘﾝｸ(awk.info)

76:login:Penguin
11/05/24 19:21:38.77 iwctpm7O.net
awkの処理についてアドバイスを下さい。
スペースで区切られたテキストファイルがあります。

例（フィールド数も文字数も全部異なります）

abc efg hij URLﾘﾝｸ(www.example.com) xyz
123 URLﾘﾝｸ(www.example.org) she good love look good
4edi URLﾘﾝｸ(www.example.net)

こんな感じのテキストファイルからURLだけを抽出したい
場合、どう言った処理を行うと良いでしょうか？

printなどは使えそうにないし頭を抱えています。
是非お助け下さい。

77:login:Penguin
11/05/24 19:44:33.96 Z14Fpx2c.net
>>76
{for(i=0;i<=NF;i++)if($i ~ /^http:\/\/.+$/)print $i}

78:login:Penguin
11/05/24 19:52:09.13 WxByEtFQ.net
自分は
match($0, /http:\/\/[^ ]+/, f)
を使う気がする。

79:login:Penguin
11/05/24 20:22:38.00 jzDVjDvh.net
#!/bin/sh
cat 入力ファイル | tr ' \t' '\n' | awk '/^http:/'

…まで書きかけて、あれ、これawkじゃなくてgrepで良くね、と思ってしまった俺

80:login:Penguin
11/05/24 20:49:07.88 WxByEtFQ.net
/bin/shでもやはり自分は
expr 文字列 : '.*$http:\/\/[^ ]*$.*'
を使う気がする。

81:login:Penguin
11/05/24 23:22:37.43 Rb7jhN0u.net
うちは>>77の条件を index($i, "http:") == 1 で書くだろうなぁ
でも、処理内容がそれだけなら sed -n 's/^.*$http:[^ ]*$.*$/\1/p' だなぁ
避けられるなら正規表現は避けたほうが速いんじゃないかと思ってる

82:76
11/05/25 00:02:32.97 bOPlpFb7.net
まだどうしてそういう結果になるのか…が全然解らないのですが
一つ一つひもといて自分のものにしていきたいです。

みなさん本当に色々ありがとうございます。

83:login:Penguin
11/05/25 02:29:57.15 RCLD3Ghq.net
こういうのもpythonで書くようになってしまった俺は駄目なやつですか

84:login:Penguin
11/05/25 03:14:46.21 zyb8WUrO.net
流石にPythonはこういうサクッとしたテキスト処理には冗長すぎないか？
awk以外でならperl、さもなくばrubyあたりまでが俺は限度だなあ

85:login:Penguin
11/05/27 01:08:18.13 4uJpaTLS.net
BEGIN{ FS="http://"; }{ split($2, item, / /); print FS item[1]; }

とか

86:login:Penguin
11/06/02 03:19:02.91 LRv8LU2q.net
入力からランダムで1行表示する
awk '{ l[i++]=$0 }; END{ srand(); print l[int(i*rand())] }'

シェルスクリプトの方が短いか？

87:login:Penguin
11/06/02 09:37:16.89 Z7QDCEkg.net
こう書くと1行しかメモリに保存しないので入力行が多くとも平気です

BEGIN { srand() }
rand() * NR < 1 { x = $0 }
END { print x }

88:login:Penguin
11/06/02 20:42:21.58 ud/fx+Py.net
>>87
それだと行数が多いと後半の表示が少なくなっちゃう

89:login:Penguin
11/06/02 21:02:20.14 Z7QDCEkg.net
>>88
2行のときは
1/1の確率で1行目が選ばれる
→1/2%の確率で2行目が選ばれる

3行のときは
1/1の確率で1行目が選ばれる
→1/2の確率で2行目が選ばれる（この時点で1行目、2行目の確率はともに1/2)
→1/3の確率で3行目が選ばれる（2/3の確率で1or2行目が残り両者1/2なので全て1/3)

のように、基本的に確率は等しいはずですが……
浮動小数点演算の精度が問題になるような行数の話でしょうか？

90:86
11/06/02 22:17:12.88 jvZfUiPL.net
>>87
お、これはすごい！考えたなー。ぱっと思いついた奴は、天才だ。こんな風になりたいわ。

> 浮動小数点演算の精度が問題になるような行数の話でしょうか？
これは初め見たとき思ったけど、それが問題になるなら、
私の書いた方法でもメモリが逼迫してまずい気がします。
ただ、精度やrand()の性能で、実際に統計取ったら88の言うようになるのかもしれません。

あとは、rand()が1を返す実装はないよね？gawkのマニュアル読んで書くのだけど、
関数の説明が簡単に書き過ぎていて、ちょっと不安。

91:login:Penguin
11/06/02 22:37:43.51 jvZfUiPL.net
不要な部分を全部削って87の方が2バイト短いか。
mawkだとsrand()を省けるから、もっと短い。エレガント！

それにしても、4ヶ月ぶりに上がったんだ。ほんと人居ない。

92:login:Penguin
11/06/02 22:45:23.28 twwaY/QA.net
ワタスは監視してますよ。

93:login:Penguin
11/06/03 00:28:36.43 lUf7A9Qj.net
俺も。

94:login:Penguin
11/06/03 00:49:49.88 cydHNqeK.net
じゃあ、暫く書く

95:login:Penguin
11/06/03 01:07:11.81 cydHNqeK.net
空行を削除する
awk 1 RS=

sedだと、
sed /^$/d
かな？同じ9文字か。

96:login:Penguin
11/06/03 09:20:27.26 5n/j2qmP.net
>>89
rand()を全行で実行しているから、
１行目には２行目以降が x を上書きする確率が加わり、
２行目には３行目以降が x を上書きする確率が加わり、
ってことになるんじゃないのかな。

全４行の場合
１行目が表示される確率 1/1*1/2*1/3*1/4
２行目が表示される確率 1/2*1/3*1/4
３行目が表示される確率 1/3*1/4
４行目が表示される確率 1/4
って感じで、最終行が表示される確率が一番大きい気かします。
rand()をBEGINの中に入れてしまえば全部同じだけど。

97:login:Penguin
11/06/03 09:45:41.12 TAmMFFcQ.net
>>96
1/1*1/2*1/3*1/4 + 1/2*1/3*1/4 + 1/3*1/4 + 1/4 = 5/12 (≠ 1)
なので、それが誤りなのは、すぐに分かるはずですが……
それらの確率を足したら1になっていないといけません
ここは高校数学の確率統計のお話をするスレではありませんが、
以下のように考えたらお分かりでしょうか？

1行目が表示される確率は 1/1*1/2*2/3*3/4 = 1/4
(1行目が選ばれる確率 * 2行目が選ばれない確率 * 3行目が選ばれない確率 * 4行目が選ばれない確率)
2行目が表示される確率は 1/2*2/3*3/4 = 1/4
(2行目が選ばれる確率 * 3行目が選ばれない確率 * 4行目が選ばれない確率)
3行目が表示される確率は 1/3*3/4 = 1/4
(3行目が選ばれる確率 * 4行目が選ばれない確率)
4行目が表示される確率は 1/4
(4行目が選ばれる確率)

98:login:Penguin
11/06/03 12:56:40.94 yy0ffQt3.net
>>97
そうでした。電車の中で気が付きました。
x が上書きされる確率じゃなくて、上書きされない確率を掛けないといけませんでした。
納得。

99:login:Penguin
11/06/03 22:11:19.49 cydHNqeK.net
なんか利点が無いように見えるので、sedじゃなくawkを使う理由を探してみた。

tar xf linux-2.6.39.1.tar.bz2 --wildcards '*.c' -O >src.txt
time cat src.txt |awk 1 RS= >/dev/null
real 0m3.172s
user 0m2.786s
sys 0m0.757s

time cat src.txt |sed /^$/d >/dev/null
real 0m32.503s
user 0m31.465s
sys 0m0.882s

※参考
time cat src.txt |cat >/dev/null
real 0m0.606s
user 0m0.036s
sys 0m0.586s

おー。sedより、ずっとはやーい
やったね、awk！

100:login:Penguin
11/06/03 22:26:22.52 lSuFEE/Z.net
うむ。grep よりも awk の方が速かった記憶がある。

101:login:Penguin
11/06/04 12:42:54.20 HzZByxDX.net
複数のtimeコマンドの出力から平均を求める
awk -Fm '{ a[$1]+=$2; a[0,$1]++ }; END{ for(i in a) if(i~/^[rus]/) printf "%sm%.3fs\n",i,a[i]/a[0,i] }'

昨日の時間計測のために書いた。
いろいろ問題あり。これ以上短くかけなかった、残念だわ。

sedがすっごい遅いので全部メモリに読み込んで処理させてみた。
time cat src.txt |sed -n '1x;1!H;${x;s/\n\n\+/\n/gp}' >/dev/null
real 0m24.515s
user 0m18.584s
sys 0m2.005s
# ちなみに、昨日のも含めて3回試した結果を平均した

…やっぱ遅い。GNU sedが悪いの？スレ的に満足な結果だけど。
便利で速くてシンプルなのに、あまり使われない紹介されない、消え行くawk、カワイソス

102:login:Penguin
11/06/04 13:21:18.28 El9DLlK0.net
フィールドを抜き出すワンライナーはやっぱawkでしょ
perl -pae'$_=$F[8].$/'
ruby -nae'puts$F[8]'
awk 'print$9'

103:login:Penguin
11/06/05 00:51:57.16 kp3qNbsC.net
>>95の表記初めて見た
このスレの住民にはこれくらい当たり前なのか…

104:login:Penguin
11/06/05 05:45:10.75 jNueNt7Q.net
それってどういう構造なんだ？
1番目の引数である「1」は「パターンは常に成り立つ、アクションは指定しない(=レコードを加工せずに出力)」というawkコードだろうけど
その次の引数って入力ファイルになるはずじゃ？

105:login:Penguin
11/06/05 07:57:57.27 k4Gl3aKk.net
わかんねー。なんでこれをコマンドプロンプトに打ち込んで、うまくいくのか。
gawk 1 RS= testfile.txt

106:login:Penguin
11/06/05 08:10:41.12 SucWQMoo.net
RSが空だとRS=\n+として解釈されるんじゃまいか

107:login:Penguin
11/06/05 08:50:42.42 jNueNt7Q.net
だとしても、何故にRS=\n+がコードとして実行されるの？
コードは1で終わってね？

108:login:Penguin
11/06/05 09:34:08.07 jNueNt7Q.net
自己解決、assignment optionsなんて仕様があったのか

109:login:Penguin
11/06/05 09:55:54.81 Tq0aYVo2.net
おー、いっぱい居るね！まだまだやれるぞ、awk！

一応説明すると、プログラム自体は>>104の解釈の通りです。

また、RS=""なら、RS="\n\n+"とほぼ同じです。
違いは、RS=""はファイルの先頭に改行が続くとき、それを無視します。

ついでに、POSIXではRSに2文字以上設定すると、結果は不定とされています。
gawkでは、正規表現を使える拡張がされていますけど。

引数ですが、ここに代入文を書くとBEGINの後に処理されます。
まあ、ああ書いたのは-vオプションを使うと3文字コマンドが増えるからなんですが、
こういう変数の設定方法もあるということで。

110:login:Penguin
11/06/05 10:44:14.22 3GXVErWF.net
awk /./

の7文字だけでOK
RSは初期値が入ってるんだから

111:login:Penguin
11/06/05 14:48:51.10 jNueNt7Q.net
そうか、sed /^$/d って grep . で良かったんだな

112:login:Penguin
11/06/05 19:30:13.18 Tq0aYVo2.net
>>109
書き忘れ。
RS=""のとき、ファイルの末尾の改行も無視する。
あと、FSが"\n"に設定されているように振舞う。
元々複数行を一気に処理したい場合に使うことを想定してたのだろう。

>>110
ああ、すごい、これは短い！頭柔らかいねえ、スマートだわ。
夢の中でも考えたのに…無能過ぎワラタ

>>111
grep最強伝説はっじまっ…らないぞ。同じ方法で時間計測したら2時間半たっても終わらない。
grep捨ててawkを使おう！

113:login:Penguin
11/06/05 20:13:50.57 k4Gl3aKk.net
awkはじまったなｗ

114:login:Penguin
11/06/07 23:28:39.30 pixJYa/G.net
改行をWindows向けに置き換える
awk '{ print $0 "\r" }'

こっちの方が速くて短いか。
awk 1 ORS='\r\n'

115:login:Penguin
11/06/08 00:28:22.25 AGBbsX8a.net
速くて短いし、そっちのがコードと意味が一致するかと

116:login:Penguin
11/06/08 01:01:03.76 48mfCmU6.net
そっかー、分かり易さは、上の方だと思ったのですよ。
下のは、awkがどう動くかを知ってないと気持ち悪い感じ。
101みたいなsedスクリプトを、初めて見たときのような。

117:login:Penguin
11/06/08 06:42:33.45 3juXEiES.net
上だと\n\rになっちゃうけど
CRLFの\r\nとは違うから
Windowsでは認識しないのでは？

118:login:Penguin
11/06/08 12:16:04.61 AGBbsX8a.net
>>117
いや、上のコードは\rが先に出力されるからあってるよ、改行じゃなくて普通の可読文字でためしてみ

119:login:Penguin
11/06/09 23:01:35.59 b4gs0WW2.net
Windows向けの改行をUnix向けに置き換える
awk 1 RS=\\r ORS=

改行弄ったら戻したいよね。一文字多い別解。
awk 'sub(/\r/,"")'

>>117
$0にRSは含まれない。print文での出力のときにORSが付けられる。
だから、114のような書き方ができるのです。

え？素直にnkfとかtr使うべきだって？ごめんちゃい。
tr -d \\r
nkf -d
短いねえ…そして速そう…

120:login:Penguin
11/06/12 23:20:31.21 8N8UbY4v.net
正規表現にマッチした部分を全て置換し、その行を表示する
awk 'gsub(/foo/,"bar")'

sedで書くとこうか。
sed -n 's/foo/bar/gp'
こういう処理はsedの方が楽に書けるのかな、うーん。

>>119
awk 'sub(/\r/,"")+1'
下はこの方が良かった。うっかりファイルの内容を消してしまいそうだ。

121:login:Penguin
11/06/13 19:11:34.42 NkVjy07h.net
だいたい置換はsedで書いたほうが素直に読みやすいと思う
逆にそれ以外のツールでもスクリプトでもなく、awkで書きたくなるのはフィールドを使うものかな

122:login:Penguin
11/06/13 22:57:31.80 0YRj9/YK.net
いや、しかし最近目から鱗落ちまくりです。沢山の書き込みに感謝感謝。

123:login:Penguin
11/06/14 21:28:05.61 ODOs6IfG.net
中身の検索はgrep
置換はsedとかtr
結合はcatとかpaste
計算はexprとか場合によりwc
多少組み合わせる必要があるならshでシェルスクリプトwhile、for、read、shiftみたいな

大抵やりたいことに対応するコマンドがある。awkでプログラム風に書くのは人を選ぶのかもね。
このスレが太古の昔に沈んでしまったのも、そのせいか。
実際、プログラム板にもあるけど、あちらはそこそこ書き込みがある。

Linuxも既にGUI全盛、バッチ処理もGUIでという流れか、シェルスクリプト総合スレもなくなってしまったし。
板全体がほとんど動作報告中心になって、Linuxやシステム全体のコアな部分、プログラミングの話題を
話す場所が消えてしまったような気がする。気がするだけ。

124:login:Penguin
11/06/14 23:04:41.82 CILjaNiq.net
シェルスクリプトはUnix板で話せばいいしな
Linuxでメジャーなシェルは大概BSDとかでも使えるし

125:login:Penguin
11/06/15 21:26:33.76 QLTzRiMx.net
HTMLファイルからタイトル（title要素の持つ文字列）を取得する
awk '/<title>/{ b=1 }; b{ s=s $0 RS }; /<\/title>/{ gsub(/.*<title>|<\/title>.*/,"",s); print s; exit }'

分かりやすさと効率を無視、短さを優先した別解。
awk '{ s=t=s $0 RS }; gsub(/.*<title>|<\/title>.*/,"",t)>1{ print t; exit }'

どっかのスレにて、出遅れ、荒れ気味なので。
改行も保存してるけど、必要ないならRSを除けばいい。
perlの無いシステムでもawkはある！はず。

いつの間にかUnix板のシェルスクリプトスレまで無くなってやがる…

126:login:Penguin
11/06/15 22:50:13.28 QFQ0PbYI.net
ホントだ、何でだろ

127:login:Penguin
11/06/16 00:11:48.62 oqM9OV4C.net
980超えたからだな

128:login:Penguin
11/06/16 00:29:05.98 G4IIl/GQ.net
ああ、そうだったのかー。でもまだ次スレ建ってないね。
スレ建てた事無いから分からないけど、最近建て難いようだし、そのせいかな。

112で諦めたgrepで空行を削除する処理の時間計測の結果。
time cat src.txt |grep . >/dev/null

real 342m52.646s
user 337m34.249s
sys 0m7.174s

grep -V
GNU grep 2.6.3

寝て起きたら終わっていた。余程grepを必要とするときくらいしか、使うべきじゃない。
# 一つのケースでしかないのだけどね。ただ、これほど遅いとは…

129:login:Penguin
11/06/16 09:39:38.00 iftKRWTE.net
>>125
それ、xgawkで書くとどんなになるの?

130:login:Penguin
11/06/16 10:18:36.69 x2P5GNsY.net
>>129
gawk '$0=gensub("</?title>", "", "g", RT)' RS='<title>.*</title>' IGNORECASE=1

131:login:Penguin
11/06/19 18:13:12.21 O1oYVV5e.net
>>128
待てよ…awkでもパターン検索だけなら遜色なく書けて
かつawkのが速いんじゃ、grepの存在価値って…

ああ、複数ファイルからの検索があるか
つーても、これもawkでFILENAMEとFNR明示したら書けちゃうか…

132:login:Penguin
11/06/20 00:28:57.29 rO0fE487.net
>>131
まあgrepで済む物は記述が簡単なわけで。

133:login:Penguin
11/07/01 01:20:48.84 NsJJwAAV.net
xgawkは使ってないなぁ。使ってる鳥には無いし。XHTMLが対象ならもっと短く書けるのだろうか。

>>130
おー！これはクール。
gawkは大文字小文字無視する処理書くの楽だね。流石だ。

>>131
前後の行を表示させたりが楽かも。まあ、滅多にお世話になることないけど…
rm -r *でデータ飛ばしたから、そのサルベージに役立つとは…orz

134:login:Penguin
11/07/01 02:00:56.40 NsJJwAAV.net
コマンド`grep -C N regex'を真似する
awk 'BEGIN{ L=N; b=L+1; n=L+2; i=j=0; s=2 };
　　 /regex/{ if (L&&s==1) print "--"; while (i!=j) { print a[i++]; if (i==b) i=0 } n=s=0 };
　　 n>L{ a[j++]=$0; if (j==b) j=0; if (i==j) { i++; if (i==b) i=0; if (!s) s++ } next }; n++<=L'

書けた！！データ飛ばすは、アク禁に巻き込まれるは散々だった。よく見たら凄い遅レスだ…
データのサルベージに使ったgrep -Cを書いてみた。流石にワンライナーとは言い難い。
効率はもう少し良くできそうだけど、これ以上短くするのは無理だった。実力が足りない;_;

あまりに読み辛いので、pastebinに整形版を置いておきます。
URLﾘﾝｸ(pastebin.com)

135:login:Penguin
11/07/01 23:56:01.08 NsJJwAAV.net
時間計測の結果を追記。

time grep -C 500 'public class\|jar cf\|javac\|\.java' <strings_a.txt >/dev/null
real 0m2.112s
user 0m1.528s
sys 0m0.311s

time awk 'BEGIN{ L=500;（略）}; /public class|jar cf|javac|\.java/{（略）}; n++<=L' <strings_a.txt >/dev/null
real 1m20.089s
user 1m15.426s
sys 0m0.389s

一回計測。約50倍くらい遅いか。ネイティブとスクリプトだから、まあこうなる、と言ったところだと思う。
短い処理なら有利な場合もあるんだろうけど。

136:login:Penguin
11/07/04 00:51:55.26 Zh/tRXtG.net
指定された正規表現を含むファイルの名前を表示する
awk 'f!=FILENAME && /regex/{ print f=FILENAME }'

gawkならこう書ける。
awk '/regex/{ print FILENAME; nextfile }'

>>131に近い。FNRも使って検索結果を表示するスクリプトも、あまり複雑にはならなそう。
下の方が速いけど、mawkだとnextfileをサポートしてなかった。
grep -lと同じ結果で、指定する正規表現によってawkの方が速く動くこともあるよ。

137:login:Penguin
11/07/05 00:27:00.04 iZUKjs1P.net
AwkのGNU実装、「Gawk 4.0」が登場
URLﾘﾝｸ(sourceforge.jp)

138:login:Penguin
11/07/06 07:36:41.51 Q5KmFo/I.net
dgawk便利だね。

139:login:Penguin
11/07/07 02:54:29.78 bHkfWT8R.net
md5sumコマンドの出力から重複するMD5チェックサムを持つファイルを列挙する
awk '{ i=++a[$1,0]; a[$1,i]=$0 }; END{ for (i in a) if (!k[split(i,k,SUBSEP)] && a[i]>1) for (j=1; j<=a[i]; j++) print a[k[1],j] }'

まだ短く書けそうかな？
あるディレクトリ以下を調べるなら、こんな感じでMD5チェックサムを計算する。
find sda6.photorec -type f -exec md5sum '{}' +
この出力をパイプか何かで食わせればいい。

gawkの4.0が出たか。いろんな亜種を使う機会があるから、なかなか依存したプログラムは書けないね。
よく使うのはgawkとmawkだけど、皆何をよく使ってるのだろう？使用者が少ないから余計に気になる。

デバッガって使いやすい？いまだにprintで表示してやってるなぁ。

140:login:Penguin
11/07/07 11:14:47.64 WpiH6Omg.net
gdbやpythonデバッガやらと似てるのでとっつきやすくはあると思う。

141:login:Penguin
11/07/08 00:37:18.45 gfdD9pMC.net
fileコマンドの出力からテキストファイル（表示可能なファイル）だけ取得する
awk '{ q=$1; $1="" }; /text/{ print q }' -F:

FSは-Fオプションを使って1文字短く書く。使い方は次のようにパイプでつなぐ。
find sda6.photorec -type f -exec file '{}' + |awk '{ q="'\''" $1 "'\''"; $1="" }; /text/{ print q }' -F: |xargs -i cp -v "{}" sda6.photorec.text/

xargsに渡すためクォートしてる。ワンラインにシングルクォーテーション入ると書きづらい。
でも、こういう処理はawkが一番楽だね。

>>140
へー、それは良いね！って思ったけど自分が書くような短いスクリプトには不要かも…
今、awkでデバッガが重宝するような長いスクリプトって、どれほど書かれてるんだろう？

142:login:Penguin
11/07/08 17:00:09.91 Iqd7ejAo.net
gawkだけでurlエンコードできますか？

143:login:Penguin
11/07/08 17:42:07.69 baIcylwh.net
>>142
BEGIN{for(;i<256;++i)c[t=sprintf("%c",i)]= i==32?"+":t~/[0-9A-Za-z]/?t:"%"sprintf("%x",i)}
{for(s=i="";i++<length;s=s c[substr($0,i,1)]); print s}

マルチバイト対応してて length() とか substr() とかが
バイト数ではなく文字数を数えて動作するような小賢しい awk だと逆に動かない。

144:login:Penguin
11/07/08 19:08:55.72 gwMiQJC1.net
Gawk4.0の新オプションはそういう時のためにある訳か。

145:login:Penguin
11/07/08 19:46:11.33 CbA9+OJF.net
>>141
ファイル名には : も使えるから汎用じゃないね。
あとショートコードを意識してるようなのに不必要なセミコロンとカッコ内側のスペースが
あるのはスタイルとして一貫してないな。

146:login:Penguin
11/07/08 20:31:15.76 bJ65EBT8.net
昨日はこのスレの3周年だったのです。

147:login:Penguin
11/07/09 07:11:28.80 OcQSMVqG.net
このスレ七夕に立ってたのか。3周年って言われると、まだ3年かと思ってしまう。
3年前といえばLLが盛り上がってた頃だから、もう少し前に立ってればここももっと盛り上がっていたかもね。
gawkは新しくなったけど、確実に他のLLに流れてるよなぁ…

148:login:Penguin
11/07/09 07:34:21.50 OcQSMVqG.net
>>145
どこぞのOSでは使えない文字をわざわざファイル名に使わないよねって思い、楽してます。
ただパスに含まれる可能性はあるので、そういった場合は file -F; のようにして
fileコマンドの使うセパレータを（使われていない）任意の文字に設定して下さい。

スタイルに関しては全くその通りで、自分でも冗長だと思いつつ残しています。以下言い訳…

スペースは読み辛くなると思う所にだけ残すようにしています。また、ここに貼ると、
表示がプロポーショナルフォントになって、幅が狭い文字の隣から一部分コピペする操作をよくミスるため、
そういった幅の狭い文字（｝とか；）の後には残しています。
ifやwhileの後、print $1 や "a" b "c" に含まれるものも省略できますが、違和感が物凄いので残しています。

セミコロンは（POSIXの仕様で）必要なものだけを残しているつもりです。
過去の互換性のために省略可能なものは、残すようにしています。

149:login:Penguin
11/07/09 11:49:25.24 Ne909y4H.net
>>147
他のLLに比べて、Windowsで使われる頻度が滅法低いのも一因かなあと思う
コマンドプロンプトで awk がやれることって、BEGIN{ } に何か書くぐらいしか無いのよね
だったらPerlとかでいいじゃん、って話になっちゃう

150:login:Penguin
11/07/09 15:37:05.06 Q3LPccup.net
awkオンリーってのがムズイので、Cygwin上でsh他外部コマンドと組み合わせて使う事が多い

151:login:Penguin
11/07/09 17:09:11.40 Ne909y4H.net
結局awkはプログラミング言語というより「ちょっとややこしいことも出来るUnix系テキストツール」としての性格が強いんだと思う。

152:login:Penguin
11/07/09 17:38:27.04 OcQSMVqG.net
そうか、Windowsでの使用率は考えたことなかったわ。そっちで今何が流行ってるのかは知らないけど、
GUI扱うライブラリを持つLLが使われてそうだ。こればかりは厳しい。そもそも、ライブラリって概念がないのが避けられてるのかな。

153:login:Penguin
11/07/09 17:45:48.05 Ne909y4H.net
>>152
いやGUIはほとんどVisualStudio、Java、Delphi辺りで喰われてるよ
その他のGUIツールもあるにはあるんだけど

LLの主な出番は向こうでもテキストフィルタだったりはするんだけど
Windowsにはそもそも組み合わせるような小物のコマンド群が無いから
やりたい処理の1から10まで全部を1個（もしくは一連）のスクリプトで済ませるのが主流

だからたとえLLであっても、1言語で最初から最後までを完結できる大きめの言語が好まれるのよ
awkは単品で使うより、組み合わせで威力を発揮する言語だからか、あまり使われない

154:login:Penguin
11/07/09 17:49:54.27 Ne909y4H.net
あ、いやテキストフィルタよりもCGIとかのWebでの出番のが多いか？

155:login:Penguin
11/07/09 18:38:35.83 Q3LPccup.net
cgiでawk使う事って、珍しくないの？

156:login:Penguin
11/07/09 18:59:11.34 wbKjo2Ly.net
awkでcgiも出来なくもないだろうけど、っていうかそれでblog作ろうとしてた人もいたな

157:login:Penguin
11/07/09 19:07:48.49 OcQSMVqG.net
>>153
ホント？Delphiなんて懐かしいなぁ。GUIでなく、Webでの利用なら、もはやOSあまり関係ないような気も。よく分からん。

>>155
聞いたことはあるけど、見たことはない程度には珍しいかと。gawkはネットに対応してるから頑張ればサーバにもなれるかな？

158:login:Penguin
11/07/09 19:58:21.74 Ne909y4H.net
>>157
いやまあDelphiは新規としては瀕死で、過去遺産の保守で使われるのが主だけどね。

159:login:Penguin
11/07/09 20:14:45.59 Q3LPccup.net
やっぱawkでcgiってマイナーか。しかしblogつーか、CMS作ろうとするのは凄いなｗ

ちなみにgawkのhttpdって、どっかで見たなあ。

160:login:Penguin
11/07/09 20:57:21.04 CG+O7ik7.net
httプロトコルでなく、俺プロトコル用サーバならawkスクリプトでやってる。
httpに例えるなら、ファイルか404を返すだけの簡単なやつ。
しかもgawkのソケットでなく、inetdから呼ばれるだけの低機能。

161:login:Penguin
11/07/10 16:44:29.85 nBMv6TVB.net
私はエンバカになっても応援してるよ！＞Delphi

>>160
今更inetdって思ってて、ろくに調べてなかったけど、socatみたいな機能もあるんだね。
ポート監視→サーバ起動って機能しかないと思ってたよ。

これならネット非対応なawkでもhttpdくらい実装できる？…バイナリまともに扱えそうなのはgawkしかねー。
テキストオンリーまでなら何とかできそうだけど、画像も転送できないか。厳しい制限だ。

162:login:Penguin
11/07/11 00:10:26.11 ShNAK0f0.net
個人的にはawkは今まで通りシェルのお供でいいと思う
perlとかでもそりゃ書けんことは無いが
シェルのお供として使うには微妙に違和感あるんだよな～

163:login:Penguin
11/07/14 01:48:17.88 I04Pjvnw.net
>>134
これを使って正規表現によって grep とどれだけ実行速度に差が出るのか計ってみた。
URLﾘﾝｸ(pastebin.com)

数字だけではよく分からないので、ユーザ時間のグラフを描いた。
URLﾘﾝｸ(i53.tinypic.com)
赤がawk、青がgrep
こっちじゃないと見れないかも → URLﾘﾝｸ(tinypic.com)

awk もばらつきがあるけど、grep ほどではない。
どちらも、マッチする可能性が高い正規表現は遅くなる傾向があるのかなぁ？

164:login:Penguin
11/07/14 23:45:53.76 I04Pjvnw.net
引数で与えられたファイルをメモリに読み込み繰り返し検索する
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGV=1};{for(i=0;i<n;++i)if(a[i]~$0)print a[i]}'

最近、用途が限られているもの中心だったので使えそうなワンライナーにしてみたよ。きっと。
指摘を受けたので、スペースは削ることにしました。ちっと見づらい？

↓は大文字小文字を無視するもの。こうするとdmesgの出力を何回も検索できる。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)l[n++]=tolower(a[+n]=$0);close(f);ARGC=1};{for(i=0;i<n;++i)if(l[i]~tolower($0))print a[i]}' <(dmesg)

165:login:Penguin
11/07/15 08:26:42.31 ZNSgasJH.net
見にくいので、セミコロンで改行して欲しい。

166:login:Penguin
11/07/16 01:01:45.88 bjjWiIZ6.net
凄く長くなりそう＞＜

167:login:Penguin
11/07/16 08:37:16.54 n6+rd2ar.net
長過ぎるone-linerを見易く改行するone-linerを書きなさい

168:login:Penguin
11/07/18 15:25:02.07 7hj9vKr7.net
しまったー！書き込む前にちょろっと書き換えたところがバグってました。mawkで動きません。

>>164の下のスクリプトは次に書き換えてください。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};{for(i=0;i<n;++i)if(tolower(a[i])~tolower($0))print a[i]}'
awkのシーケンスポイントってC言語と同じなのかな…痛いミス。

おまけ。使ってるやつ。エスケープシーケンスを使って見つかった文字列に色を付けた。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};
　　 {for(i=j=0;i<n;++i)if(k=match(tolower(a[i]),tolower($0)))print C(j=!j)I(I(a[i],C(39),k+RLENGTH),C(31),k);print C()};
　　 function C(n){return"\033["n"m"};function I(x,y,z){return substr(x,1,z-1)y substr(x,z)}'
パターンごとに改行を入れた。少し見やすいか？

>>164の上のスクリプトに色を付ける機能を追加。ずっと分かりやすいと思う。
awk 'BEGIN{f=ARGV[1];while((getline<f)>0)a[n++]=$0;close(f);ARGC=1};
　　 {for(i=j=0;i<n;++i){l=a[i];if(sub($0,C(31)"&"C(39),l))print C(j=!j)l}print C()};
　　 function C(n){return"\033["n"m"}'
subをgsubにするとマッチする全ての文字列に色を付けられるよ。

gawkならgensub使ってもう少し短く書けるかもしれない。IGNORECASE=1で簡単に大文字小文字無視できるし。

169:login:Penguin
11/08/15 19:41:00.75 yTTHvZyj.net
classは使えるようになりましたか? > gawk4

170:login:Penguin
11/08/16 15:17:21.28 Tuhp+s5y.net
つ URLﾘﾝｸ(awk.info)

171:login:Penguin
11/08/16 15:27:51.45 2FR0TK0E.net
ちゃんとご自分で読んだものを「つ」されてますか?

172:login:Penguin
11/08/21 15:15:49.17 EL3rN3cw.net
ふるいけや "かわずとびこむ" みずのおと
といったレコードを、
field[1]=ふるいけや
field[2]=かわずとびこむ
field[3]=みずのおと
number_of_field = 3
とフィールド分割するすっりした方法を教えて下さい。

173:login:Penguin
11/08/21 16:45:12.36 iSpKRH15.net
" で split すればいい

174:login:Penguin
11/08/21 18:45:31.99 EL3rN3cw.net
やはり2chでは馬鹿レスしかつかんか。

175:login:Penguin
11/08/21 18:56:18.08 Fst2eXVD.net
>>172
それ、CSVとかでもよく語られることだけど、意外と面倒なのよ。
例えば「"」自体を文字列に入れたい場合はどうするのか、とか色々決めなきゃならんし。

176:170
11/08/21 19:12:48.13 yoctsNv6.net
あれ？awkでclass使いたいって事なんでしょ?
URLﾘﾝｸ(ja.wikibooks.org)

177:login:Penguin
11/08/21 19:24:48.22 yoctsNv6.net
>172
素直に区切り文字を変えるしか...

ふるいけや,かわずとびこむ,みずのおと

FS=","

178:172
11/08/21 22:01:39.45 Mb9j323G.net
自己レスです。
BEGIN { FPAT = "([^" FS "]+)|(\"[^\"]+\")" }
みたいな事をしました。

179:login:Penguin
11/08/22 10:27:15.81 bf5ta6rs.net
awk にわけわかんな機能を増やすよりも、
RFC4180 互換なフィールド分割オプションを実装すればいいのにといつも思う。

180:login:Penguin
11/08/22 10:33:38.59 uwcmdhh8.net
馬鹿の巣窟にわざわざ書き込むな馬鹿

181:login:Penguin
11/08/22 11:11:08.80 4smqF+KA.net
見事に馬鹿の巣窟と化したねえ

182:login:Penguin
11/11/28 19:46:48.89 NIKBR+N1.net
perl -e 'print $1 if /href="(¥d¥d¥d¥d-¥d¥d¥-¥d¥d)"/'
と同じことをawkでやろうとしているのですがわかりません。
awk -e '/href="(¥d¥d¥d¥d-¥d¥d¥-¥d¥d)"/ { print ??? }'
グルーピングしたあとにそれを取り出す方法を探したのですが、わかりませんでした。
awkまたはsedでのやり方を教えて下さい。

183:login:Penguin
11/11/28 20:46:46.52 skmC2JM9.net
>>181
馬鹿じゃないあなたに是非>>182の回答をしてもらおうか。

184:login:Penguin
11/11/28 21:15:52.48 Oo5SGhpX.net
>>182
perl がわからないから求めるものがよくわからないけれど、こんな感じ?

awk '/href=\"[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]\"/ {print $1}' input.html

awk '/href=\"$[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]$\"/ {print $1}' input.html

BEGIN とか使ったほうがいいのかもしれないけれど
awk '/href=\"[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]\"/ {print $1} BEGIN { 何か書く }' input.html

185:login:Penguin
11/11/28 23:48:15.14 mynsjW2o.net
>>182
どのawk使っているか分からないし、入力の仕様も分からないけど、どこでも動くのはこんな感じ
awk -F\" '/href=/ { for (i=1; i<=NF; i++) if ($i ~ /href=$/ && $(i+1) ~ /[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]/) print $++i }'
gawkでも正規表現パターンのグループを保存している組み込み変数はなかった気がする

186:login:Penguin
11/11/29 00:49:47.68 6tCpTQmb.net
gawk4.0なら
awk '{if (match($0,"href=([0-9]{4}-[0-9][0-9]-[0-9][0-9])",a)) print a[1]}'
じゃ駄目?

187:login:Penguin
11/11/29 01:04:03.02 6tCpTQmb.net
ごめん、
awk '{if (match($0,"href=\"([0-9]{4}-[0-9][0-9]-[0-9][0-9])\"",a)) print a[1]}'

188:login:Penguin
11/11/29 16:01:19.31 vLvhB/JG.net
>>184-186
うーん、あまりわかりやすい方法ではないですね。
メンテナンスしにくいコードになってしまうので、perlが使えるよう上司に交渉したほうがよさそうです。
回答いただいた方、ありがとうございました。

189:login:Penguin
11/11/29 16:28:12.31 MmS6Zrem.net
>>185はともかく>>186-187の方がPerlみたいにグローバル変数にマッチ結果を入れるより分かりやすいと思うのって俺だけ？

190:login:Penguin
11/11/29 17:00:24.97 vLvhB/JG.net
>>189
186は、単にgawk独自の拡張機能を知ってないとわかりにくいというだけであり、
マッチした結果を明示的に変数に代入するのはいいことだと思います。
なお個人的には
match(string, rexp, matched)
はmatchedがいわゆるout変数になるため分かりにくいです。
matched = match(string, rexp)
のほうがよかったです。

191:login:Penguin
11/11/29 17:27:04.96 8ESv/UnH.net
>>190
何言っているのかちょっと分からん。言語仕様上awkは配列を返せないだろ

192:login:Penguin
11/11/30 00:16:56.92 CRejWMLU.net
gawk独自の実装はどうも…という話がよく出てくるけど、
gawk/mawk/true awk相互で運用する必要ってよくあるものなの？
またはbusyboxのawkで使いたいとか？

193:login:Penguin
11/11/30 02:39:57.37 TGbwU425.net
gawkは最早awkと呼ぶには拡張され過ぎている感じがある
よくあるかは知らないけど、少なくとも手元の環境には3種類のawkがあって、gawkの拡張が使えない
mawkはnextfileにも対応してないし、awkは実装の差がかなり大きいと思うよ

194:login:Penguin
11/12/01 00:38:55.88 cIbdY7f8.net
gawkが拡張されてるのは承知だが、gawk依存だとメンテが大変だから
perlというロジックが分かりにくい。

195:login:Penguin
11/12/03 01:06:16.24 0aRpOAWF.net
gawkで

(ああ(いい((うう)(ええ))))

この行の「ああ」「いい」「うう」「ええ」を変数に入れたい時、
何か定番な書き方はありますか？

196:login:Penguin
11/12/03 01:56:31.82 ivCb+cNz.net
何を期待しているのか分からん
括弧を区切りにして分けたいだけならFS="[()]+"で
配列に入れたいならsplitでどう？

197:login:Penguin
11/12/03 01:59:50.51 ivCb+cNz.net
もしかして括弧の対応をとりながら分けたいってことなら
gawkに詳しい別の誰かに期待してくれ。拡張正規表現でも無理じゃなかったか

198:login:Penguin
13/03/07 06:45:54.68 4D+kiInZ.net
str = "(ああ(いい((うう)(ええ))))"
while (match(str,/([^()]*)/)) {
v = substr(str,RSTART+1,RLENGTH-2)
str = substr(str,1,RSTART-1) substr(str,RSTART+RLENGTH)
if (v != "") {
# 取り出した v をなんかする
}
}
とかじゃ駄目なの？
ちゃんと構文解析するなら yacc (bison) を使わないと駄目だよ

199:login:Penguin
13/03/12 12:42:06.70 qyuXfAO9.net
　　　　　 _
　　　　　 |O＼
　　　　　 |　　＼　ｷﾘｷﾘ
　　　　∧|∧ 　　＼　ｷﾘｷﾘ
ｸﾞｸﾞｩ>（；⌒ヽ　　　＼
　　　　∪　　|　　　　(~)
　　　　　∪∪　　 γ´⌒｀ヽ
　　　　　）　）　　　{i:i:i:i:i:i:i:i:}
　　　　（　（　　　　(　´･ω･)、
　　　　　　　　　　　(O ⌒　)O
　　　　　　　　　　⊂＿)∪

200:login:Penguin
13/03/20 12:52:31.89 YjhinaPB.net
しつもん
URLﾘﾝｸ(gauc.no-ip.org) のスクリプトの35行目

for (++day;;) {

の意味と動作がよくわからんです
which で等価なループを書くとどんな感じになるの？　ｶｺｲｲ先輩おしえてplz

201:login:Penguin
13/03/20 20:01:52.34 BDkPT9MX.net
>>200
++day; while (1) {

202:login:Penguin
13/03/20 22:53:22.42 YjhinaPB.net
>>201
先輩ありがとう
++day を最初に持ってくるのはｵｲﾗも考えたんですが、break の条件式も反転して持ってくればおkかなと思って

$ diff time.awk time2.awk
34,35c34,35
<
< for (++day;;) {
---
> ++day;
> while (day >= year_days) {
49,52d48
< }
<
< if (day < year_days) {
< break;

てやったら１日ズレちゃったんだけどこれってどこがマズいんでしょうか（・ω・` ）

203:login:Penguin
13/03/22 01:16:43.88 Jmj0m+XB.net
>>202
そのbreakの後にも続きの処理があるだろ。年もズレるんじゃない？

204:200
13/03/24 14:19:31.22 UI34mYpn.net
>>203
day の値を追っかけてみたら元のfor、変更後のwhileともに同じ値で終了してたので頭抱えてたんですが
もう少し調べてみたら leap の値がズレてました
break の前の処理が１回分少なかったということで、落ち着いて考えれば当たり前の結論でした (;´Д`)

結局この処理の場合は元々のスクリプトや >>201 のように無限ループ使うのが一番シンプルに
書けるんだなーと確認して納得しました。先輩方ありがとう

205:login:Penguin
14/03/21 07:35:13.02 TlIvqwz8.net
>>205
URLﾘﾝｸ(www.amazon.co.jp)

206:login:Penguin
14/03/21 13:50:53.67 2joEzm1b.net
たけえわ！
こういう本こそ電子版にしてくれねえかなあ

207:login:Penguin
14/03/21 22:38:59.40 +P5ZN4Ej.net
レスありがとうございます
高いけどあるといえばあるんですね
どうしようかな

208:76
14/03/21 23:39:07.83 UPcdeELD.net
ブックオフで先週見たぞ

209:login:Penguin
15/01/24 09:55:38.14 gAuUge45.net
持ってたけどいつの間にか捨てていた

210:login:Penguin
15/01/24 12:11:48.77 4AXaMrRk.net
紙質が悪くてボロボロになった

211:login:Penguin
15/02/03 13:34:28.90 lZQLBw3l.net
Linuxも電子版出してほしいな(´・ω・｀)

212:login:Penguin
16/08/29 23:40:58.70 W/IDgrhA.net
Gawk4.1.4出てたのか。

213:login:Penguin
16/11/09 18:03:36.84 XXe91GfC.net
なつい

214:login:Penguin
17/01/25 11:01:32.67 6VFENplc.net
長年親しんだテキストの遊園地がなくなってて非常に悲しい
どっかにアーカイブないっすか

215:login:Penguin
17/03/17 05:15:18.56 RjcJSjOQ.net
>>214
で、それはいつできるんだ？
できたらURL貼るのを忘れんなよ

216:login:Penguin
17/03/17 05:22:31.32 RjcJSjOQ.net
URLﾘﾝｸ(archive.org)
The AWK Programming Language

217:218
17/07/10 19:23:00.44 EatnUbnm.net
おばんです。
Linux環境の方にお願いします。
下記にあるblength()を試してもらえませんか？
URLﾘﾝｸ(www1.bbiq.jp)
よろしくお願いします。

218:デフォルトの名無しさん
17/07/11 08:37:02.92 7nEGt2Mb.net
なぜそれを Linux で? 何を知りたい?

219:218
17/07/11 08:56:48.21 WwRbMPQQ.net
HP製作者です。当方の環境はWindowsです。
Linux環境下で同じ実行結果を得ることができるのか、
知りたいのです。
よろしくお願いします。

220:login:Penguin
17/07/11 11:06:05.29 DDC9W9sY.net
いい機会だからLinux入れちゃえば

221:218
17/07/11 11:10:26.52 WwRbMPQQ.net
それもそうですね。
昔々REDHATだったか入れていました。
現在のおすすめのディストリビューションは何でしょうか？

222:login:Penguin
17/07/11 12:32:44.18 tm800Hl5.net
今はMS製のcygwinみたいのがあるのでは。Windows 10 Bashナントカ

223:218
17/07/11 12:42:28.77 b8V9VslP.net
Windows 10 Creators UpdateでUbuntu 16.04.1　これかな。
やってみます。ありがとうございました。

224:login:Penguin
17/11/21 02:37:01.57 PQah4bj0.net
jgawkをガウォークって読んでたマクロスヲタいない

225:login:Penguin
17/12/29 14:37:58.78 S/CsVkMC.net
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒　『宮本のゴウリエセレレ』というブログで見ることができるらしいです。
グーグル検索⇒『宮本のゴウリエセレレ』
DCQTVO9E2N

226:login:Penguin
18/01/15 20:15:48.31 eZF7GqQ1.net
空の配列はどう作るの。
bashの declare -a var 相当。

227:login:Penguin
18/05/22 08:18:57.94 Czl6p0FW.net
僕の知り合いの知り合いができた副業情報ドットコム
関心がある人だけ見てください。
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』
V09DR

228:login:Penguin
18/08/06 01:01:52.57 lYVh6drB.net
Linux Beep Musicに感動したのでnokia2beeps.tclを移植してみた
URLﾘﾝｸ(pastebin.com)
nokia2beeps.awkとか保存し下記のページのコードを鳴らすやつ
URLﾘﾝｸ(nokia.nigelcoldwell.co.uk)
あと日本語の着メロも対応してる(コメント参照)

229:login:Penguin
18/12/26 23:28:57.46 41RDdYnE.net
awk だけど実行ファイルのフォーマットは ELF …いや、なんでもないです。

230:login:Penguin
19/02/17 10:18:47.85 tq2CmSlw.net
初心者ですが正規表現で半角をすべてというのはどうやるんでしたっけ
どっかで見たような気がするんですが

231:login:Penguin
19/02/17 14:29:57.54 kuwCjzfH.net
「半角」ってどう定義するのか難しいな
この辺読んでがんばれ
URLﾘﾝｸ(www.gnu.org)

232:login:Penguin
19/02/18 16:59:38.97 bs/RCYIZ.net
>>226
Awk の識別しは、最初っから空の配列だよ
いきなり使えば良い

233:login:Penguin
19/02/18 17:04:21.28 bs/RCYIZ.net
みなさんはgawk以外の処理系に移植できるか
とか、多少でも考えますか？私は気にしなくなりました。
他にも幾つか実装があるにはあるんですが、あんまり
活発じゃないし、言及もされないし、こだわりすぎると
不便でしょうがないから、気にしなくなりました。
けしからんでしょうか？

234:login:Penguin
19/02/18 20:36:34.78 uVw99/R9.net
GNU awkが事実上標準だからPOSIX準拠は気にしないな

235:login:Penguin
19/02/22 21:05:04.57 HUsgEyAs.net
ＡＷＫ４８！！

236:login:Penguin
19/04/17 15:19:28.33 j5OQY4r8.net
GNU AWK 5.0がリリース。8年ぶりのメジャーバージョンアップ。正規表現ライブラリが
GLIBCからGNULIBへ移行、名前空間が実装　2019年4月17日
URLﾘﾝｸ(www.publickey1.jp)
UnixやLinuxにおいてsedやgrepなどと並んでよく知られているツールの1つがawk（オーク）
です。このawkのGNUプロジェクトによる実装の最新版「GNU AWK 5.0」（gawk 5.0）の
リリースが発表されました。
2011年にリリースされたGNU AWK 4.0から8年ぶり、直前のバージョンでとして2017年10月に
リリースされた4.2.0からは約1年半ぶりとなります。
AWKはいわゆるスクリプティング言語の一種。変数や関数、制御文など基本的な構文を備え、
テキストファイルを効率的に処理できるのが特徴です。
GNU AWK 5.0の新機能としては、printfの%aおよび%Aの書式がPOSIX標準に準拠したこと、
正規表現のルーチンが、長年にわたってメンテナンスされてきたGLIBCからGNULIBに
置き換わったことなど。
また、識別子に非英語文字を使うためのドキュメント化されていなかったオプションなどは
削除され、ソースコードはC99環境が想定されるようになっています。
そして新たに名前空間が実装されています（詳細はマニュアルを参照とのこと）。

237:login:Penguin
19/04/17 17:39:45.30 oKn1+k+8.net
名前空間って、これまでのスクリプトが動かなくなるんだべか。

238:238
19/04/17 22:27:02.77 oKn1+k+8.net
さすがにそれは無かった。
$ gawk --version
GNU Awk 5.0.0, API: 2.0 (GNU MPFR 4.0.2, GNU MP 6.1.2)
:
$ gawk 'BEGIN{print awk::ARGC}'
1
$ gawk 'BEGIN{print ARGC}'
1
$

239:login:Penguin
19/12/04 08:39:54 EOFhhwOn.net
ageで行こう

240:login:Penguin
19/12/04 18:18:20.57 8Zd1xJ0mr
>>226
BEGIN {
for (i in a); #空配列作成

if (isarray(a)) print "aは配列である";
else print "aは配列でない";
}

241:login:Penguin
19/12/10 14:57:28.86 RI3PNloA.net
gawkでキーボードから一文字入力をしたいんですが、何かいい方法ないでしょうか？
stdinをgetlineするのではなく、キーを何か一つ押したときにそのコードを即座にgawkで受け取りたいんです。
具体的に何がしたいのかというと、BEGIN内部でスクリプトの動作を設定するパラメタをキーボードで指示したいんですが、
その支持を矢印キーでメニュー選択させたいんです。
ターミナルのエスケープシーケンスはVT100環境を想定しています。
何かヒントでもいいので一文字入力の方法を教えてください〜
gawkはこれ使ってます。
GNU Awk 4.2.1, API: 2.0 (GNU MPFR 4.0.2, GNU MP 6.1.2)

242:login:Penguin
19/12/10 15:04:17.01 RI3PNloA.net
追記
gawkを動かす環境はubuntu19.04で、主にWindowsからteratermでsshログインしての使用を考えています。

243:login:Penguin
19/12/10 19:53:29.48 /8T+qheh.net
>>241
awkじゃなきゃあかんの？
cursesでやればいいと思うけど

244:login:Penguin
19/12/11 00:25:34.40 ysC5v/gW.net
>>243
awkでやりたいんですよ。
cursesってawk用ライブラリありましたっけ？
自分アホなりに色々調べて、"read -n 1" をうまく使えば文字コード取れそうという所までは気がついたんですが、
これをawkスクリプト中で実行させて戻り値をawk変数に取り込む方法がわかりません。
どうすれば文字コードが取れるんでしょう？

245:login:Penguin
19/12/11 03:25:34.73 YST7j856.net
試さないで適当に書いてみるけど
一文字読みとる command 用意して
command | getline var
もしくは入力された文字を終了ステータスとして返す command で
var = system(command)

246:login:Penguin
19/12/11 09:57:26 JotyB0zR.net
試してから書きゃいいのに。

247:login:Penguin
19/12/11 17:11:40 w4fDC3xv.net
>>244
確かにそれはちゃんと機能する。しかし、矢印キーとなると話は別だ。
矢印キーは 3 バイトだから。
1 バイト読んで ESC だったらもっと読むということになる。
もちろん ESC じゃなかった場合のことも考える。
想定した処理が全部終わった後で、印字可能文字で 1 行で出力する
…というプログラムを C で書くということになるかなあ。
ところでエコーバックはどうする? 多分、こんなこともしたくなるんじゃないか。
URLﾘﾝｸ(qiita.com)

dialog とか使った方がいいんじゃないかな。

248:login:Penguin
19/12/12 01:58:28.69 +gdBEfoc.net
なんかすみません。
dialog & shell & awkでできるのはわかってるんですが、なんか負けたような気がしてｗ
なんとかshellのコマンドか標準で入っている外部コマンド & awkでできないもんかと思ったんです。
Linux ←→ Windowsのポータビリティを考えた場合、やはり1文字入力してそれを返すだけの小さなプログラムをCで作ってawkでそれを呼んで戻り値を得るのが一番手っ取り早いのかな、と思いつつあるところです。
でも、もう少し最初の路線で調べてみます。徒労に終わりそうな気はしますが。

249:247
19/12/12 16:49:42.78 Ks56aDFp.net
bash でも出来なくはないと思う。読むだけならいくらでも出来る。
しかし、「残さず食べる」ということを考えると read -n はちょっと…
なぜこれを考える必要があるかというと、食べ残しがあるとたとえばシェルの場合なら
それをコマンドラインだと思って読んでしまっだりする。
read -n は食べ残しが無かったら入力待ちになってしまうので適していないと思う。
他人に使わせるプログラムなら常に意識しておくべきことかもしれない。
そこで、まだ試してないならこんなことを試してみてほしい。
BEGIN {
cmd = "bash -c 'TMOUT=5 ; read -N 8 v ; echo \"$v\" ;'"
for( i = 0; i < 8; i++){
while ( 0 < ( cmd | getline)){
print "i=" i ", 0=[" $0 "]"
}
close( cmd)
}
}
得られたデータの長さが指定した長さに達していないならタイムアウトで終了した。
つまり、食べ残しは無いということになると思う。
ただし、改行の扱いがめんどくさい。
bash は read で読んだ改行をちゃんと送っているのだが getline が削除してしまう。
そして最後の改行は echo が加えたもので、read で読んだのではない。
awk の方で RS の値を変えることでめんどくささが減る可能性はある。
しかしやはり最終結果だけを 1 行で受け取るほうがいいかもしれない。
もっとも、入力元を共有しているから食べ残しが問題になるのであって
新たに端末エミュレータを起動してその上で実行するのなら問題にならない。
パイプが繋がらないから別の方法で結果を返す必要はあるが、メニューを出して
ユーザに選択させるという用途なら悪くない方法かもしれない。

250:login:Penguin
19/12/12 17:04:12.98 Ks56aDFp.net
そもそも「リターンキーで決定」とかなら食べ残しの心配は無いかな?

251:login:Penguin
19/12/13 04:10:04.34 For+FbwN.net
ありがとうございます。
-Nオプションでタイムアウト指定をするというのは目からウロコでした。
秒数を1にして、できるだけレスポンスのいい動きをさせようと思います。
矢印キーは3文字、Fnキーは5文字になるんですね。
そんなことも知りませんでした(汗
今日はawkにはpythonやperlにはあるord関数とchr関数が無いことを知って愕然としてました(笑)
文字を受け取ったはいいものの、文字コードをどうやって調べようかと悩んで行き着いた先のコードです。
笑ってやってください。
function ctblmake(ctbl) {
for (i = 0; i < 255; i++) {
ctbl = ctbl sprintf("%c", i);
}
return ctbl;
}
function ordhex(c) {
return sprintf("%02x", index(ctbl, c)-1);
}
BEGIN {
ctbl = "";
ctbl = ctblmake(ctbl);
print ordhex("?");
print ordhex("c");
print ordhex("b");
}
今日はもう寝ます

252:login:Penguin
19/12/13 09:49:46.45 WFJlAa92.net
perlとかでやれよ。
awkで簡単に出来ることをsed+grepで頑張る人達がクダスレ辺りに沢山いるが、それと同等だろう。
知恵の輪としては面白いけれど、成果には乏しいのでないか。

253:login:Penguin
19/12/13 13:58:14.66 +ky049vi.net
それを言っちゃあおしまいよ

254:login:Penguin
19/12/13 20:04:51.41 For+FbwN.net
なんか、返事するのがアホくさくなってきました。
さようなら。

255:login:Penguin
19/12/13 22:45:11.81 db+XusY3P
頭使って面白いなら、贅沢に時間使ってAWKでできること
何でもやるべき
時間がなきゃ252みたいになる
成果？笑わせる

256:login:Penguin
19/12/13 23:44:48.59 gNHNDwLS.net
awkはまずデータファイルありきで便利なものだしねえ。
趣味でどういう使い方しても勝手だけど。

257:login:Penguin
19/12/14 09:10:47.22 b3dqliHo.net
>>254
Perl を知っていながら awk でやろうってんだから、この程度のことは予想できたでしょう。
無視してりゃいいんだよ。
もっとも、真剣に取り組んでいるなら他の場所を探してもいいかもしれない。
でもここにも君を助けようとした者がいたことは覚えておいてほしい。

258:login:Penguin
19/12/14 09:34:23.87 b3dqliHo.net
あっ、某知恵袋はやめときなさい。あそこは知ったかぶりが多いから。
知らないなら回答しなきゃいいのにね。

259:login:Penguin
19/12/14 10:22:52.96 pIVSIbEK.net
>>258
Linuxオタが集う外国の掲示板当たりの良いのかもな
普通のLinuxユーザーなら、awkにこだわりすぎの変な奴だになって
相手にしてはいけない・からかってやれだろうからな。

260:login:Penguin
20/01/01 02:33:22.62 TglKmVwfj
>>259
海外の方が盛でしょうしね

261:login:Penguin
20/01/23 22:20:41.03 uGOVD2VtY
teratailというところでawkの質問・回答見てきたけど
あんまりおもしろくなかった
純粋にawkの質問というのが少ない
この板は貴重、保護するに値する
やる気をスポイルするの今度から禁止な