awkについて語るスレ $2at TECH
awkについて語るスレ $2 - 暇つぶし2ch577:デフォルトの名無しさん
11/05/03 15:33:28.80 .net
>>566
NF==3 {
disp();
for(i=1;i<=4;i++) {
disk_time[i]=$1
disk_val[i]=0
}
disk_val[substr($2, 5, 1)]=$3
}
NF==2 {
disk_val[substr($1, 5, 1)]=$2
}
END{
disp()
}
function disp() {
for(i=1;i<=4;i++) {
if(i in disk_time) printf("%s disk%d %s\n", disk_time[i], i, disk_val[i])
}
}

578:デフォルトの名無しさん
11/05/03 16:12:56.67 .net
BEGIN {
    # 先頭がいきなり "disk2 15" のみで始まったりしなければ
    # この初期化は不要。
    a = "00:00:00";
}
NF == 3 {
    if (NR > 1) put();
    a = $1;
    b[$2] = $3;
}
NF == 2 {
    b[$1] = $2;
}
END {
    put();
}
function put(    i) {
    for (i = 1; i <= 4; i++) {
        print a, "disk" i, b["disk" i] + 0;
        b["disk" i] = 0;
    }
}

579:デフォルトの名無しさん
11/05/03 16:20:05.55 .net
>>569 awkの配列ってどれくらい確保可能なの?
先にsortしたらどうかな? sort データ | awk -f sum.awk
----- sum.awk -----
$1!~/商店名/{ if(store==$1 && item==$2) val+=$3; else{ disp(); store=$1; item=$2; val=$3; } }
END{ disp(); }
function disp(){ if(store!="" || item!="") print store, item, val; }
-----

580: 忍法帖【Lv=40,xxxPT】 【東電 76.6 %】 株価【E】
11/05/04 17:32:38.53 .net
ヘックション

581:デフォルトの名無しさん
11/05/06 00:54:22.24 .net
$ uname -sr
CYGWIN_NT-6.1 1.7.9(0.237/5/3)
$ awk --version
GNU Awk 3.1.8

この環境で、
awk 'BEGIN {for(i=j=1;i<50;++i) {print j; j*=10}}'
これ実行すると、jが23桁超えたあたりから、おかしくなるんだけど。

awkの整数って上限あるの?(ウチだけか?)

582:デフォルトの名無しさん
11/05/06 01:09:59.27 .net
long double辺りの精度しかないよ。

583:デフォルトの名無しさん
11/05/06 09:18:39.10 .net
>>574
おれのPCでは普通に 1 から 1e+048 まで表示されますが。。。

584: 忍法帖【Lv=25,xxxPT】
11/05/06 09:54:18.77 .net
URLリンク(ideone.com)

585:デフォルトの名無しさん
11/05/06 11:30:10.09 .net
>>576
本当ですか!よろしければ環境を教えてください。

>>577
ありがとう。ここawkも張れたんだ。結果が長すぎて困ってたのよ。
正にこんな結果になる。

POSIXで保障されてる精度は>>575ってこと?
てことは、awkは内部では、全ての数がdouble扱いなの?

586:デフォルトの名無しさん
11/05/06 14:20:04.87 .net
>>578
576です。WindowsXP + GNU Awk 3.0.6 + multi-byte extension 1.15 です。


587:デフォルトの名無しさん
11/05/06 18:58:28.81 .net
>>579
ありがとう。
あまり違いがないな。Win7は関係ないだろうし。
multi-byte extensionがその辺りも弄っているのか…

そういえば、1e+048みたいな指数で表示されるの?
出力のとき丸めるから、ちゃんと計算できてるように見えるのかな。

588:デフォルトの名無しさん
11/05/06 23:07:48.20 .net
awkでは数値はすべてdoubleで扱います。
ですからその精度である53bit分、大体15桁ちょっとを超えると正確な値を保持できません。

23桁あたりまで正しく表示できてるってのはよくわかりませんが、
3.0.6にしても出力時の書式指定が違うだけで内部的には同じように不正確な値に
なってしまってると思います。


589:デフォルトの名無しさん
11/05/07 01:38:55.53 .net
だから、実質long doubleの精度になっているんだってば。

590:デフォルトの名無しさん
11/05/07 11:11:15.94 .net
>>582
「実質」というのはどういう意味?

#define AWKNUM double

ってのがあるし、long double にしても仮数部は64bitだから23桁には足りないよ?
x87のレベルで拡張精度になってても、表示やらなんやらするところで倍精度に
丸められちゃうと思うんだけど。


591:デフォルトの名無しさん
11/05/07 13:09:06.68 .net
URLリンク(codepad.org)
完全に一致。どう見ても double です。本当にありがとうございました

592:デフォルトの名無しさん
11/05/07 21:19:09.46 .net
>>581
あう、そうなのかー。ありがとうございます。困ったなぁ。
10進で実数扱えとまでは言わないけど、整数は欲しい。
数をいろんな型で扱える処理系なんてないか。

593:デフォルトの名無しさん
11/05/07 23:01:38.63 .net
>>583
あー、long doubleと言ったのが拙かったね。10の冪の場合は実質doubleを大きく越えた精度になっていると言いたかった。

10は2と5の積だから、10倍を繰り返すときに仮数部は5倍ずつにしかならない。
IEEEのdoubleの精度だと5の22乗で53ビットを使い果たすので、そこまでは誤差が生じない。
言い換えれば、10の場合は53ビット+22ビット、即ち75ビット分精度があるように見える。

まぁ、>584を10倍じゃなくて5倍にして、doubleをlong longにして%.fを%llxにしてビット数を数えてみればわかるでしょ。

594:デフォルトの名無しさん
11/05/09 21:13:05.37 .net
gawkのユーザガイドに、他の処理系では、標準エラーを使うため、
 print "Serious error detected!" | "cat 1>&2"
という方法しかないとあります。
gawkは/dev/stderrを特別に扱うため、
 print "Serious error detected!" > "/dev/stderr"
と書くのが適切とあります。

これには、どのような違いがあるのでしょうか?
/dev/stderrがあるOSなら、catのプロセスが生成される他は、違いはないのでしょうか?
環境や処理系を問わず動作させたいなら、上の書き方の方がよいのか、気になっています。

よろしくお願いします。

595:デフォルトの名無しさん
11/05/10 00:17:11.81 .net
他の処理系って、他のawkって事だよ。

/dev/stderrがあるOSって事ぢゃなくて、
gawkは特殊なファイル名として/dev/stderrとか使えるよ、って事だよ。

なので他のOSでも gawk だったらprintとかの出力先ファイル名として /dev/stderr 使えるって話だね。
/dev/stderrとかをサポートしていないgawk以外のawkでも動作させるなら パイプと"cat 1>&2"を使う方法しかない。が、Win系はcatだと...

596:デフォルトの名無しさん
11/05/10 09:20:21.36 .net
そこまでのことをするならPerl/Ruby/Python等のちゃんとした
スクリプト言語で書いた方がいいんじゃないかな。こういう
どうでもいいところで悩まなくて済むよ。

awkはawkで手軽に書ける範囲なら他の追随を許さないと思うが
その枠をはみ出ようとすると途端に大変になる。そこが楽しいと
いうのなら無理には止めないけどw



597:デフォルトの名無しさん
11/05/10 14:35:51.09 .net
>>589
そう、それが楽しいんだ

598:デフォルトの名無しさん
11/05/11 00:36:20.77 .net
>>588
ありがとうございます。
catがない環境だと、どうしようもないですね…

>>589
コンマ区切りのデータを、シェルスクリプトで処理していたので、
それをawkに移植していました。一番手軽だったのです。

ちなみに、2時間半以上かかっていた処理が、1分以内に短縮されました。
ワラタ。   ワラタ…

599:デフォルトの名無しさん
11/05/11 10:19:43.16 .net
Cで書き直したら数秒で実行完了の予感w

600:デフォルトの名無しさん
11/05/11 12:14:45.46 .net
つーてもawkとかその他のスクリプトでサクッと書けるような文字列処理を
C言語とかではあんまり書きたくならんと思うぞw

601:デフォルトの名無しさん
11/05/24 10:19:27.54 .net
なりません

602:デフォルトの名無しさん
11/05/25 20:17:22.02 .net
あぁああぁぁぁ~~~無理だったか、、無理なのかー!a[0][0] = 1 → syntax error

603:デフォルトの名無しさん
11/05/25 21:58:46.38 .net
>>595
gawkの場合インデックスをSUBSEP(=\034がデフォルト)を挟んでシリアライズしたインデックスで多次元配列を表現する
a[0,0] = 1;
ならOKのはず。このときのインデックスは"0\0340"だから、a["0\0340"] == 1。

604:デフォルトの名無しさん
11/05/26 18:46:04.99 .net
>>596
ありがとう。始めからそれを意識して書いてたらよかったんだけどね。

god["name"] = "Kaname Madoka"
god["msg"] = "Mahoushoujo ha watashi dakede juubun dayo."
homerun["name"] = "Akemi Homura"
homerun["msg"] = "Madoka ha watashi no yome."
こんな風に書いていたのを、

puella_magi["god"] = god
puella_magi["homerun"] = homerun
みたいにまとめようとしたら、あばばばば

awkの配列って処理系によっては添え字が整数の場合、処理が最適化されて早くなったりするのかな?
構造体の代わりみたいに使いたかったのだが。

605:デフォルトの名無しさん
11/05/27 00:57:28.69 .net
name["god"] = "Kaname Madoka"
msg["god"] = "Mahoushoujo ha watashi dakede juubun dayo."
name["homerun"] = "Akemi Homura"
msg["homerun"] = "Madoka ha watashi no yome."

でよくね?

606:デフォルトの名無しさん
11/05/30 21:25:51.88 .net
awkって *どの実装でも* 一度も使ったことがない変数の内容って、スカラなら0か""になってるの?
変数が一度も代入されていないことを判定するために、(x==0 && x=="")って書いて何か問題ない?

607:デフォルトの名無しさん
11/05/30 21:31:52.21 .net
>>599
評価されるときに変数が存在しなければ作成される。はず
配列の要素なら in で調べられるけど
変数自体となるとどうだろうね

608:デフォルトの名無しさん
11/05/30 21:32:47.76 .net
>>599
何度も代入した後、最後に 0 or "" を代入した変数と区別できない。

609:デフォルトの名無しさん
11/05/30 23:19:06.92 .net
>>600-601
ありがとう。区別できないって、どういう状態になるの?0を代入したら0か"0"に評価される。
ああ、""を代入したら0か""に評価されて駄目ってことか!?

610:デフォルトの名無しさん
11/05/31 00:05:27.97 .net
あれ?試したらどっちを代入しても599の式は0に評価されたよ。区別できないケースってどういう場合?

611:デフォルトの名無しさん
11/05/31 06:28:27.99 .net
BEGIN {
    # 初期化直後 (未使用) の変数は数値 (0) と文字列 ("") の両方の型を持つ。
    print x == 0, x == ""; # 両方とも真

    x = 0;
    print x == 0, x == ""; # 前者のみ真。

    x = "";
    print x == 0, x == ""; # 後者のみ真。

    # 他の未使用の変数を代入すると "再初期化" できる。
    x = y;
    print x == 0, x == ""; # 両方とも真。
}

612:デフォルトの名無しさん
11/05/31 22:57:53.71 .net
> 初期化直後 (未使用) の変数は数値 (0) と文字列 ("") の両方の型を持つ。
IEEE Std 1003.1 の awk の EXTENDED DESCRIPTION の
Variables and Special Variables に書いてあるね。 uninitialized value というらしい。
POSIXに準拠してるawkならこうなるみたいだけど、オリジナルは知らん。

再初期化するなら$(NF+1)使うほうがいいかもね。未使用の変数を用意しなくていい。
だけど、それが必要な場面が思い浮かばないが。

関係ないけど、abs関数ってないんだね。別に良いけど、πや、
0より大きい最小の浮動小数点数は定義しててほしいなあ。

613:デフォルトの名無しさん
11/06/02 10:09:14.37 .net
>>605
> 再初期化するなら$(NF+1)使うほうがいいかもね。未使用の変数を用意しなくていい。
フィールド変数は常に文字列型で、 数値型は持たない。

614:デフォルトの名無しさん
11/06/02 22:47:31.10 .net
πはatan2(0,-1)でいいとして
「0より大きい最小の浮動小数点数」ってどう定義していつ使うの?

615:デフォルトの名無しさん
11/06/03 13:48:37.95 .net
「0より大きい最小の浮動小数点数」というのが何を希望しているかによる。
以下の3種類がある。

(1) 最小の正の非正規数
(2) 最小の正の正規数
(3) 1.0に足して丸めた結果が1.0より大きくなる最小の数

616:デフォルトの名無しさん
11/06/03 23:58:11.26 .net
>>606
あちゃ!そうでした。$で戻るのは文字列だった。
その仕様書読んでると、NFを拡張したとき、元々なかった所はuninitialized valueになるってあったので。

>>607
それでいいんだけど、PIとかで参照できたらもっといい、と思ったのです。
>>608
数値計算のために、CのDBL_EPSILONの代わりになる定数が欲しいなと。
任意の精度で丸められる関数もないですし。

617:デフォルトの名無しさん
11/06/04 09:41:48.63 .net
DBL_EPSILONが>>608の(1)~(3)のどれかわからない?
数値計算の基本なんだが。

618:デフォルトの名無しさん
11/06/10 21:49:33.34 .net
変数名など、自前であっても規則を意識している方いますか?
awkだと、C風が一般的なのでしょうか?
一番最初がVBAだったので、長い名前と省略が混ざってしまって
自分でイライラしています。
みなさんの、通常の変数はこう、配列はこう、定数はこう、文字型はこう・・・
というものを参考にしたいです。


619:デフォルトの名無しさん
11/06/10 22:10:28.97 .net
>>611
システムハンガリアンを採用するかどうか悩むほど大きなものをawkで書いたことが無い

620:かあた
11/06/13 18:37:34.88 .net
、5なわやあふぉt( ())

621:デフォルトの名無しさん
11/06/15 21:51:26.93 .net
>>611
遅レスだが、型_内容の説明_名前みたくしてる。名前が一文字だとそのままだけど。
グローバル変数とローカル変数のどっち弄ってるのか分かりやすいように、ローカル変数は必ずlで始めるようにしてる。
d_per_shouhizei = 5.0とかね。

622:デフォルトの名無しさん
11/06/20 18:37:26.17 .net
gawkでBINMODEを設定すればバイナリーの入出力ができるのはわかるのですが、
入力されたバイナリーを16進ダンプして表示するにはどうしたらよいでしょうか?
od等の外部コマンドを使う意外に方法があればお教えください。

623:デフォルトの名無しさん
11/06/20 19:17:07.50 .net
printf("%02x\n", $1);

624:天使 ◆uL5esZLBSE
11/07/05 00:15:13.83 .net
二度と話かけんなよ
お前らってどうみてもゴミだよな


625:デフォルトの名無しさん
11/07/06 14:04:55.24 .net
ゴミんなさい

626:デフォルトの名無しさん
11/07/14 23:55:15.84 .net
>>595
gawk4.0.0でa[0][0]=1も可能になったじゃないか

627:デフォルトの名無しさん
11/07/30 19:46:15.81 .net
超初心者の質問で申し訳ありません。以下のようなデータを
aaa 10
bbb 20
ccc 30
aaa 30
bbb 30
aaa 15
ccc 30
ddd 20
以下のようにまとめたいのですが、どうしたらいいでしょうか?
aaa 55
bbb 50
ccc 60
ddd 25

628:デフォルトの名無しさん
11/07/30 19:53:38.97 .net
ddd 20 ではないかと思うがこんな感じかな
awk '{a[$1]+=$2} END {for (b in a) {print b " " a[b]}}' | sort

629:デフォルトの名無しさん
11/07/30 23:15:27.52 .net
Gawk4ならPROCINFO["sorted_in"]の設定で最後のsortが要らなくなる

630:620
11/07/30 23:22:20.03 .net
>621
ありがとうございます!うまくいきました。

631:デフォルトの名無しさん
11/07/31 15:24:48.76 .net
gawkはもう別言語なイメージ。普段mawk使ってると

632:デフォルトの名無しさん
11/08/16 22:48:21.64 .net
ここって生きてますか?

633:デフォルトの名無しさん
11/08/18 01:56:26.63 .net
生きてますん

634:デフォルトの名無しさん
11/08/19 00:53:44.39 .net
生きていることを願って質問を。
WIN32のEXE一つで、下のTEST.AWKがマトモに動くAWKを探しています。
これら以外にありますか?

URLリンク(hinadori.atnifty.com)
URLリンク(my.vector.co.jp)
URLリンク(my.vector.co.jp)

Cygwin版も試したのですがダメでした。

TEST.AWK
{ gsub("[0-9]","x",$0) ; gsub("ソ","ソ",$0) ; gsub("T","T",$0) ; print }

TEST.DAT
アイウエオカキクケコサシスセソ
ココココサフサコココココ
ココココサフサココココ
ココココサフサコココココ
ココココサフサコココココ
サフサフサフサフサフサ
ココココサフサコココココ
ココココサフサココココ
ココココサフサコココココ
ココココサフサコココココ
サフサフサフサフサフサ

635:627
11/08/19 01:00:20.60 .net
TEST.DATは、空白が入っています。
専ブラのポップアップをコピペして下さい。

636:デフォルトの名無しさん
11/08/19 06:26:54.92 .net
ウチに帰ってから調べてみるよ

637:デフォルトの名無しさん
11/08/19 11:02:41.54 .net
>>627-628
cygwinのawk(GNU Awk 3.1.8)で動くけど、どうなるはずがどう動かないと言っている?
>627のtest.datなら、当然「ソ」だけが変換されるけど。

638:デフォルトの名無しさん
11/08/19 11:55:06.25 .net
(CygwinならUTF8じゃないとうまく動かないけど)Shift JISで動作させたいってことかな?
事前にTEST.DATをnkf -wに通したら駄目かな。

639:629
11/08/19 21:59:57.43 .net
>>627
スクリプトもDATもSJISで試したけど、上記3つのうち、gawk-mbcs-win32-20051223.zipはダメだったよ。
1行目がこんなんなる。

アxxエオカキクxコサxxxソ

手持ちの
GNU Awk 3.1.7(windows special Nov 24 2009)
で、--ctype=SJISやっても同じ結果になるね。

スクリプト、DATをUTF-8にして、--ctype=UTF8やってリダイレクトしたファイルは正常な結果が出るよ。
リダイレクトしないでコマンドプロンプトに表示させると化けるけど。

640:デフォルトの名無しさん
11/08/19 23:18:25.14 .net
EUCなら半角カナもうまくやってくれるんだが…

641:デフォルトの名無しさん
11/08/24 08:07:37.54 .net
gawkはガンガン機能を拡張してるけど、
そろそろOOP対応してくれないかな。
awk++とかあるけど、標準でOOPできれは便利。

642:デフォルトの名無しさん
11/08/24 22:44:37.24 .net
> OOP
...もはやawkでやる意味が無いw 他にいくらでもある別の言語でいいじゃん

643:デフォルトの名無しさん
11/08/25 01:14:17.45 .net
awkに在ると便利かもと思うのは参照値くらいかな

配列や関数への参照を値として取り出し格納したり
逆にその値から元の配列にアクセスしたり元の関数を呼んだり出来ると
相当に複雑なデータ構造が表現可能になる、それこそOOPっぽいことも可能だし

でもあんまりややこしいことやるならPerlでいいから必須ではないね

644:デフォルトの名無しさん
11/08/25 02:28:23.99 .net
> 関数を呼んだり

変数の値を関数名として
var = "sage";
@var();
ってできるけど、それとは違うのん?




645:デフォルトの名無しさん
11/08/25 04:07:56.67 .net
およ、もうあるのかw
最近のawkは分からねえ…ってことは、配列への参照を使って入れ子の配列とか既に作れちゃったりするのか?

646:デフォルトの名無しさん
11/08/25 10:56:54.36 .net
配列の配列は作れるよ。gawk4なら。

647:デフォルトの名無しさん
11/08/25 19:51:33.84 .net
(´_ゝ`)フーン

648:デフォルトの名無しさん
11/08/25 20:52:51.07 .net
class human {
  property name
  property sex
  property age
  method new(x, y, z) {
    name = x
    sex = y
    age = z
  }
  method say() {
    printf("私は%s。%d歳の%sです。\n",name, age, sex)
  }
}
class japanes


649:e : human {   property name   property sex   property age   method say() {     printf("私は%s。%d歳の%sです。国籍は日本です。\n", name, age, sex)   } } BEGIN {   alice = human.new("アリス", "女", 11)   taro = japanese.new("太郎", "男", 15)   yuka = japanese.new("由佳", "女", 18)   alice.say()   taro.say()   yuka.say() }



650:641
11/08/25 20:58:10.41 .net
>>635
URLリンク(code.google.com)
これを使えばこの程度のOOPはどうにかできる。
本当にこの程度でいいからOOPに対応してほしい。
使う人はほとんどいないと思うが、全くできないのも困る。

651:デフォルトの名無しさん
11/08/25 22:07:53.46 .net
それは最早awkである必要が全く無い

652:デフォルトの名無しさん
11/08/26 06:00:04.19 .net
function Human(self,name,sex,age) {
self["property___name"] = name
self["property___sex"] = sex
self["property___age"] = age
self["method___say"] = "Human___say"
}
function Human___say(self) {
printf "私は%s。%d歳の%sです。\n", self["property___name"], self["property___age"], self["property___sex"]
}

function Japanese(self,name,sex,age) {
Human(self,name,sex,age)
self["method___say"] = "Japanese___say"
}
function Japanese___say(self) {
printf "私は%s。%d歳の%sです。国籍は日本です。\n", self["property___name"], self["property___age"], self["property___gender"]
}

function methodcall(obj,methodname, m) {
m = obj["method___" methodname]
@m(obj)
}

BEGIN {
Human(alice, "アリス", "女", 11)
Japanese(taro, "太郎", "男", 15)
Japanese(yuka, "由佳", "女", 18)
methodcall(alice,"say")
methodcall(taro,"say")
methodcall(yuka,"say")
}

653:デフォルトの名無しさん
11/08/26 06:01:35.02 .net
ごめん一部genderになってるからsexに直しといて

とりあえず、こんな感じでgawk4でもOOP自体は出来るよって話

654:デフォルトの名無しさん
11/08/27 15:07:17.61 .net
>>644
なるほどねー
とても勉強になります

でも、やっぱりOOP用の構文が使えればベストですね
そのほうがわかりやすいと思います

655:デフォルトの名無しさん
11/08/27 15:58:44.09 .net
やっぱ別言語使うべきだろ

656:デフォルトの名無しさん
11/08/27 16:10:36.72 .net
本当に欲しいんなら、gawkのMLにこうすればOOP実現できることを発見したんだけど、
これの糖衣構文を用意してくれって投稿するといいんじゃね
switchも実装されてるし、欲しい人が居ると分かれば付けてくれるかもよ

657:デフォルトの名無しさん
11/08/27 16:25:08.65 .net
#! /usr/bin/env python
# -*- coding: utf-8 -*-

class human:

  def __init__(self, name, sex, age):
    self.name = name
    self.sex = sex
    self.age = age

  def say(self):
    print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。")

class japanese(human):

  def __init(self):
    super(human, self).__init__(self)

  def say(self):
    print("私は" + self.name + "。" + str(self.age) + "歳の" + self.sex + "です。国籍は日本です。")

if __name__ == "__main__":

  alice = human("アリス", "女", 11)
  taro = japanese("太郎", "男", 15)
  yuka = japanese("由佳", "女", 18)
  alice.say()
  taro.say()
  yuka.say()

658:デフォルトの名無しさん
11/08/27 16:26:25.23 .net
pythonで書いてみると、
>>641と比べると特にわかりやすいわけでもないけど
>>644よりはわかりやすい

659:デフォルトの名無しさん
11/08/27 16:53:49.92 .net
そりゃawkはOOPLではないからな
あくまでシェルのお供でいいと思うんだ
そしてそこに高度なOOP機能は要るとは思えない
どちらかと言えばフィールド抽出とかをもっと便利にすべきだよ

660:デフォルトの名無しさん
11/09/17 15:34:39.29 .net
cygwin以外でgawk4.0をwindowsで使おうと思ったら、バイナリはどこで入手できもうすかね?

661:デフォルトの名無しさん
11/09/17 16:28:58.78 .net
cygwin で駄目な理由が分からないから教えられない。

662:デフォルトの名無しさん
11/09/18 08:02:36.95 .net
>>652
URLリンク(www.klabaster.com)

663:デフォルトの名無しさん
11/09/19 13:00:55.06 .net
>654 さんくすこ

>653 awkの実行形式だけ入手すれば良いようにしたいのさ。

664:デフォルトの名無しさん
11/09/19 14:01:43.39 .net
バイナリ互換のWindowsなのに、cygwinてexeをもってくだけじゃ使えないの?

665:デフォルトの名無しさん
11/09/19 16:07:37.39 .net
物によっては使えたような気がする。
cygwin1.dllだっけ?にパスが通ってれば大体使えたような気がする。

666:デフォルトの名無しさん
11/09/19 17:00:12.76 .net
結構沢山のdllが要るよ
コマンドによるけど

667:デフォルトの名無しさん
11/10/24 01:55:49.24 .net
教えてください。英語得意な人

URLリンク(www.gnu.org)
の asort(), asorti()で使うユーザー定義の比較関数について
3番目の引数とPROCINFO["sorted_in"]に設定するのと違うのか同じなのか?

それと
URLリンク(www.gnu.org)
に書いてある3番目の引数の説明("descending"とか)が両立してんの?

668:デフォルトの名無しさん
11/10/24 11:34:13.18 .net
URLリンク(www.gnu.org)
As with PROCINFO["sorted_in"], this argument may be the name of a user-defined function, ....

URLリンク(www.gnu.org)
The third argument can also be a user-defined function name ....
第三引数の値と同名の関数が定義済みならそれを利用するとか、
そういう方法で区別してるんじゃないの

669:デフォルトの名無しさん
11/10/24 13:33:04.59 .net
>>659
比較関数の与え方はPROCINFO["sorted_in"]の場合と同じってことだろ。

自分で定義した関数の名前でもいいし、11.2.1.2に書いてあるようにすでに用意
されている@~を使ってもいい。



670:デフォルトの名無しさん
11/11/14 21:59:05.28 .net
個人的には、GAWKにはあと、Cで書いた関数の呼び出しというか
GAWKで呼ぶ関数をCで書ける機能が欲しいと思ってるんだけど、
ここ見る限り世間的にはあんまり需要ないんかねぇ。

まぁ、それやるくらいならGAWK自体に変更を加えて再コンパイルしろってことかもしれないけど。

671:デフォルトの名無しさん
11/11/15 01:44:31.01 .net
PとかR使え言われると思う。

672:デフォルトの名無しさん
11/11/15 01:58:32.43 .net
>>662
URLリンク(www.gnu.org)
じゃダメ?将来的にさらに拡張される可能性はあるみたいだけど

673:デフォルトの名無しさん
11/12/09 00:35:09.18 .net
最近awkcardを知って座右に置いてるのだが、日本語版って存在するのだろうか。

674:デフォルトの名無しさん
11/12/22 16:57:35.32 .net
URLリンク(gauc.no-ip.org)
ここに書いてある通りにしても日本語に翻訳されません
どうしてですか?
環境は LinuxMint12 、 GNU Awk 3.1.8 です

675:デフォルトの名無しさん
11/12/22 18:01:49.60 .net
>>666
その通りにやったと言うのなら、何故poファイルを提示しないのかね、ダミアン君。

676:デフォルトの名無しさん
11/12/22 18:07:45.38 .net
>>667
poは作成しましたし、moも所定のディレクトリにあります。
poは自分で編集しても、そのサイトの内容をコピペしてもダメでした。

$ cat gettext.po
#: gettext.awk:10
msgid "********** Count Prime Number **********"
msgstr "========== 素数を数える =========="

#: gettext.awk:14
msgid "2 is a prime number."
msgstr "2 は素数です。"

#: gettext.awk:24
msgid "%d is a prime number.\n"
""
msgstr "%d は素数です。\n"

$ ls ja_JP/LC_MESSAGES/
gettext.mo

677:デフォルトの名無しさん
11/12/22 18:10:02.43 .net
結果はこの通りです。

$ LC_ALL=ja_JP gawk -f gettext.awk 10
********** Count Prime Number **********
2 is a prime number.
3 is a prime number.
5 is a prime number.
7 is a prime number.

678:デフォルトの名無しさん
12/01/12 13:56:36.33 .net
ずいぶんawkから離れていて久しぶりに使ったら
nawkに日本語のバグがあることにしばらく気づかなかった
substr()でutf-8のテキストを切り出すとおかしな値になる
gawkでは直っている

679:デフォルトの名無しさん
12/01/12 19:50:49.28 .net
そもそもUTF-8に対応してたっけ

680:デフォルトの名無しさん
12/01/13 00:28:07.37 .net
URLリンク(blog.livedoor.jp)
残念ながら、シフトJIS、UTF-8両方で正常に動作しそうなWindows版gawkは候補の中にありませんでした。

681:デフォルトの名無しさん
12/01/13 07:52:50.95 .net
Linuxでは普通に動くが…

682:デフォルトの名無しさん
12/04/29 21:07:39.93 .net
ファイル名が"*.txt"の一覧を取得するとき、"\.txt"でマッチさせると、任意の一文字.(ドット)と解釈されてしまうんですが、いい方法無いでしょうか?

683:デフォルトの名無しさん
12/04/29 22:04:14.36 .net
GNU Awk 3.1.7だとドットにマッチしたけどそもそもawkの話?
具体的にコマンドがほしいな

684:デフォルトの名無しさん
12/04/29 22:08:23.01 .net
昭和の頃覚えたアセンブラとC言語
これがあったから
いまだに自分が損な業界で飯を食ってる

685:デフォルトの名無しさん
12/04/29 22:36:10.83 .net
>>676
そこからjavaに行ってスマホアプリ開発ならもう一花咲いたかもしれませんねw

686:デフォルトの名無しさん
12/04/29 23:09:38.43 .net
馬鹿には無理

687:674
12/04/30 18:07:43.22 .net
>>675
ls | awk '{ if( match($0,"\.txt") > 0) print $0 }'
↑会社のサーバ上でこんな感じのことやろうとしてたんですが、
「gawk: 警告: エスケープシーケンス `\.' は `.' と同等に扱われます」
とメッセージが出力され、ドットが任意の一文字?と解釈されて困っていましたが、
自己解決しました。(自宅のLinuxPCで動作確認しました。GAWK3.1.7及び4.0.1)
"\.txt"では無くて、".txt"で良かったんですね。
お騒がせしました。

もしかしたら、会社のサーバ(RHEL)のGAWKが古くて解決できてないかもしれませんが。

688:デフォルトの名無しさん
12/04/30 20:27:16.48 .net
>>679
match() の第二引数に文字列を与えた場合は事前に正規表現への型変換が行われるが、
その際にエスケープが外れて /.txt/ と同等になってしまう、 ということかと。
つまり "\\.txt" とするか、 正規表現の /\.txt/ を与えればよい。

The GNU Awk User's Guide にもこの現象についての説明はあるが、
~ !~ 演算子についてしか触れられていない。
URLリンク(www.kt.rim.or.jp)

689:デフォルトの名無しさん
12/05/24 00:27:31.74 .net
gawk4.0.2付属の原版ではmatchの説明にもその辺触れられてるね。
URLリンク(www.gnu.org)
誰かこのバージョン日本語化してないかな。

690:デフォルトの名無しさん
12/07/12 02:26:40.35 .net
FIFOな感じの先入れ先出しのバッファには何使えばいい?
というか、
Arrayで、たとえばA[3] からA[8]までのデータをA[1]からA[6]に動かすには何が一番早い?
できれば配列は1つしか使いたくないのだが、無理だろうか…


691:デフォルトの名無しさん
12/07/12 09:23:22.92 .net
速さを求めるなら毎度全要素ずらすより、読み出し位置と書き込み位置の添字持って
管理した方がたいてい速い

692:デフォルトの名無しさん
12/07/12 10:14:32.78 .net
awkには連想配列しかないしな

693:デフォルトの名無しさん
12/07/14 14:35:06.22 .net
リングバッファで何とかなるならリングバッファかな

694:デフォルトの名無しさん
12/07/14 22:27:17.73 .net
>>682
BEGIN{
 QMAX=3
 QTopPos=0;QTailPos=0;QNum=0;
 deQ();
 enQ("1");deQ();
 enQ("a");enQ("b");enQ("c");enQ("x");deQ();deQ();deQ();deQ();
}
function enQ(PushVal){
 if (QNum+1 > QMAX){print "おなかいっぱい"; return;}
 nextPos = (QTopPos+1) % QMAX;
 queue[QTopPos] = PushVal;
 QTopPos=nextPosQNum++;
}
function deQ(){
 if (QNum < 1){print "からっぽ"; return}
 QNum--; TailVal=queue[QTailPos]
 QTailPos = (QTailPos +1) % QMAX;
 print TailVal;
 return TailVal;
}

695:686
12/07/14 22:54:06.64 .net
↑の結果はこんな感じ。
>からっぽ
>1
>おなかいっぱい
>a
>b
>c
>からっぽ

>>685の書いているリングバッファ実装です。
enqueue,dequeue回数が多いならリングバッファで良いと思う。
大抵の場合はQMAXに大きな値を設定すれば事足りるハズだけど
上限が決定できない等の事情があればdelete arrayを使った単純な配列管理かな。
ただ添え字が数値上限を超えない様な工夫は必要だね。

696:デフォルトの名無しさん
12/07/15 21:09:36.15 .net
リングでも上限を定めると入力ストリームの上限が不明な場合まずいことになるので、現在は
A=入力Array,C一時保管,i,k,n,p
  k=1;C[0]=0;
  for(i=1;i<=A[0];i++){n=0;while(k<i && A[k++]=C[n+=1]);if(n){
  delete C[C[0]+1];C[0]-=n;p=0;while(C[p+=1]=C[n+=1]);}p=1;
  while(match(substr(A[i],p),re)){p+=RSTART-1;n=substr(A[i],p,RLENGTH);
  if(k<i){A[k++]=n;}else{C[C[0]+=1]=n;};p+=RLENGTH;}};n=1;
  while(A[k++]=C[n]){delete C[n++];};A[0]+=C[0]-1;C[0]=0;
を使っている。
re=regexpとして、Array Aに一致するデータがあれぼそれを取得、結果をArray Aに出力、A[0]に合計が記載。

これ以上(コードサイズ、ある程度の速度、メモリの使用量を極力少なく)という条件で最適化できるだろうか…
だれか頼む。
入力と出力先が同じでも、別でも作動するコードなら尚のこと良いのだが…


697:デフォルトの名無しさん
12/07/17 00:02:18.87 .net
これはひどい
デバッグも拡張も無理じゃね

698:デフォルトの名無しさん
12/07/17 22:03:00.62 .net
基本的に一度作って後は必要に応じてコピペだがらな。他には
function grep( o, re, p, B, this, a ){
B[0]=0;if(o~"-v"){while((getline v < p)>0){if(!match(v,re))B[B[0]+=1]=v;}return B[0];};
if(o~"-o"){while((getline v < p)>0){a=v;while(match(a,re)){B[B[0]+=1]=substr(a,RSTART,RLENGTH);
a=substr(a,RSTART+RLENGTH);}};return B[0];};while((getline v < p)>0){if(match(v,re))B[B[0]+=1]=v;}return B[0];
}
なんかも良く使う。grep("-o","pattern","/var/log",data);みたいな感じで。前のはagrep("-v",pattern,B,C)の一部分。
日ごろのメンテでちょっとした手作業じゃめんどいの組むときに、ほぼ数分で組みあがるのが楽なんだよ。
サブプロセスとしてgrep呼び出すのがコストかかる時とか、perlが破損した状況でのリカバリースクリプトとして組んだのが元だけど。
カーネルさえ生きていれば後はawkバイナリ流し込めば使え、shが半分死んでいてもなんとか動くし。


699:686
12/07/21 23:12:03.74 .net
>>688
BEGIN{
 QMAX=9007199254740991
 QTopPos=QTailPos=QNum=0;
 hitTop=0;
 A[++z]="hoge";
 A[++z]="1 2 3 4 5";
 A[++z]="fuga";
 A[0]=z;
 for(i=1;i<=A[0];i++){
  p=1;
  while(match(substr(A[i],p),/[0-9]+/)){
   p+=RSTART-1;
   enQ(substr(A[i],p,RLENGTH));
   p+=RLENGTH;
  }
  if(QNum>0){
   while(QNum && hitTop<i)A[++hitTop]=deQ();
  }else{
   delete A[i];
  }
 };
 if(QNum>0) while(QNum)A[++A[0]]=deQ();
 for(z=1;z<=A[0];z++)print "A[" z "]:" A[z];
}


700:686
12/07/21 23:44:24.03 .net
691の続き
ちなみに、A[1]~A[A[0]]をgrepして結果はA[1]~A[?]に戻すスクリプトね。
複数件マッチする事があるので未処理行を上書きしないようにキュー使ってる。
function enQ(PushVal){
 if (QNum+1 > QMAX){print "Queue Overflow"; exit;}
 nextPos = (QTopPos+1) % QMAX;
 QBody[QTopPos]=PushVal;
 QTopPos=nextPos
 QNum++;
}
function deQ(){
 if (QNum<1){print "Illigal dequeue"; exit;}
 QNum--;
 TailVal=QBody[QTailPos];
 delete QBody[QTailPos];
 QTailPos=(QTailPos +1) % QMAX;
 return TailVal;
}
リングバッファの上限超えたら終了させてるけど>>688の実装も上限超えたらバグるし許して。
計ってないけどループがない分早い筈。コードサイズはお察し。
メモリはA[]にデータ抱えてる時点でアウトな感じだけどA[]を適宜消すようにしといた。
出力先を別にしたいならA[]にdeQ()せず別変数にすればおk。
これで良い?

701:688
12/07/22 09:36:17.43 .net
>QMAX=9007199254740991
ワロタwww
俺のも確かにwhile(C[p+=1]=C[n+=1]);の部分で保持してるのすべて消費分だけ上に移動させてるのが無駄なので
そのループが無い分は確かに早いはず。

あと、恥ずかしながら尋ねたいのですが、俺>>688の実装で上限超えたらバグるをkwsk
なんか見落としてたのか今更ながら心配になってきた。
昔作ったやつなんで、結構な頻度使ってきたのだが今までバグに気づかなかった

しかしデータをメモリ上に展開するからどうしても上限が出てくるな…
awkで10GBぐらいの扱う時はgetlineでなんとかなるけど、やはりメモリマップやポインタが使えたら便利だよなぁ
パッチ作ったら需要あるかな?

702:デフォルトの名無しさん
12/07/22 11:41:46.83 .net
>>693
691、ちょっと訂正。無駄にキュー使う分、元スクリプトから劣化してた。
>    p+=RSTART-1;
>-   enQ(substr(A[i],p,RLENGTH));
>+   if(hitTop+1<i){
>+    A[++hitTop]=substr(A[i],p,RLENGTH)
>+   }else{
>+    enQ(substr(A[i],p,RLENGTH));
>+   }
>    p+=RLENGTH;
あと、良く考えたら出力先を別にするなら、そもそもキュー不要。

バグってのは687で数値上限云々と書いたとおり、
”C[0]+=1”がawkの整数の精度誤差なし演算可能上限を考慮していないだけ。
どのawkも多分そうだと思うけど、手元の環境下での実行結果↓
C:\>gawk --version
GNU Awk 3.1.7(windows special Nov 24 2009)
C:\>gawk "BEGIN{print 9007199254740990+1}" nul
9007199254740991
C:\>gawk "BEGIN{print 9007199254740991+1}" nul
9007199254740992
C:\>gawk "BEGIN{print 9007199254740992+1}" nul
9007199254740992

実際は(hddやメモリが先に死ぬので)
一行でこれだけ正規表現がhitする事は事実上無いし、
仮に発生しても検索結果が潰れるだけで、気付かない筈。


703:688
12/07/22 13:39:49.16 .net
>9007199254740992
理論上、8192ペタバイトの同じデータ[aaa...]でregexp="."とすれば、発生するな…
IEEE 754の52bit制限だから、これ以上のでかい数字扱うならbig numbert対応のライブラリか,
"bc -q" |& で動かすか、xgawk、dnawkあたり使うべきだなぁ

昔誰かがbignumのawkスクリプト書いて放流していた覚えがあるのだが、
ググッても見つからん。手元にあるのはビット演算のやつだけだわ
いつかそれだけのデータをメモリ上に保持できるマシンを扱ってみたいものだ…

704:デフォルトの名無しさん
12/08/03 02:35:23.75 .net
awkってabsとかacosなどの基本的な算術関数が用意されてないんですね
今後も実装されることはないんでしょうか?

パイプでサクッとつないでワンラインで処理するのに重宝してたんですが・・・
代わりとなると、何使うのがよろしいですか?
できればperlは使いたくないです(どうしても好きになれない

705:デフォルトの名無しさん
12/08/03 06:48:38.25 .net
absは自分で書けばいいし、acos(x)はatan2(x, √(1.0 - x*x))と書けるから、
どちらも基本的ではないと判断して組み込みじゃないんだと思うけど。

PythonかRubyでいいんじゃない? ワンライナー向きではないけど。

706:デフォルトの名無しさん
12/08/03 07:37:24.41 .net
>>696
ライブラリ(?)を拾って来ては?

707:デフォルトの名無しさん
12/08/03 11:48:03.19 .net
>>696
必要な関数値を計算するだけのプログラムをCで作っておいたら?

708:デフォルトの名無しさん
12/08/03 20:21:59.43 .net
昔それでベクトル演算して遊んだな

709:デフォルトの名無しさん
12/08/04 09:23:47.83 .net
Rubyはそこそこワンライナーも書ける感じがする、awkやPerlほどじゃないけどね
Pythonは流石にコード起こさないと辛いことが多いが

710:デフォルトの名無しさん
12/08/04 10:27:49.07 .net
awkでmatlabみたいなベクトル演算できるようにしてほしい

711:デフォルトの名無しさん
12/08/04 16:48:36.10 .net
awkでクラスを使えるようにしてほしい

712:デフォルトの名無しさん
12/08/04 17:06:19.06 .net
awkで全ての魔法少女を救ってほしい

713:デフォルトの名無しさん
12/08/04 17:08:30.07 .net
awkさんは魔女

714:本田
12/08/05 07:21:28.03 .net
Awk++
URLリンク(awk.info)
OO in AWK++
The awk++ language provides object oriented programming for AWK that includes:
classes
class properties (persistent object variables)
methods
inheritance, including multiple inheritance

URLリンク(lawker.googlecode.com)


715:デフォルトの名無しさん
12/08/05 09:56:26.63 .net
デバッグ大変過ぎて死ぬる
$ cat witch.awkpp
class Witch {
var spell
method new() { spell = "mahalic mahalita" }
method perform() { print spell }
}
class Samantha : Witch {
method perform() { print "twitch" }
}
BEGIN {
# wife = Witch.new() エラー要因行
wife = Samantha.new()
wife.perform()
}
$ gawk -f awkpp -r witch.awkpp
gawk: -:10: () エラー要因行
gawk: -:10: ^ syntax error
gawk: -:10: () エラー要因行
gawk: -:10: ^ 表現の char '?' は不正です。

716:デフォルトの名無しさん
12/08/22 00:09:49.86 .net
size: 656 byte, supports -o -v option. Array A and B can be the same (NEW)
function xagrep( o, re, A, B, this, a, i,k ){
k=0;B[0]=A[0];if(o~"-v"){for(i=1;i<=A[0];i++){if(!match(A[i],re)) B[k+=1]=A[i];}B[0]=k;return k};
if(o~"-o"){B[B[0]+1]=0;for(i=1;i<=A[0];i++){a=A[i];if(i==k){i=i-B[B[0]+1]+1;B[B[0]+1]=k;k=B[0]+2;
while(i<=B[B[0]+1]){B[i++]=B[k];delete B[k++];}i=B[B[0]+1];k=i;B[B[0]+1]=0;}while(match(a,re)){
if(i>k){B[k+=1]=substr(a,RSTART,RLENGTH);}else{B[B[0]+1+(B[B[0]+1]+=1)]=substr(a,RSTART,RLENGTH);
k++}a=substr(a,RSTART+RLENGTH)}}if(i<k){i=k-i;k=B[0]+1;B[0]=i+B[B[0]+1];while(i<B[0])B[i+=1]=B[k+=1];
while(i<k)delete B[i+=1];}return B[0]}for(i=1;i<=A[0];i++){if(match(A[i],re))B[k+=1]=A[i];}B[0]=k;return k;
}
これ以上削れるところ無いかな? 
高速化+サイズ優先で、変数はできるだけ使う数を少なくとの条件で

717:デフォルトの名無しさん
12/08/22 09:51:11.01 .net
>>708
その3つの条件の優先度がわからんな。

結構同じ部分式があるので変数に入れた方が変数は増えるけど短くなるし
場合によっては速度も速いとかありそうだけどどうなん?

例えばB[0]は特別な用途っぽいけどxとか1文字変数にしてreturnの直前に
書き戻した方が文字数は稼げる。

あと細かいがhoge+=1より++hogeの方が1文字短いとか、いらない「;」が
残ってるとか詰めが甘いところがまだあるね。

718:デフォルトの名無しさん
12/09/30 22:45:00.64 .net
以下のようなデータの処理について質問いいでしょうか。
$1に経過時間(時刻)、$2に「速度」があれば$3の数値は速度を、$2$3に
「up a」「down a」などとあればその時刻での行動を示します。

このデータからup、downの場所を求めたいと思います。
つまり、下の例で移動開始からの距離3でup a、距離3.5でup b、という具合です。
経過時間と速度から場所を計算するだけですが。速度を変更するタイミング・
回数は不定、速度データと行動データはともに経過時間順に記録されています。
速度変更をどう扱えばいいのか、ちょっと頭が回りません。

---元データ例---
0 速度 10
50 速度 20
200 速度 25
30 up a
35 up b
40 down a
40 down b
50 up a
70 down a
200 up c
250 down c

---処理後---
3 up a
3.5 up b
4 down a
4 down b
5 up a
6 down a
12.5 up c
14.5 down c

719:デフォルトの名無しさん
12/10/01 11:28:30.42 .net
疑問を提示。
$1が常に時刻で$2が速度のときの$3が速度なら、
30 up aのときに30 * 10


720:で300 up aになるんじゃないだろうか。 同じように、70 down aのときに50 * 10 + (70 - 50) * 20で900 down aになるんじゃないだろうか。 $3が速度(単位時間当たりの移動量)ではなく単位移動量当たりの所要時間なのであれば、 30 up aで30 / 10 = 3、70 down aで50 / 10 + (70 - 50) / 20 = 6になるんだけどね。



721:デフォルトの名無しさん
12/10/01 13:21:34.21 .net
実装してみた。速度が途中に出てきてもいいようにposを毎回計算するから効率悪いけど。
--
BEGIN {
sCount = 0;
}
$2 == "speed" {
sTime[sCount] = $1;
sSpeed[sCount] = $3;
++sCount;
next;
}
{
pos = 0;
for (ic = 1; ic < sCount; ++ic) {
if (sTime[ic] > $1) break;
pos += (sTime[ic] - sTime[ic - 1]) / sSpeed[ic - 1];
}
pos += ($1 - sTime[ic - 1]) / sSpeed[ic - 1];
print pos, $2, $3;
}

722:デフォルトの名無しさん
12/10/01 20:30:33.48 .net
>>711
すみません、前者ですね。なんだろう、恥ずかしい。

>>712
なので、アクション部の / を * に変えればよさそうです。

お二方、ありがとうございます。

723:デフォルトの名無しさん
12/12/13 11:40:43.98 .net
awkにかわる同等のものあります?

724:デフォルトの名無しさん
12/12/13 13:08:08.26 .net
python

725:デフォルトの名無しさん
12/12/13 13:13:55.85 .net
>>715
awkみたいに使い勝手いいのかな?

726:デフォルトの名無しさん
12/12/13 13:18:24.65 .net
良いですよ

727:デフォルトの名無しさん
12/12/13 13:24:31.23 .net
>>717
ありがとす。勉強してみます

728:デフォルトの名無しさん
12/12/13 14:45:25.45 .net
はい

729:デフォルトの名無しさん
13/02/06 03:49:18.86 .net
“任意の記号”を含んだシェル変数をawkに渡すことは可能ですか?たとえば

[user@localhost ~]$ var='hoge'
[user@localhost ~]$ echo "hoge" | awk -v var="$var" '
$0 ~ var {print var}
END {print var}
'
hoge
hoge

ここで、varに$を含ませると

[user@localhost ~]$ var='hoge$fuga'
[user@localhost ~]$ echo "hoge" | awk -v var="$var" '
$0 ~ var {print var}
END {print var}
'
hoge$fuga

とうまくマッチしませんでした。var自体は渡されているはずですが、何が原因でしょうか?

730:デフォルトの名無しさん
13/02/06 11:23:41.42 .net
>>720
いちぎょうめのひだりがわの var は、ひょうかのさいに
せいきひょうげんへのかたへんかんがおこなわれる。

$0 ~ /hoge$fuga/ {print "hoge$fuga"}
END {print "hoge$fuga"}

めたもじとなってしまうものは、じぜんあるいはこーどのなかで
えすけーぷするひつようがある。

731:デフォルトの名無しさん
13/02/06 11:29:22.31 .net
~(チルダ)の右辺は正規表現として解釈されるから、"hoge" ~ /hoge$fuga/ でマッチするわけがない。
逆に寧ろ、"hoge$fuga" ~ /hoge/ ならマッチする。

732:デフォルトの名無しさん
13/02/06 11:33:09.61 .net
>>720
>721も>722もどちらも原因。やりたいことをよく整理しよう。

733:720
13/02/06 15:09:21.72 .net
すいません、echo "hoge"ではなくecho "$var"でした。
ただ、結果は>>720と同じです。

要は入力ファイル内の「メタ文字込みの任意の文字列」を、別の「メタ文字と改行込みの任意の文字列」で置換する、
というのをメタ文字のエスケープ等の面倒な処理をせずにサクッとやりたいのですが、できますか?

734:デフォルトの名無しさん
13/02/07 05:01:43.19 .net
ムリ

予め「メタ文字と言っても $ しか出てこない」とか判ってるなら大したこと無いけど
一般化すればするほど面倒になる

735:720
13/02/07 22:14:56.21 .net
>>725
やはりそうですか。
今までこういった処理はsedでしこしこエスケープしてやってたんですが、いい加減面倒になったので、
たとえばfgrepみたいに正規表現をオフにして処理する方法はないかと探しているんですが、
awkでは無理ですか・・・。

736:デフォルトの名無しさん
13/02/08 11:20:14.98 .net
>>726
単に一致なら正規表現なんか使わずに比較すればいいじゃん。
fgrepで事が足りるのならawkからfgrepを起動すればいいじゃん。

737:デフォルトの名無しさん
13/02/08 19:27:47.04 .net
>>726
fgrepなら index()関数じゃないの?

738:720
13/02/09 15:32:27.55 .net
>>727
>単に一致なら正規表現なんか使わずに比較すればいいじゃん。
意味が分からないんですが、awk上の話ですよね?

>>728
index()の引数は文字列だから、これをうまく使えば目的の処理ができる・・・のかな?

でもなんかawkでごちょごちょやるより、メタ文字をエスケープする前処理をかますなり
何なりしたほうが素直な気がしてきた・・・。たとえばこんな感じで

$ var='hoge$fuga'
$ var2=$( echo "$var" | sed 's/\$/\\\\$/g' ) ←エスケープ処理
$ echo "$var" | awk -v var="$var2" '
$0 ~ var {print var}
END {print var}
'
hoge\$fuga
hoge\$fuga

739:デフォルトの名無しさん
13/02/09 17:49:52.25 .net
/bin/shでごちょごちょやるのが好みなら、awkもfgrepも使わず、case文でやりゃいいんじゃないの。

740:デフォルトの名無しさん
13/02/09 21:34:09.39 .net
>>729
文字列の比較は等号でできるって認識はないの?

741:デフォルトの名無しさん
13/02/10 14:31:49.57 .net
>729
いや、その方法でも結局 ' はエスケープが必要でしょ。
ダイレクトにシェル変数に入れる方法か、
ファイルなどに吐き出しておく方法の方が安定。
まぁそれでも改行とか制御文字入れられるともにょる場合があるけどな。

742:デフォルトの名無しさん
13/02/11 20:15:01.17 .net
そこまでめんどくさくなったらperlとかrubyとか使った方が楽だぞw

743:デフォルトの名無しさん
13/02/11 22:46:25.57 .net
何で gawk -f とか使わずワンライナーに拘るのかねぇ

744:デフォルトの名無しさん
13/02/12 22:00:38.07 .net
>>732
中韓ファイルを作るのは情弱の仕事(ドヤ顔
>>734
ワンライナーディスってんの?

745:デフォルトの名無しさん
13/03/11 10:05:12.56 .net
#
# text converter ( Mac to MS-DOS on Windos/MS-DOS machine)
# convert CR to CR+LF
#
BEGIN{ RS = "\r" }
{ print }

746:デフォルトの名無しさん
13/03/15 08:05:25.28 .net
#
# Line(行数)を数える
#

END { FNR }

747:デフォルトの名無しさん
13/03/20 19:07:17.00 .net
# text to html converter
# usage: awk -f txt2htm.awk infile1.txt > outfile2.html

BEGIN{
print("<html>"); print("<head>")
print("<titile> My favorite URLs </titile>")
print("</head>"); print("<h1> </h1>"); print("<body>");
}

/^[:space:]*http/ { print "<A HREF=\""$1"\">"$1"</A><BR>"}

END{
print("</body>")
print("</html>")
}

748:UNIX(LF) to DOS(CR+LF) conversion
13/03/21 21:15:00.86 .net
awk 1 infile1 > outfile2.txt

749:デフォルトの名無しさん
13/03/21 22:10:08.07 .net
# awk -f add.awk
BEGIN {
  s1 = "323524855"
  s2 = "4972560"

  reverse(a2, s2)
  size = reverse(a1, s1) # s1 > s2
  carry = 0

  for(k = 1; k <= size; k++) { # s1 > s2
    d = a1[k] + a2[k] + carry
    if(d >= 10) {
      e[k] = d - 10
      carry = 1
    } else {
      e[k] = d
      carry = 0
    }
  }

  if(carry == 1) {
    e[k] = 1
    size = k
  }

  g = produce_string(e, size)
  printf("%s + %s = %s\n", s1, s2, g)
  printf("%f\n", s1 + s2)
  exit
}

750:デフォルトの名無しさん
13/03/21 22:11:11.39 .net
# >>740のつづき
function reverse(a, s, k, i) {
  k = 1;
  size = length(s)
  for(i = size; i >= 1; i--) {
    a[k++] = substr(s, i, 1)
  }

  return size
}
function produce_string(a, size, i) {
  g = ""
  for(i = size; i >= 1; i--) {
    g = g a[i]
  }

  return g
}

751:デフォルトの名無しさん
13/03/21 22:12:57.08 .net
function produce_string(a, size, g, i) {

752:grepをawkで
13/03/22 13:32:02.74 .net
# usage: awk -f grep.awk char1 file1 file2

BEGIN{
pattern = ARGV[1]
ARGV[1] = ""
}
$0 ~ pattern {print($0" File name=" FILENAME)}

753:デフォルトの名無しさん
13/11/30 12:16:25.95 .net
$ echo 10 20 30 | awk '{for(i=0;i<4;)print _$++i}'
10
20
30

_$++iでも$++iでもどちらでもいけるのですが、アンダースコアが付いて何故大丈夫なのでしょうか?

754:デフォルトの名無しさん
13/11/30 16:04:55.55 .net
すいません、わかりました
空の変数_と$++iの結果が一緒になってただけなんですね

755:デフォルトの名無しさん
13/11/30 20:37:58.81 .net
単に式を並べると文字列連結になる、の罠か

756:デフォルトの名無しさん
14/04/02 00:10:13.15 T3/5Epfc.net
保守

てか半年近く書き込みが無かったか

757:デフォルトの名無しさん
14/04/19 13:45:38.45 Db2IzPol.net
とあるgawkスクリプトの先頭で
{last_hoge=hoge; hoge=$ 3}
ってやってるんだけど、
hoge=$ 3はhoge=$3の間違い? それともこういう記法がある?

758:デフォルトの名無しさん
14/04/19 14:56:08.53 A73fEYrr.net
>>748
$ は演算子だから、a=b+1をa = b + 1と書くようなものかな。

759:デフォルトの名無しさん
14/04/19 21:10:32.64 Db2IzPol.net
ええー 演算子だったのかあ。衝撃の事実

760:デフォルトの名無しさん
14/04/20 12:36:45.70 SQaIR8ej.net
演算子だから、変数でもいいよ。

761:デフォルトの名無しさん
14/04/20 14:34:12.09 YSeiuWKu.net
式が書けるね。
$ は一番優先順位が高いから、かっこで括らにゃいかんが。

762:デフォルトの名無しさん
14/04/20 15:12:13.25 k3tDznaJ.net
今はじめて知った。haskellの$は演算子だって知ってたけど、awkでも演算子だったんだね。

763:デフォルトの名無しさん
14/10/14 13:37:28.35 cBz5RbAX.net
そして半年近く書き込みが無かった

764:デフォルトの名無しさん
14/10/15 03:28:03.90 SS4U/DMU.net
いやawkスレなんて普段はそんなに話題ないだろ

765:デフォルトの名無しさん
14/10/21 15:46:10.36 TQsAGJgk.net
質問させてください

今ディレクトリ内のファイルの名称とサイズのリストを作りたいと思っています
コマンドとしてはls -lを実行していますがこれをさらにawkにパイプしています
ただしファイル名にスペースが含まれているため以下のような苦肉の策をとっておりますが

ls -l | awk '{print $5 "\t" $9$10$11$12$13$14$15$16$17$18$19}'

10個以上で区切られてる可能性もあるため根本的な対応をしたいと考えていますが
よい案はありますでしょうか

766:デフォルトの名無しさん
14/10/21 17:25:55.68 EsuQiv22.net
# ファイル名に「"」が含まれていたら知らね。
ls -Ql |awk '{split($0, foo, "\x22"); print $5 "\t" foo[2]}'

767:デフォルトの名無しさん
14/10/21 23:41:50.65 stXOK2Vv.net
Qオプションは勉強になった
ls -l|awk '{s=$5;for(i=1;i<9;i++)$i="";print s"\t"$0}'

768:名無しさん@そうだ選挙に行こう
14/12/13 17:07:55.12 8LbgKkKk.net
¥034  は ” (半角)
¥035  は # (半角)       でおkですか?

769:名無しさん@そうだ選挙に行こう
14/12/13 18:17:16.35 FQOeA8KF.net
>>759
いいえ違います。

770:デフォルトの名無しさん
14/12/14 00:00:31.34 7YfznIJB.net
どちらも非可読文字ですね。そしてそうなるとスレ違い。
awkと絡むのなら具体的にどうぞ。

771:デフォルトの名無しさん
15/02/03 10:36:52.13 Dvc0nyMp.net
Terastationのファイル・ホルダ名に使うとファイルレプリケーションでエラーが起こる文字があって、それを変換するバッチを生成する時にこのマイナー言語が大活躍した。
約80万件のファイルホルダ名から抽出するのに10分程度だった。

772:デフォルトの名無しさん
15/05/26 00:18:03.33 Y5HiR/XE.net
Gawk4.1.2が出たなあ、と思ってたらすぐ4.1.3が出た。
素人には違いがあまり分からんのだが。

773:デフォルトの名無しさん
15/05/31 09:20:55.82 PB6Yeih1.net
URLリンク(www.amazon.co.jp)実践入門-Software-Design-plus-中島/dp/477417369X
新しい本、出たんだな
廃れないのが凄い

774:デフォルトの名無しさん
15/06/03 20:45:34.22 vBAc8MUN.net
>>764
買ってきた。まだ最初の方と最後の方を眺めただけだけど。
ページiv(「はじめに」)でawkの表記について「本書内では、いずれの
場合もすべて小文字のawkという表現に統一しております」と
あるのに、書名がAWK。
巻末のリファレンスで気になったところ。
演算子の優先順位に触れていない、フィールド演算子が
「特別な意味を持つな変数」の中に入れられている。
参考書や文献がないけど、今時は「ネットでググれ」かな。

775:デフォルトの名無しさん
15/07/06 22:02:56.12 Wnwr3Nh9.net
Mono: Playback -9707 [5%] [-97.07dB] [on]
上の行からパーセントを除いた数字(上の例だと5)を取得したいのですがどのようにしたらよいでしょうか?
パーセントの値は0から100の整数だと思います

776:デフォルトの名無しさん
15/07/07 15:47:02.78 NFKuqu84.net
# $0 に入っているとして
sub(/%.*/, "");
sub(/.*[^0-9]/, "");

777:デフォルトの名無しさん
15/07/08 11:55:27.32 rptAPQZX.net
awk -F"[%[]" '{print $2}'
ではまずい?

778:デフォルトの名無しさん
15/07/08 18:52:19.39 GgkVcZ7j.net
>>767,769
ありがとうございました
どちらでも希望の結果を求めることができました

779:デフォルトの名無しさん
15/07/10 10:45:11.15 VcZTZ3UB.net
テンプレである筈の1が読めないんだが、このスレ的にはPOSIXで書くのが
正統?普段はGawkしか使わないので一応確認。

780:デフォルトの名無しさん
15/09/18 18:16:27.97 RqA0Le8+o
アホじゃないエイホだ

781:デフォルトの名無しさん
15/10/10 22:36:33.12 1AEUTcmG.net
awk の a は、aho の a
ただし、エイホと読むらしい
へぇーーーーー

782:デフォルトの名無しさん
16/02/12 17:12:05.45 VH2jVHwT.net
awk使ってるシェルスクリプト見ると逃げてるなあと思う

783:デフォルトの名無しさん
16/02/18 00:13:16.92 E3KgV2Kz.net
普通は x[3]=5 と書くが、=なしの
x[3]
だけでもエラーとならず、x を配列として確保し、length(x)=1 になるのを発見
まあ、あまり必要ないけど

784:デフォルトの名無しさん
16/02/18 23:58:18.64 kHIvdCfG.net
まあ、gawkのマニュアルでも代入の前に参照が出てくるし

785:デフォルトの名無しさん
16/02/20 00:57:58.12 OTE8dQpJ.net
そうでしたか、新発見でなかった

786:デフォルトの名無しさん
16/02/20 15:01:09.40 91Q+YYwH.net
代入前にうっかり参照してしまうのは稀に良くある。

787:デフォルトの名無しさん
16/02/28 01:02:06.47 Atbyv4Wk.net
IGNORECASE=1
をBEGIN の前に置いてもエラーにならず、不可解動作
セキュリティ的にやばくないの

788:デフォルトの名無しさん
16/02/28 02:01:41.85 2mMmSiU+.net
>>778
BEGIN セクションを先頭に書けとは何処にも書いてない。
BEGIN を最後に書いても END を最初に書いても問題は無い。
何処に書いても、実際には先頭行読み込み前、各行読み込み時、最終行読み込み後にそれぞれ
パターンマッチが行われている。
ただマッチする条件が特殊だから、先頭か最後でしか中の文が実行されないだけ。

789:デフォルトの名無しさん
16/03/29 09:03:58.15 /c8bAcK4.net
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
URLリンク(www.youtube.com)宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート

790:awk命
16/05/10 10:11:56.15 qP72K9YB.net
mawk32.exeで「multibyte char」のメッセージがでて困ってます、何が原因でしょう?
抑止する方法はありますか?
multibyte指定のコマンドラインオプションは無いようなのですが?

791:デフォルトの名無しさん
16/05/10 13:22:33.71 pT7b4QGj.net
UTF-8 が使えないのかも

「mawk multibyte char」で検索!

792:awk命
16/05/11 00:10:08.64 EkexSAUH.net
>782

データもプログラムもSJISです。
何に反応して multibyte charが出続けるのか不明です。
gawk高速なので満足なのですが、STDERRに multibyte charがで続けるのでうざいし、この出力ぶんだけ速度も低下?

793:デフォルトの名無しさん
16/05/11 00:13:30.76 Qn6YFszJ.net
入力にSJISでない文字が混在していることない?
nkf -s 入力ファイル | awk
で変換したら

794:デフォルトの名無しさん
16/05/11 03:47:08.47 6KznZIvs.net
コードを教えて下さい。
チャレンジしましたが、これではダメです。。
(for i=1, i<=NF, i++){
if $i<0{$i=0}
}
print $0


したいことは、下記のような行列の数字があって、負の値をゼロに置換したいです。

▼元の行列
3 15 6 1
-5 4 0 2
8 9 -7 11

▼やりたい変換�


795:繧フ行列イメージ 3 15 6 1 0 4 0 2 8 9 0 11



796:デフォルトの名無しさん
16/05/11 04:14:37.49 gi9ycYMA.net
構文がぜんぜん駄目。
{for(i=1;i<=NF;i++)if($i<0){$i=0};print $0;}

「したいことは、~したいです。」の構文も駄目。典型的なねじれ文。

797:デフォルトの名無しさん
16/05/11 07:39:07.59 E3fj3Ww+.net
Ruby, Python などを使えば?

798:デフォルトの名無しさん
16/05/11 12:31:52.37 ZhRn3EDd.net
>>787
Ruby, Python スクリプトを提示してみろよ。

799:デフォルトの名無しさん
16/05/11 22:58:11.78 Lckmn9CP.net
>>786
ありがとうございます!出来ました!

(一行プログラミング!awk便利ですね)

800:デフォルトの名無しさん
16/05/13 01:56:22.83 VtzDMLxe.net
awk じゃなくてもいいんなら

$ sed 's/-[0-9][0-9]*/0/g' ...

GNU sed なら

$ sed -r 's/-[0-9]+/0/g' ...

でええんちゃう?

801:デフォルトの名無しさん
16/06/14 11:25:33.91 ddY9aluRD
switchないのね

802:デフォルトの名無しさん
16/06/22 00:21:13.08 X+fwM1CQ.net
かまぷ 「『シェル芸』に効く AWK処方箋」

エイホ先生「AWKって使い捨ての言語(中略)プラスアルファの処理がやりたいよね。
ただその処理はとても簡単な処理でいい。そこに対して新しいプログラム言語を作っていきたい」

AWKブーム第1世代は「アイドル辞書」で学んだ―日本GNU AWKユーザー会 斉藤さん (1/5):CodeZine(コードジン)
URLリンク(codezine.jp)
2016/06/15 14:00

803:デフォルトの名無しさん
16/06/22 23:46:54.12 P+7nG182.net
やたらと続きは登録して読めと言われてもなあ。
このスレが立った頃からJGAUCのHPが更新されていないってのも凄い。

804:デフォルトの名無しさん
16/08/27 09:20:46.26 2q8s4uQl.net
Windows版のgawkで遊んでたら
for (i=0; i<n; i++) より
for (i=0; i<n; i+=1) のほうが
実行時間が短くなることに気づいた
なんだこりゃ

805:デフォルトの名無しさん
16/09/13 23:56:36.77 mfLTwPLq.net
for(i=1;i<=1000000;i++){a[i]=1}

for(i=1;i<=1000000;i++){a[i]=sprintf("1")}
結果は同じはずなのに、後者は異常にメモリを食う!ふしぎ!

806:デフォルトの名無しさん
16/09/14 00:22:19.58 YCeX8Gov.net
同じじゃないぞ。数値と文字列だ。
ところで、君が使ってる awk はどれ?

apropos awk

ってやってみたら、こんなん出てきた。

gawk (1) - パターン検索・処理言語
igawk (1) - インクルードファイルを使う gawk
a2p (1) - Awk to Perl translator
awk (1) - pattern scanning and text processing language
English (3perl) - use nice English (or awk) names for ugly punctuation v...
mawk (1) - pattern scanning and text processing language
nawk (1) - pattern scanning and text processing language

807:デフォルトの名無しさん
16/09/14 22:01:59.31 DqYC5LBT.net
>>796
例が悪くてスマソ、Cygwin上でgawk4.1.4使って
for(i=1;i<=1000000;i++){a[i]="1"}

for(i=1;i<=1000000;i++){a[i]=sprintf("1")}
でループ脱出直後のメモリ使用量を比較すると
上が60MBytes、下が600MBytesとかになった

cmdで動くgawkの3.1.7でも同じような差がでた
Linuxは試していないけど、もし大丈夫ならWindows版の問題かも

808:デフォルトの名無しさん
16/09/14 22:50:10.30 PWB0Awgu.net
>>797
OSX El Capitan
gawk 4.1.4

それぞれBEGIN{}に入れたスクリプトを読み込ませて実行。
で前者数十MB、後者3GB超までメモリ使った(アクティビティモニタ)。

809:795
16/09/14 23:40:38.22 YCeX8Gov.net
やってみたよ。環境は Debian jessie。
テストプログラム

#!/usr/bin/perl -w
use strict;
{
my $do_ps = 'system("ps p $PPID o pid,sz,args")';
foreach ( 1,'sprintf("1")'){
system('gawk',"BEGIN { for(i=1;i<=1000000;i++){a[i]=$_} $do_ps;}");
}
}

実行結果

PID SZ COMMAND
7389 7693 gawk BEGIN { for(i=1;i<=1000000;i++){a[i]=1} system("ps p $PPID o pid,sz,args");}
PID SZ COMMAND
7392 158116 gawk BEGIN { for(i=1;i<=1000000;i++){a[i]=sprintf("1")} system("ps p $PPID o pid,sz,args");}

KB 単位らしいから 8MB と 160MB 。ただごとじゃない差だね。
1 を "1" に変更してもこんな感じだから数値と文字列の差というわけではなさそう。

810:デフォルトの名無しさん
16/09/14 23:49:14.48 YCeX8Gov.net
ごめん、書き忘れた。

GNU Awk 4.1.1, API: 1.1 (GNU MPFR 3.1.2-p3, GNU MP 6.0.0)
Copyright (C) 1989, 1991-2014 Free Software Foundation.

811:デフォルトの名無しさん
16/09/17 08:30:37.61 didBD5ba.net
よく考えたら、メモリの使用量自体じゃなくて、それがどれだけ増えたかが重要だね。
そして、連想配列の構造体とキーに必要な量はどのケースでも同じと考えられる。
つまり、連想配列の要素のための量がどれだけ違うかを直接知ることができるはず。
というわけで、もう一回テスト。

URLリンク(ideone.com)

812:デフォルトの名無しさん
16/09/17 08:32:42.20 didBD5ba.net
実行結果

element before after diff
1 5685 7691 2006
i 5685 29226 23541
sprintf("%d",i) 5685 158124 152439
sprintf("%d",i) + 0 5685 29221 23536
sprintf("%d",i) "" 5685 37026 31341

1000000 要素の配列で 2MB って、いったいどうやってるんだろう。少なすぎる。
sprintf("%d",i) が突出して多いのは sprintf で多めに確保して
切り詰めたりせずにそのまま使ってるのだろうか。
さあ、gawk のソースコードをハックしてみるか!

813:デフォルトの名無しさん
16/09/17 14:11:27.89 IIH0ZjSk.net
推測だけど、stream, yield, callback、遅延処理かも

データをバッファサイズ分だけ読み込んで処理して、
次のコマンドへ送ったら、それを捨てて、次のデータを読み込むのかも

この方式だとメモリは、バッファサイズ分だけしか使わない

814:デフォルトの名無しさん
16/09/18 10:41:36.96 6jI6cHER.net
ベクターに公開されてるgawk3.1.5(と非公開の3.1.7)、ヘンテコな処理が見つかったのでメモ
このgawkのsystem関数を実行すると、環境変数TMPが指してるフォルダに
@echo off
system関数の引数
という2行が書かれたバッチファイルpip?.bat(?はsystem実行回数+1)というのが作成され

815:デフォルトの名無しさん
16/09/18 10:44:42.56 6jI6cHER.net
・・・いっぺんに書こうとしたらハネられるorz

816:803
16/09/18 10:46:32.08 6jI6cHER.net
(続き)
それを/c pip?.batで起動、完了後にpip?.batを
削除という流れでコマンドが実行される

817:803
16/09/18 10:47:07.98 6jI6cHER.net
(続き)
system関数を使ったスクリプトを同時に1つしか実行しないなら良いけど
2つ以上実行したときはタイミング次第でpip?.batの数字がぶつかり、先に実行した側が
・ コマンドが実行されない
・ コマンドが実行されるけど、完了後に「バッチファイルが見つかりません」が吐かれる
という結果になる

予めcmdの窓ごとにTMPを変えておけば問題ないけど面倒くさい
コマンド | getlineで起動したほうが手っ取り早いと思う
(ただし出力が2KBytes溜まると止まるから適宜リダイレクトする)

でも何でこんな方法でsystem関数を実装したんだろうね(´・ω・`)

818:デフォルトの名無しさん
16/09/18 13:53:41.51 EIh/dcA1.net
tmpfile を使えば、他と重複しない、ランダムな名前のファイルを作れるのに、

どうして使わないのだろう?

819:デフォルトの名無しさん
16/09/18 14:54:02.97 KtcAr9oX.net
MS-DOS ではね、コマンドラインの長さの制限が厳しかったんだよ。驚くなかれ、たった 128 バイトだ。
そんな環境では、バッチファイルにすれば実行できるけど

command /c "prog arg1 arg2 ..."

では command /c のせいで制限を越えるということもあるだろう。つまり、そういうことだ。
………冗談だ。確かにそういう制限はあったけど。
現在はもう system 関数ではそういうことをしていないということが ChangeLog に書かれてるよ。

2014-01-15 Eli Zaretskii <eliz@gnu.org>
* popen.c (os_system): Use spawnl, and quote the command line, to be consistent with what gawk_popen does.
(os_popen) [__MINGW32__]: Don't scriptify the command, to be consistent with gawk_popen.
(os_pclose) [__MINGW32__]: Update to match os_open: no need to unlink the script file.

820:デフォルトの名無しさん
16/09/18 15:07:54.47 KtcAr9oX.net
でもソースコードを見るかぎり、パイプではそういうことをしてるみたいなんだけど……
ちょっと試してみてくれないかな。

system("dir") | getline

みたいな感じ? よく知らないけど。

821:803
16/09/18 16:19:12.82 6jI6cHER.net
コマンド | getline で起動する場合はpip?.batは作られませんでした
system関数だけpip?.bat経由の模様
klabaster版のwindows用gawk4.1.3だとsystem関数がpip?.batを
作らなかったから、ベクター版固有の動きかなあと思います

822:デフォルトの名無しさん
16/09/18 17:46:00.36 KtcAr9oX.net
ありがとうございます。
gawk-4.1.1 の pc/popen.c を見た限りでは gawk の system 関数でバッチファイルを作るのは MINGW 限定で、
ChangeLog には問題が解消されたから直接 spawnl で実行するようにしたと書かれているわけですが
gawk のパイプ処理を実行している(と思われる) os_popen 関数ではバッチファイルを作るときと同様に
tempnam 関数でファイル名を作った上で、そのファイルを経由して受け渡しをしているように見えます。
これは MS-DOS の時代から使われてるやり方で、パイプのように見えてもパイプではありません。
このやり方だと gawk で

while (( command | getline) > 0)

と書いても実質的には

system("command > filename"); while (( getline < "filename") > 0)

と同じことになります。
あくまでも 4.1.1 の pc/popen.c の os_popen 関数がそう見えるというだけで、実際には違うかもしれませんが
自分で試すことができません。そもそも 3.1.5 のソースコードってどこにあるの?
もし勘違いじゃないなら >>807 と同じ問題が起こりそうな気が……
Linux を使ってる自分には関係ないといってしまえばそれまでですが。

823:デフォルトの名無しさん
16/09/18 19:56:17.75 zTPoEkjL.net
>>812
vectorの配布ファイル内のreadmeにはソースコードの
公開場所を探してるとか、直接連絡すれば渡すとか書いてある。

Windows版、NTあたりから一時ファイル作らずにパイプ動作するように
なったとか、どこかで読んだ気がするけど。

824:デフォルトの名無しさん
16/09/18 22:03:20.37 KtcAr9oX.net
謎は解けた。
ファイルを使ってデータを渡すのはマクロ __DJGPP__ とマクロ __MINGW32__ が
いずれも定義されていない場合らしいです。
Vector のは MINGW なので該当しません。お騒がせしました。

825:デフォルトの名無しさん
16/09/19 11:56:06.00 iIvzjj/t.net
ファイルを経由していても、ストレージに書き込むとは限らない

メモリ上だけに存在する、ファイルもあり得る。
LinuxのRAMディスク、tmpfs とか

826:803
16/09/19 14:26:19.66 fDWhtT6v.net
>>812
情報ありがとうございます。>>804で書いた「ヘンテコな処理」をpc\popen.c内に確認できました。
scriptify関数のtempnam呼んでるところでプロセスIDもつけるなり、細工したいなあ・・・

827:デフォルトの名無しさん
16/09/20 17:00:26.41 RIxgZ1yj.net
先日アクセスできなかった GNU のサイトが復活してたので 3.1.5 のソースコードを入手できました。
やっぱり os_popen からも scriptify を呼んでたみたいですね。4.1.1 のソースコードじゃ判りませんでした。
一応 chdir はアトミックな処理のはずなのでリスク回避に役立つと思いますよ。それ以外に方法がなければ。
chdir したら rmdir も忘れずに。

828:デフォルトの名無しさん
16/09/20 17:06:03.57 RIxgZ1yj.net
間違えた。chdir じゃなくて mkdir です。

829:デフォルトの名無しさん
16/09/22 12:11:24.09 nnsRF/zz.net
>>795
どうやら >>802 で想像した通り sprintf の仕様らしい。
本体は builtin.c の format_tree 関数らしい。
最初に 512 バイト確保したバッファは大きくはなっても小さくはならない。
実際の文字列に合わせて確保しなおしたらどうなるか >>801 のテストをしてみたよ。

改造前
element           before  after  diff
1               2753  4757  2004
i               2753  22357  19604
sprintf("%d",i)        2753 151283 148530
sprintf("%d",i) + 0      2753  22376  19623
sprintf("%d",i) ""      2753  30174  27421

改造後
element           before  after  diff
1               2753  4757  2004
i               2753  22357  19604
sprintf("%d",i)        2753  30174  27421
sprintf("%d",i) + 0      2753  22373  19620
sprintf("%d",i) ""      2753  30230  27477

あれ? jessie の gawk と比べてメモリの使用量が少ない。
-DDEBUG 付きでコンパイルしたから増えるかと思ったのに。
まあ、それ以外は一応予想通りではある。

830:デフォルトの名無しさん
16/09/22 23:15:31.17 SYBS8P/o.net
>>794とか
文字列の連結は "A" "B" よりもsprintf("%s%s", "A", "B") の方が速いとか
gawkって結構クセありますね

831:デフォルトの名無しさん
16/09/23 02:39:22.63 o4qLonoN.net
>>820
> 文字列の連結は "A" "B" よりもsprintf("%s%s", "A", "B") の方が速い
マジか。逆だと聞いていたが。

832:デフォルトの名無しさん
16/09/23 16:06:39.19 Y+5MXC/e.net
そんなバカな……と思ってやってみた。

URLリンク(ideone.com)

jessie 用のパッケージによる実行結果。

i++         6.15614
i = i + 1      6.02501
cat " and " dog   13.0163
sprintf       19.1612

インクリメントと足し算の差は有意とは思えない。
連結と sprintf の差は多分、倍くらい。
sprintf の中の複雑さを考えれば意外と差は小さいといえる。
フォーマット文字列が定数なら正規表現みたいにコンパイルすれば
高速化できる……のかなあ? 自分でやってみようとは(今はまだ)思わない。

833:デフォルトの名無しさん
16/09/24 23:15:47.76 +IiHRmp0.net
Windowsで使えるawkでUnicodeを正しく処理できる(length("あいう")で3が返ってくる)ものは
Cygwin版とVector版以外に無いでしょうか?

834:デフォルトの名無しさん
16/09/25 10:08:34.07 BH82R274.net
何があったんですか?

URLリンク(tanimoto.to)

に書かれているようなことですか? 別の選択肢も一応あるみたいですが。
トランスレータでもいいなら Perl に a2p が同梱されてます。

835:822
16/09/25 14:28:36.60 MNlfsMjx.net
特に困りごとは無いのですが、最新のVer4.1.4やその近辺のバージョンで
Unicodeが正しく処理できるものがあれば、今使っているBruce版3.1.7から
乗り換えたいなあと思いまして。

↓の5年前に書かれた記事の頃より選択肢が増えたりしてたら嬉しいなと・・・。
URLリンク(blog.livedoor.jp)

836:823
16/09/26 09:17:05.22 bhAuZr+w.net
理解しました。全滅だったんですね。
Windows での事情は存じませんが、こちらでも取り急ぎ gawk 3.1.5 を make してみました。
ところで、そのページのテスト3は不十分です。
UTF-8 でのパターンマッチは通常文字の誤マッチは原理的に起こりません。起こったらバグです。
だから、UTF-8 に対応しているかどうかをテストするために
sub(/.う/, "U")
というようなものを入れて試してみました。
今ビルドしたばかりの gawk 3.1.5 と jessie のパッケージの gawk 4.1.1 がこのテストに合格しました。
mawk 1.3.3 もインストールされてましたが、こちらはマルチバイト文字に対応していないようです。

さて、結論です。
シフトJIS に対応しているとされるものは避けた方がいいと思います。
余計な改造はしない方が信頼性は高いでしょう。
length がバイト数なのは、単にマルチバイト文字非対応でコンパイルされてるからだと思います。
マルチバイト文字対応版を誰かがリリースしてくれるのを待つか、自分でコンパイルするかですね。

837:デフォルトの名無しさん
16/09/27 17:33:47.16 Icjzq3KF.net
Linux では環境変数 LANG に UTF-8 が入ってないと期待通りに動いてくれません。
正確には LANG というより LC_CTYPE ですが、それはおいといて。
もしかしたらと思って、自分には無用だと思ってた Wine で klabaster gawk 4.1.3 を動かしてみました。
ところが、正規表現にマルチバイト文字が現れた時点で怒られます。
どうやら LANG が無いか、LANG=C じゃなければマルチバイト文字を使えないようです。
そして結局、正規表現の . や length を UTF-8 モードにする方法は見つけられませんでした。
記事のコメントには LC_ALL=ja_JP.UTF-8 で動くって書いてあるのに。
ひょっとして、Windows では原理的にできないということ?
これはいよいよ a2p が現実的な選択肢か?
……と思ったら、出力する Perl コードが間違ってます。

もう降参です。UTF-8 対応の gawk をお望みの方には Linux への引越しを強くお奨めします。

838:デフォルトの名無しさん
16/09/27 18:24:36.25 JiNhKH2a.net
cygwinやmsys2のgawkを使うのはだめなの?

839:デフォルトの名無しさん
16/09/27 18:34:39.64 BPXrtVfk.net
Windows Subsystem for Linux (WSL)では、Ubuntu64の実行ファイルが動く。
Linux API を、Windows API へ変換して呼び出す

Ubuntuのパッケージも、apt-getでインストールできる

840:デフォルトの名無しさん
16/09/27 19:26:43.05 Icjzq3KF.net
だめというか、見つけられなかった。
ただでさえ Windows のことなんか知らないんだからこれ以上無理。
いい方法を知ってたら教えてあげて。

841:デフォルトの名無しさん
16/09/27 19:51:11.26 Icjzq3KF.net
Cygwin は試してみたけどインストーラに丁重にお断りされたよ。

842:822
16/09/27 23:10:22.59 eGFFwbsN.net
たくさんの情報ありがとうございます。現状でWindowsに拘るなら、Bruce版3.1.7を継続して
使用するか、Cygwin版に乗り換えるか、Windows Subsystem for Linuxで動作させるかの
いずれかになりそうですね。

CygwinやWindows7でのWindows Subsystem for Linuxは、どちらも別途インストールが必要
とのことなので、職場の自PCはともかくスクリプト配布先に(スクリプトを動かすためだけに)
導入してもらわないといけないのはちょっと難しそうです。
Cygwinの導入状況とWindows10への切り替え時期の様子を見つつ、しばらくBruce版3.1.7を
使うことにします。

843:デフォルトの名無しさん
16/09/28 07:26:06.87 6NcLFLen.net
実は方法が無いわけではない。シングルバイトモードならできる。でも本当にやりたい?
本当に真剣に必要としているなら、このスクリプトでテスト3をやってみてほしい。

{
  c = "[\\000-\\177]|[\\340-\\357][\\200-\\277][\\200-\\277]"
#  print( length($0));
  str = $0; print( gsub( c,"0",str));
  print;
  sub(/<tag>/, "");
  sub(/<\/tag>/, "");
  sub(/hello/, "ABC");
#  sub(/.う/, "U");
  sub( sprintf("(%s)う",c),"U")
  print;
}

844:デフォルトの名無しさん
16/10/01 22:37:26.49 apxhHWta.net
やっぱり klabaster gawk はよく解らない。

$cat u2.awk
{
  print( length($0))
  sub(/う/, "U")
  print;
}
$LANG=C wine ../gawk64.exe -f u2.awk u2.txt > /dev/null
$LANG=ja_JP.EUC-JP wine ../gawk64.exe -f u2.awk u2.txt > /dev/null
$LANG=ja_JP.UTF-8 wine ../gawk64.exe -f u2.awk u2.txt > /dev/null
gawk64: u2.awk:3: sub(//, "U")
gawk64: u2.awk:3: ^ unterminated regexp
gawk64: u2.awk:4: sub(//, "U")
gawk64: u2.awk:4: ^ unexpected newline or end of string
$

UTF-8 で「う」は 3 バイトだから、シフトJISで解釈した結果
その後ろの / もマルチバイト文字の一部になるのだろうか。
いや、UTF-8 で解釈してくれないことに文句を言いたいんじゃないんだ。
UTF-8 で書いてあるのになぜ LANG=ja_JP.UTF-8 の時だけエラーになるのだろう。

845:デフォルトの名無しさん
16/10/02 00:14:27.80 lSw/Qfuv.net
この記事を見るかぎりではklabaster以外のWindows版gawkでもダメっぽいです
URLリンク(groups.google.com)

846:デフォルトの名無しさん
16/10/08 21:51:54.06 66+5bUgM.net
>>748からのレスで、$が演算子だったの? というようなところが気になって
少し調べてみた(調べたというほどの作業はしてないか)。

まず書籍。手持ちの数冊で確認。
『プログラミング言語AWK』(トッパン 初版第7刷)
さいごのまとめで演算子一覧に記載。本文中(p8)では「欄は常に$1,$2のように
参照しなくてはいけないと思われているかもしれないが、実は$のあとには,欄の
番号を指し示すための任意の式を書いてもよい」と書かれている。また、p46には
「欄変数」の項に「入力行の欄(field)は,$1,$2から始まって,$NFという名で呼ばれる」
との記述がある。

『sed & awk プログラミング』(アスキー出版局 初版)
旧版。本文中(p212)で「フィールドを参照したいときには、フィールド演算子$を使えばよい」
また(p217)で「フィールドを参照するにはドル記号($)演算子を使う」、Appendix(p471)で
「それぞれのフィールドは、$1ならば最初のフィールドの値を参照し、」と表現されている。
Appendixの演算子一覧に記載。

『AWKを256倍使うための本』(アスキー出版局 初版)
Appendixで演算子一覧に記載されているが、本文(p65)で「分解された各フィールドは、
$nという変数(nは、始めのフィールドから順に1,2,3...となる。もちろん即値の代わりに変数を
指定することも可能だ)でアクセスすることができる」とある。他の箇所でも$n変数と書いてある
ところがある。p66で「各フィールドを表す$nであるが、なぜこんな名前になっているかご存じだろうか?
実はこれもUNIX文化からきているのだ。UNIXの代表的なシェルであるshやcsh(最近ではkshや
tcshかな?)のシェルスクリプトのなかでコマンドラインパラメータを表す変数として$nが使用されて
おり(中略)これにあわせてawkで$nが使用されているようなのである」と書いてある。

『AWK実践入門』(技術評論社 初版)
>>765にあるように特別な変数として扱われており、リファレンスにも$が演算子で
あることの記載がない。
(続く)

847:835
16/10/08 22:00:44.45 66+5bUgM.net
(続き)
ネットの情報。2016.10.8現在。
Gnu Awk ユーザーズガイド/The GAWK Manual/Effective AWK Programming
gawkの解説書。バージョン違いがあるようだが、翻訳版で目に留まったもの。
「定数でないフィールド番号」の項で「あるフィールドを参照するために、awk言語での任意の式を
`$'の後で使うことができる」と記述されている。「演算子の優先順位」の項では演算子として
並べられている。

man gawk
翻訳版、リナックスコマンドというサイト(www.linux-cmd.com)から。
「入力レコード中の各フィールドの値は、左から $1, $2 等という名前で参照できます。
$0 はレコード全体です。フィールドに値を代入することもできます。フィールドは定数だけでなく、
変数によって参照することもできます。」となっている。演算子のところに記載あり。

AWK Users JP
サイト中「awk 基礎文法最速マスター」のページで「特殊変数」の項に$0,$1~$NFの説明。
フィールド参照の語はない。また、リファレンス的な演算子のまとめはない(?)。
ページ上部に「この文書は書きかけです」とあるので、未整備ということだろうか。

IBM Knowledge Center
awkコマンドのページ(www.ibm.com/support/knowledgecenter/ja/ssw_aix_71/
com.ibm.aix.cmds1/awk.htm)では「レコードとフィールドによるファイル処理」の項で
「各フィールドはフィールド変数によって参照されます。レコードの最初のフィールドには $1 変数、
2 番目のフィールドには $2 変数というように、変数が割り当てられます。」との記述。少しうしろの
方、「フィールド変数」の項でも「フィールド変数は、$ (ドル記号) とそれに続く数値または数値式で
指定します。」とある。$が演算子であることの記載はない。

てな感じで、『プログラミング言語AWK』でも「欄変数」という表現があり、誤解しそうな感じはする。
また、256倍本に書いてあるようにシェルスクリプト中のパラメータとして$nがあることから、$nが
(特別な)変数として認識されてしまっているのではないか、とも想像する。個人サイトのawkの解説
ページでは、$nという変数にフィールドが代入されると説明しているところもあった。そのように理解して
スクリプトを書いてもさして不都合はないだろうな、とは思うが。

848:デフォルトの名無しさん
16/10/08 23:11:50.50 ZMh6U7O9.net
広範な調査乙。Gawkのrefcardでもちゃんとoperatorに含まれているなあ。
演算子と明確に認識していなくても、$の後に式OKと思っていれば差し支えなさそう。

849:デフォルトの名無しさん
16/10/18 23:10:18.54 TQpGgbw6.net
gawk4で関数ポインタみたいなもんが追加されましたけど、これlengthとかsubstrの
組込み関数や@loadした自作dllの関数とかにも使えるんですね
案外便利かも

@load "hage.dll"
 BEGIN{
 kumi = "length"
 func = "hagefunc"
 ng[1] = "substr"
 print @kumi("ABC")
 print @func("彡 ⌒ ミ ")
 print @ng[1]("XYZ", 1, 1) # 配列越しに呼ぼうとしたらsyntax error・・・残念
}

850:デフォルトの名無しさん
16/10/21 17:10:59.85 MQQBNMPM.net
>>755
こういう過疎スレで無駄に突っかかってくるやつむかつくんだが死ね

851:デフォルトの名無しさん
16/11/23 00:01:26.03 bt3mTQnz.net
>>840
ブーメランかよwww

852:デフォルトの名無しさん
16/11/23 01:18:15.98 noM2Pdp3.net
\おはげだー!/

853:デフォルトの名無しさん
16/11/30 02:56:38.28 PeC/aWZc.net
URLリンク(imgur.com)

854:C初心者
17/02/28 13:18:15.09 Mb8mQo1M.net
awkスクリプトをCソースに変換してコンパイルするための「awka」というツールでできるだけ簡単にUTF-8サポートさせる方法を知りたいです。
ネットで散々調べましたがないようです?

855:デフォルトの名無しさん
17/03/02 00:28:53.73 CDxvUfiY.net
このスレも10周年か

856:デフォルトの名無しさん
17/03/05 09:28:55.73 EQCsqksH.net
>>844
それがあなたの現在の実力だったということです
お疲れ様でした

857:デフォルトの名無しさん
17/03/05 14:45:26.28 KmKKYedf.net
gawkに対応してるなら大丈夫ってことかな?
asciiしか考えていないなら、ソース全チェック…。
要するに、日本語化するんだろうけど。

全然別の言語変換にちょっと咬んだことがあるんだけど、
製品化しちゃってからダブルバイト考慮してないことがわかって、かなり面倒だった。

とりあえず変換してから、ソース見て直すほうが早かったり(笑

がんばってね。

858:デフォルトの名無しさん
17/03/06 11:39:31.22 FdaYmB9f.net
awkで $1,$2...$6 こんな出力を↓下にしたいんだけど どうすればいいですかね?
470230
470290

002347
002479

859:デフォルトの名無しさん
17/03/06 12:33:46.83 FW5jfGh1.net
GNU awk の asort() を使うとか。

printf '470230\n470290\n' |
gawk -vFS= -vOFS= '{
for(i=1;i<=NF;i++){
arr[i]=$i
};
asort(arr);
for(i=1;i<=NF;i++){
$i=arr[i]
};
print
}'

860:デフォルトの名無しさん
17/03/06 15:19:43.83 FdaYmB9f.net
ありがとう
gawk いれないでなんとかならないかな

861:デフォルトの名無しさん
17/03/06 17:28:40.15 FW5jfGh1.net
う~ん、そうなると awk を使わなくてもいいかな

printf '470230\n470290\n' |
while read -r n
do
echo "$n" | grep -o . | sort -n | tr -d '\n'; echo
done

862:デフォルトの名無しさん
17/03/06 19:23:27.89 08XsJPyW.net
>>841
だからブーメランとかそういうの関係ないから死ねって言ってんだろカス
死ね

863:デフォルトの名無しさん
17/03/06 19:24:30.15 08XsJPyW.net
>>845
粘着が10年位延命しても何もすごくねえよ
突っかかってきたぶちころすぞ雑魚死ね>>841

864:デフォルトの名無しさん
17/03/06 19:26:33.18 08XsJPyW.net
>>841
ブーメランとかじゃなくて死ねって言ってんだから死ねボケ

865:デフォルトの名無しさん
17/03/07 08:17:48.93 6Hf5Xh2e.net
お疲れ様でした

866:デフォルトの名無しさん
17/03/09 21:48:39.65 0T9qj2kA.net
連想配列で
echo '470230' | awk 'BEGIN{FS=""}{for(i=1;i<=NF;i++){a[$i]++}for(i=0;i<=9;i++){for(j=1;j<=a[i];j++){printf("%s", i)}}printf("\n")}'
002347

867:デフォルトの名無しさん
17/03/10 00:18:57.87 +B1nKlhG.net
既に否定されているがgawk4がもし使えたら
awk '{ORS="";PROCINFO["sorted_in"]="@val_num_asc";x=split($0,a,"");for (i in a)print a[i];print "\n"}'

868:デフォルトの名無しさん
17/03/10 04:05:38.25 wGo6zQ56.net
最近の gawk ならインクルードファイルが用意されてて join とか使えたり

gawk -vFS= -vOFS= -i join.awk '{split($0,a,"");asort(a);print join(a,1,length(a),SUBSEP)}'

869:デフォルトの名無しさん
17/04/04 22:35:43.00 9/WMFGSO.net
# gawk4の読込みタイムアウト機能、けっこう便利そう・・・だけどWindowsはCygwin版じゃないと使えない。残念無念。
BEGIN{
  PROCINFO["/dev/stdin", "READ_TIMEOUT"] = 180000
  print "3分間待ってやる"
  getline t < "/dev/stdin"
  if (t=="バルス") {
    print "ああ…ああ…目があぁぁぁぁぁ~!"
  }
  else {
    print "時間だ!答えを訊こう!"
  }
}

870:デフォルトの名無しさん
17/09/16 00:02:08.63 lO9EtkAG.net
自作の読込みパーサextensionでgz形式のファイルを食えるようにしてみたけど
パーサは一度にひとつしかロードできない設計らしく(ソースでそうなってた)
同じ読込みパーサ形式のxmlライブラリとは併用できなかった
ちょっと使いにくいなあ・・・

871:デフォルトの名無しさん
17/10/09 16:41:58.59 7/rU/a8H.net
4.2.0Betaあげ

872:デフォルトの名無しさん
17/10/16 14:34:21.07 tJ1aGDYb.net
ファイルの終端関係の謎のエラーに直面
「何で行末が欠ける?分からん、全然分からんぞ!」
と悶えていたら、
いつの間にかvimの設定が変になっていて、
書いたファイルがデフォで行末に\rが来る
ようになっていた。
brew でインストールvimインストールしたとき
妙な設定になったのか?
いやねawkのスクリプトで、
空フィールドが\rになったりとか
macOSなのに変だなあと思っていたのだが…
システム外vim使うときは要注意か。

873:デフォルトの名無しさん
17/10/16 14:41:37.20 tJ1aGDYb.net
うぉーっ、林檎のnumbersで書き出したCSVファイルが
DOS改行になっとる…罠だ

874:デフォルトの名無しさん
17/10/22 23:24:45.88 /qEHJ0vm.net
お疲れ様でした

875:デフォルトの名無しさん
17/10/22 23:26:23.47 /qEHJ0vm.net


876:href="../test/read.cgi/tech/1172242542/755" rel="noopener noreferrer" target="_blank">>>755 普段話題なく3年も続こうがべつにすごくないね



877:デフォルトの名無しさん
17/12/09 10:00:30.84 /kecouyU.net
BEGIN{for(i=1;i<=10000000;i++){printf "%08d", i > "test" } close("test)} の実行にかかる時間を
4.1.4と4.2.0で比較すると、4.2.0のほうが倍近く速くなってるね
fwriteのロックがどうたらの影響なんだろうけど

878:デフォルトの名無しさん
17/12/12 21:01:15.07 zxiueT/o.net
懐かしいなぁ。
AWKは自由に現実的な限度はあるけど、書いてて楽しい言語だった。

879:デフォルトの名無しさん
18/01/08 11:00:30.57 szpKYJOz.net
お疲れ様でした

880:デフォルトの名無しさん
18/01/12 00:18:25.22 8Bbkgawk.net
IDがgawkなので来ました

881:デフォルトの名無しさん
18/01/17 10:09:56.59 MoHAEd1l.net
AWKって基本的にUnicodeには対応してるんだよね。
GNUにしろBSDにしろ。

882:デフォルトの名無しさん
18/01/17 17:52:56.47 MoHAEd1l.net
置換函数の第二仮引数に[バックスペース][置換対象の文字列]みたいにしたい時は
gsub(/foo/, "\\\\&", $n)
ってしないといけないんだね。
gsub(/foo/, "\\bar", $n)
が foo -> \bar だったんで foo -> \foo は
gsub(/foo/, "\\&", $n)
でいいと思って半時程嵌った。

883:デフォルトの名無しさん
18/01/18 07:25:24.80 eRgrS92p.net
>>863
それ勧告に従っただけだと思うが。
URLリンク(www.ietf.org)

884:デフォルトの名無しさん
18/03/09 13:30:21.59 Yd19z7Tx.net
ある行に 20 と 34 とはいってる
この行ごと除外したいけど・・・
 

885:デフォルトの名無しさん
18/03/09 14:33:06.31 X3i0O3oy.net
grep -v ' 20 と 34 '

886:デフォルトの名無しさん
18/03/09 21:38:00.87 3i0y1Him.net
こうかな
gawk "$0!~/20|34/{print}"

887:デフォルトの名無しさん
18/03/09 23:45:36.30 Ejthnyow.net
AWK プログラムの基本構造となっている「パターンとアクションの対」のうち、
アクションが省略されている場合は入力行がそのまま出力される。
またパターンが単一の正規表現である場合は、その正規表現と $0 との照合が行われる。
gawk '!/20と34/'
gawk '!/20|34/'

888:デフォルトの名無しさん
18/03/10 21:39:17.88 NqpdHf3N.net
こぴぺしてやってみたけど 両方消えちゃうんだよね
20 と 34があった場合 出力しない
片方でもあれば 出力する
awk '!/01 / && !/03 /'  これも両方消えてる・・

889:なんか日本語がおかしいな。
18/03/11 06:07:55.06 rsmr5+n0.net
>>877
「20 と 34 を両方含む時だけ出力しない。片方だけの場合は出力する。」
そう言いたいのか?
gawk '!(/20/&&/34/)'

890:デフォルトの名無しさん
18/03/11 10:58:35.24 tN+YLJlR.net
ありがとう 
()はきがつかなかった・・

891:デフォルトの名無しさん
18/05/23 20:10:48.40 Au5e7VGg.net
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
0VDE5

892:デフォルトの名無しさん
18/06/08 22:00:41.48 W8HYHVfd.net
split関数より$0へ代入したほうが速いage

893:デフォルトの名無しさん
18/06/27 16:43:15.93 tzYH0Nnw/
そんなわけないw

894:デフォルトの名無しさん
18/07/04 22:29:02.55 gFgZc5FG.net
02P


次ページ
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch