07/04/18 14:32:48 0oaoWzLv0
和訳氏の実験の仕方にはいくつか問題があったのでそれをまとめておく。 今後同じようなベンチマークを取りたい人用に。
1、ダミーはいらない。(今回の実験の解釈が難しくなった諸悪の根源、何故付けたのか理解し難い)
2、まず遅い正規表現を大量に使い、フィルタが効いているかどうかをチェックすること。
(>>788に正規表現500個が無かったので効いているかどうがのチェックをしてない可能性があると初めから疑っていた)
3、"当たりフィルタ" の計測方法は2種類ある。
・ 一番上のフィルタが必ずヒットするようにする計測方法。
・ 大量にあるフィルタの中のどれか1つがヒットする計測方法。
上はある1つのフィルタと別のもう1つのフィルタの速度差を計る時に使う。
この場合は速度差を見るためには大量のHTMLソースを用意しないといけない。
そして必ず一番上のフィルタがヒットするものを並べること。
下は正規表現でまとめた場合にどれくらい遅くなるかを調べるために使う。
まとめをバラした場合の数が少ないとタイム差は大きくなり、その逆だとタイム差は小さくなる。
よってまとめ方によっては結果が逆になることがあることに留意する。
以上。