09/04/01 10:48:51 M7y6qJEl
てすてす。
こちらネトゲ速報保守に使わせていただきます。
▽→●
主キーURL→URL+日付時間
正規表現
(?<![ァ-ヶヲ-゚a-z\-])(ローズ|ローズ|rose)(オンライン|オンライン|online|ol)?(?![ァ-ヶヲ-゚a-z\-])
このパターンなんだけど。。。たぶん文字コードの影響でエラー出る。
eucだと書き方違うのかな?ローズの部分は文字化けしてないようですが。
41:名無し@お前ら落ち着け
09/04/01 16:17:48 M7y6qJEl
16時分まで抽出しました。昨日分は出来てる!
42:名無し@お前ら落ち着け
09/04/02 00:42:59 mr0hPyy0
>>41
ありが㌧
43:名無し@お前ら落ち着け
09/04/02 09:11:12 19mYRAC4
9時までの抽出した。昨日分は出揃っているです。
正規表現の人いませんか?(。。
44:名無し@お前ら落ち着け
09/04/02 17:13:04 j2bYW61n
>>43
ありが㌧
4/1分うpした
4/2分は出揃うのが19時頃なので、それ以降にb
45:名無し@お前ら落ち着け
09/04/02 17:57:17 19mYRAC4
>>44
今ね手動取得なんだ><
20時前後になると思うけど当日分更新したら、またレスするね!
とりあえず18時分まで・・・取得。
46:名無し@お前ら落ち着け
09/04/02 18:03:59 VOYqp/xA
スレリンク(mmonews板:543番)から移動っと
47:名無し@お前ら落ち着け
09/04/02 18:07:31 19mYRAC4
こっそり移動してました(。。
48:名無し@お前ら落ち着け
09/04/02 18:20:56 VOYqp/xA
正規表現も方言がいろいろあるのでややこしいですねえ
(?<!)みたいな戻り読み、先読みなどが使えない場合もありますし、
”[ァ-ヶヲ-゚a-z\-]”はSJIS用の「カナ・カナ・アルファベット・-」表記です
他にも半角カナの扱いとかSJISとeucでいろいろあるかも
「RSS・DB登録・正規検索・表示」の全部の段階でeucなんでしょうか?
正規表現エンジンと言語・DBの種類とかあれば手がかりになるかもです
エラーメッセージも出来れば書いてもらえれば…
ちなみに私は正規表現のチェックを
OpenJaneのReplaseStr用ツール・ReplaceStrToolでやってます
SJIS・鬼車エンジン(たぶんperl準拠)です
ReplaceStr.txtを活用するスレ Part5
URLリンク(jane.s28.xrea.com)
49:名無し@お前ら落ち着け
09/04/02 19:14:47 KRdDVf0d
>>45
作業出来る時間が、
朝7時、夕方3時、夜中0時の3回のどこかだから、
その辺りで調整してくれたら、何回も手作業しなくていいからね
例えば・・・
16時前後にうpが無い→次回作業が0時確定→16~0時の間に1度更新、みたいな
それも無理しなくていいからね~
50:名無し@お前ら落ち着け
09/04/02 19:48:58 ZL+H+70V
19:40取得しました!
正規表現はPOSIX拡張正規表現関数とPerl互換の正規表現関数が選べるです。
今まで1タイトルに複数のマッチングワードを使っていたのを、1行で表現するのが理想です。
文字コードはサイトによってまちまちですがDBに格納する段階でeucにしてるです。
sjisのままだとソートに難ありでeucだと問題回避できるのです。
表示もeucです。euc以外をeucに置き換えてから処理することも可能ですが
eucで統一したほうが処理は速いです。
やぱし文字コードで正規表現部分は変わるのですね?@@
51:名無し@お前ら落ち着け
09/04/02 20:29:58 ZL+H+70V
自動更新できない理由が分かり解決しました。
レンタル鯖側で3/27からphp仕様が変わってcron動作記述も変えなきゃいけなかった。
これで自動更新しますお!
現在の自動更新設定
月~土
11,13,15,17,19,21時に取得してコピペ元作る!
52:名無し@お前ら落ち着け
09/04/02 21:12:03 VOYqp/xA
正規表現は半角カナの部分をなくしてコレでどうでしょう?
(?<![ァ-ヶヲ-゚a-z\-])(ローズ|ローズ|rose)(オンライン|オンライン|online|ol)?(?![ァ-ヶヲ-゚a-z\-])
↓
(?<![ァ-ヶーa-z\-])(ローズ|rose)(オンライン|online|ol)?(?![ァ-ヶーa-z\-])
これでいけるなら半角カナを全角に変換した後に正規検索したらいいと思いますが、
こんな問題があるようで
文字コードの部屋 -- 半角カナ
URLリンク(mikeneko.creator.club.ne.jp)
> 半角アは、8E B1 という2バイト表現であらわせます。
> しかし困ったことに、シフト JIS コードで 8E B1 といえば、「竺」という漢字になります。
> このように、EUC の半角カナは、シフト JISの次の領域と*必ず*衝突します。
衝突回避のために、
半角カナは全角カナに変換→文字コード変換してDBに入れておいた方がいいかもです
mb_convert_kana
URLリンク(phpspot.net)
ついでに全角英数字も半角にしてもいいかも
$str = mb_convert_kana($str, "KVa");
あとこんなのがありました
正規表現メモ - PHPで使用できる正規表現(mb_ereg)
URLリンク(www.kt.rim.or.jp)
eregはマルチバイト文字非対応ですのでご注意
英字大小文字の区別をしない”mb_eregi”がいいかと
53:名無し@お前ら落ち着け
09/04/02 21:13:30 VOYqp/xA
あー、半角カナだと濁点・半濁点も一文字だから単純にカナ→カナだと「ロース゛」とかになるかもw
うーむ
54:名無し@お前ら落ち着け
09/04/02 21:28:49 ZL+H+70V
pregのperl互換使ってました。こっちのほうが標準かと思って(。。
URLリンク(noongoro.main.jp)
例えば英雄オンラインのようにマルチバイトでの取扱いしかできないパターンが
あるきがするの。完美世界でヒットさせるにもマルチバイト対応してないとと
考えるとpreg一択になるのかな?
まだロジック組み込んだだけで検証も済んでないのです;;
簡単なパターンからどこまで出来るかですね。
phpのpreg_mathingをテストできるサイトがあったらいいんだけど・・・
55:名無し@お前ら落ち着け
09/04/02 21:30:01 ZL+H+70V
正確にはphp5のpreg_match()関数 でした。
56:名無し@お前ら落ち着け
09/04/02 22:05:05 VOYqp/xA
preg_matchだと"/~/i"で正規表現をはさんでやればいいんですかね?
\のエスケープとかもいるんだろか…ためす環境がないのでよくわからんですw
57:名無し@お前ら落ち着け
09/04/02 23:23:23 ZL+H+70V
>>56
/~/ですね。
でも/はパターン外で必ず括るようにしてるです。
エスケープもいるぽい。
何か簡単なのからいきます。
58:名無し@お前ら落ち着け
09/04/03 16:55:58 gYfeI0ge
現在作業中なんだけど、
たまに該当ページに飛ばないURLがあるみたい
“ありがとう”「Guns of The HIDECHAN!Radio.」最終回...
URLリンク(www.gpara.com)
これも該当の記事にいかず、抽象的?なページに飛ぶの
59:名無し@お前ら落ち着け
09/04/03 17:15:50 lLeJX7JY
確認しました!
RSS情報とタイトル,URLは同一なので、PG上の間違いはないです。
ページが無い速報的な意味あいなのかな?
背後に気をつけろ!『Lost Eden』新マップ「モスエリエン」追加...
URLリンク(www.gpara.com)
こちらはページがある。
飛んでみるまで判断付かないので、困るね・・・。
何か違いがわかればPGで振り分けることも可能です。
60:名無し@お前ら落ち着け
09/04/03 17:31:15 yk7yzHEC
>>59
了解、㌧㌧
61:代打1号 ◆CoWqkZMvDY
09/04/04 21:37:54 BJBRu37R
まとめさん
LEGEND of CHUSENの記事で、
同じ記事で別の情報サイトがあって、
漢字表記のサイトは分割項目に上がってたんだけど、
英語表記のサイトは未分類に上がってたの
自力しか無理かな?
未分類になってたもの↓
飛行システム&霊獣登場『LEGEND of CHUSEN』4月「神々の遺産」...
URLリンク(www.gpara.com)
62:名無し@お前ら落ち着け
09/04/04 21:47:52 dIPemfn1
これで
(?:CHUSEN|誅仙)
63:代打1号 ◆CoWqkZMvDY
09/04/04 21:53:09 BJBRu37R
>>62
ありが㌧
いつも迅速な対応助かります^^
64:名無し@お前ら落ち着け
09/04/04 23:01:10 n3Q3X1uS
62は正規表現さんだお。
キーワード「誅仙」のみだったの(。。
次回から>>62の正規表現で両方ヒットする!
過去データは一度消さないと振り分けないです;;
65:名無し@お前ら落ち着け
09/04/04 23:13:42 n3Q3X1uS
これは( )でグループ化して
|でまたはで
?:これは何を意味してるんだろ(。。
66:名無し@お前ら落ち着け
09/04/04 23:27:43 dIPemfn1
>>65
メモリにスタックしない()ですよん
?:なしでもおkですが、置換だと後から\1とかで使い回すのでメモリ消費して速度も不利なはず
つっても何万行とかなければ変わらないと思いますがw
67:名無し@お前ら落ち着け
09/04/04 23:31:29 dIPemfn1
こんなのあったです
PHP正規表現チェッカー
URLリンク(www.rider-n.sakura.ne.jp)
68:名無し@お前ら落ち着け
09/04/04 23:51:04 n3Q3X1uS
使い方わからない・・・
サルでもわかる正規表現で勉強してまつ><
(CHUSEN|誅仙)
これじゃあだめなのね?
69:名無し@お前ら落ち着け
09/04/05 00:12:26 2Bfscxv8
>>68
いあ、おkですよん
たとえば置換の場合に
http://(\w+)\.(\w+)/→\1だったら
URLリンク(hogehoge.net)→hogehogeになるです
http://(?:\w+)\.(\w+)/→\1だったら最初の(?:)は\1に代入されないので
URLリンク(hogehoge.net)→netになるです
70:代打1号 ◆CoWqkZMvDY
09/04/05 01:06:40 /ZctCPx4
>>64
だと思った^^
二人ともに感謝してるお~b
71:名無し@お前ら落ち着け
09/04/05 05:52:10 rtn4tpEp
(。。
^^
だお。
ですよん
お~
72:名無し@お前ら落ち着け
09/04/06 13:19:11 Tn5tRIh1
TERAの公式サイトURL分かりますか?
パターンに追加したい。
73:名無し@お前ら落ち着け
09/04/06 13:21:26 Tn5tRIh1
そして>>69はまだ理解に苦しんでるw
日付指定の記事再作成(RSSは読まない)作ったので、
パターンで振り分け直しが出来るのだ。
74:名無し@お前ら落ち着け
09/04/06 14:29:28 Tn5tRIh1
/(?:CHUSEN|誅仙)/i のパターンで
/(?:TENVI|テンビ)/i は書けましたが
/(?:MONSTER.WELT.ONLINE|モンスターヴェルト・オンライン)/i
/(?:MHF|(MONSTERHUNTER|モンスターハンター)?(FRONTIER|フロンティア))/i
ここらへんが心配。オンラインで()するとオンライン付くもの全てを引いてしまったりする。
75:名無し@お前ら落ち着け
09/04/06 15:04:15 sPOESyJK
>>73
()でグループ化すると変数(\1 \2等)に入れる
(?:)でグループ化すると変数に入れないからほんのわずか速度うpの可能性あり
>>74
こんな感じかな(半角カナは全角に変換してると想定して対象外)
/(?:MONSTER.WELT.ONLINE|モンスターヴェルト・オンライン)/i
↓
/(?:MONSTER|モンスター).{0,2}(?:WELT|(?:[ウヴ]ェ|ベ)ルト)(?:.{0,2}(?:オンライン|online|ol))?/i
/(?:MHF|(MONSTERHUNTER|モンスターハンター)?(FRONTIER|フロンティア))/i
↓
/(?:MHF|(?:モンハン|(?:MONSTER|モンスター).{0,2}(?:HUNTER|ハンター)).{0,2}(?:FRONTIER|フロンティア))/i
そのままだと見づらいからインデントつけたやつ
/
(?:MONSTER|モンスター)
.{0,2}←なにか0~2文字(スペースや・などを想定)
(?:
WELT
|
(?:[ウヴ][エェ]|ベ) ←ヴェルト・ウェルト・ベルト・ヴエルトなど
ルト
)
(?: ←「オンライン」の部分だけどなくてもいいかも
.{0,2}
(?:オンライン|online|ol)
)?
/i
76:名無し@お前ら落ち着け
09/04/06 15:07:25 sPOESyJK
おっと、全角英数字も変換でよろすく
文字列検索の時だけでいいので、対象を半角カナ→全角カナ・全角英数字→半角英数字に
77:名無し@お前ら落ち着け
09/04/06 15:36:04 Tn5tRIh1
?: これは速くなるで理解!
今回は理解できた。アリガトです。
でも最後の/i前の?は要らないよね?
78:名無し@お前ら落ち着け
09/04/06 15:49:16 sPOESyJK
オンラインがつくかどうかビミョーだからばっさりなくしてもいいかも
/(?:MONSTER|モンスター).{0,2}(?:WELT|(?:[ウヴ]ェ|ベ)ルト)(?:.{0,2}(?:オンライン|online|ol))?/i
↓
/(?:MONSTER|モンスター).{0,2}(?:WELT|(?:[ウヴ]ェ|ベ)ルト)/i
79:名無し@お前ら落ち着け
09/04/06 15:49:32 Tn5tRIh1
TERA公式は分かりました。
URLリンク(tera.hangame.com)
マスタ登録に必要だった(。。
80:名無し@お前ら落ち着け
09/04/06 16:13:18 Tn5tRIh1
モンスターヴェルトで検索するとモンスターヴェルト・オンラインで正式名称の模様。
モンスターヴェルトでも分かりますけど、一応オンラインまで入れて様子見るです。
ところで
「RO」や【RO】をラグナロクでヒットさせたいのです。RO使ってるの多くて何かいい方法、お願いしまふ。
81:名無し@お前ら落ち着け
09/04/06 16:21:08 Tn5tRIh1
/(?:(?:LINE|LINEAGE|リネ|リネージュ).{0,1}(?:2|2|Ⅱ))/i
リネ2だとこんな感じなのでしょうか?
先頭の(?:が被るとこが気になる。一応動いてます。
82:名無し@お前ら落ち着け
09/04/06 16:43:59 sPOESyJK
>>81
(?<![a-z])を前につけるとa-zが前にない場合にHit
(?![a-z])を後ろにつけるとa-zが後ろに続かない場合にHit
カナの場合は[a-z]→[ァ-ヶ]で
/(?:(?:(?<![a-z])LINE(?![a-z])|LINEAGE|(?<![ァ-ヶ])リネ(?![ァ-ヶ])|リネージュ).{0,3}(?:2|Ⅱ))/i
その他変更点
.{0,1}→.{0,3} リネージュ - 2)などのパターンも想定
(?:2|2|Ⅱ)→(?:2|Ⅱ) 2は全角英数字を半角にしてるはずと考えて省く
(あと、"|"が"|"になってましたw
>>80
えっと、できるだけHitさせたいパターンの例を挙げてもらえると助かるです
RO
「RO」
【RO】
ラグナロク
だけHitでいいのならこれでよさげ
/(?:(?<![a-z])RO(?![a-z])|ラグナロク)/i
後ろに2がつくとまずいなら内部の処理方法によって書き方も変わってくるです
・別のパターン(この場合"RO2")が先にHitしたらそこで終了
この場合先にRO2をHitさせればおk
・先にHitしたパターンがあっても他にもないか調べる
この場合正規表現で工夫する必要あり
83:名無し@お前ら落ち着け
09/04/06 20:01:06 4WBKWtc2
規制でカキコできなかったorz
>>82分は時間をかけて理解します。
勉強させていただいて感謝です><
そそ、LINE単語だとONLINE引っかかったw
84:名無し@お前ら落ち着け
09/04/07 09:27:21 TAnlJwRU
おはようございます。
リネ2の2がIIで昨日悩んでました。分かれば簡単なんですがねw
ROもリネ同様に2を先にヒットさせて抜けさせようと思っています。
他に方法思いつかなかった。。。
85:名無し@お前ら落ち着け
09/04/07 09:35:07 qeAPtJQP
後ろにコレつけたらいいかも
(?!.{0,3}(?:2|Ⅱ))
86:名無し@お前ら落ち着け
09/04/07 09:36:10 TAnlJwRU
パターンの例は私も抜けているのを確認してから、こいうのもあるんだぁ~という感じです。
ニュースサイト内でもDBを持つため、タイトルはほぼ固定できます。
あまりイレギュラーは想定しなくても大丈夫かと思いますよ。
87:名無し@お前ら落ち着け
09/04/07 18:10:11 TAnlJwRU
以前は3秒ちょっとの処理時間だったのが6秒を超えてるのがちょっと気になる。。。
鯖の負荷タイミングもあるだろうけど
88:名無し@お前ら落ち着け
09/04/07 23:00:22 V0IUHNwf
見習いさん復帰しないね・・・。
代打さんの負担も大きいと思うので、あまり無理しないで更新してくださぃorz
89:代打1号 ◆CoWqkZMvDY
09/04/08 00:26:36 XuI6N7oS
復帰出来ないのかな~?
自分はちょっと慣れてきたから大丈夫だよ、ありがとう
あと「バルビレッジ」の英語表記が未分類にあった~
『Barvillage』の優雅な朝「お気に入りモーニングカフェ」発売...
URLリンク(www.gpara.com)
90:名無し@お前ら落ち着け
09/04/08 09:06:36 YJtVV7rJ
バルビレッジ了解!対処しました。
「シール」・・・シールオンラインだった。
でも
/(?:(?<![ァ-ヶ])シール(?![ァ-ヶ])|(?<![a-z])SEAL(?![a-z]))/iでヒットしないですTT
91:名無し@お前ら落ち着け
09/04/08 09:29:00 hO5QtII/
>>90
誤Hit防止でシール直後にカタカナ・SEAL直後にアルファベットが来たらHitしないようになってるからかと
これで
/(?:(?<![ァ-ヶ])シール(?:オンライン)?(?![ァ-ヶ])|(?<![a-z])SEAL(?:ONLINE|OL)?(?![a-z]))/i
92:代打1号 ◆CoWqkZMvDY
09/04/08 10:40:09 8Bp7RE/n
>>90-91
ありが㌧
93:名無し@お前ら落ち着け
09/04/08 16:54:28 YJtVV7rJ
>>91
やぱしだめです。
【リリース】「シール」,「日本横断オフライン交流の旅」開催地が神戸に決定
これを引っ掛けたい。
>>92
代打さんもおつつ。
94:名無し@お前ら落ち着け
09/04/08 17:05:00 YJtVV7rJ
/'(?:(?<![ァ-ヶ])英雄(?:オンライン)?(?![ァ-ヶ]))'/i
これも英雄単体ではヒットしない模様ですTT
たぶん同じ理由だと思うけど・・・。ァ-ヶがEUCだと違う書き方とか?
95:名無し@お前ら落ち着け
09/04/08 17:59:47 hO5QtII/
>>94
前後の"'"はなんでしょか?
あと英雄の前後にカナ判定入れる意味がよくわかんない…
>>93のレスをReplaceStrToolでためしたところHitしたです
マルチバイト文字での範囲指定に対応してないのかも
>>67 で[サ-ソ]などでPerl互換・非互換両方ためしてみたところ動作がおかしかったです
mb_ereg使った方がいいんじゃないですかね?
96:代打1号 ◆CoWqkZMvDY
09/04/08 20:24:16 x0voZho2
おつです♪
カーディナルサーガのアップデート情報、
2つのサイトが未分類に放り込まれてた~
97:代打1号 ◆CoWqkZMvDY
09/04/08 20:28:15 x0voZho2
これも一部が未分類に・・・
「Alliance of Valiant Arms」で狙撃銃登場―「AVAれ祭(あばれまつり)2009」決勝戦会場決定
URLリンク(rss.rssad.jp)
98:名無し@お前ら落ち着け
09/04/09 00:26:59 RNqHsD8Y
>>95
( ゚Д゚)ゞ リョーカイ!!
'←これはキニシナイで><パターンを文字列配列にしてるとこそのままコピってしまった。
明日はずっと外勤なので検証できないかもですが
マルチバイト文字での範囲指定について調べてみる。
>>96
近いうちに対応するね。ご報告感謝です。
99:名無し@お前ら落ち着け
09/04/09 15:58:00 NIorKIu8
【パターン追加】
FLORENSIA
モンスターヴェルト
カーディナル・サーガ
AVA
Alliance of Valiant Arms
ガディウス
【マスター追加】
トランスピー
シールはこれから問題調査
100:名無し@お前ら落ち着け
09/04/09 16:13:06 NIorKIu8
衝撃の事実
preg系はマルチバイト対応できない。
URLリンク(q.hatena.ne.jp)
mb_eregが正解のようです。パターンも書き直しですねTT
101:代打1号 ◆CoWqkZMvDY
09/04/10 19:07:25 sjY1FMAn
分類お願いします
未分類↓
「Ace Online」大型アップデート実装!
URLリンク(japan.gamespot.com)
アラリオ、WIN「エースオンライン」大型アップデートで「アリーナシステム」などを実装
URLリンク(rss.rssad.jp)
サーバーを越えた戦いも実現。「エースオンライン」,アップデートでアリーナシステムなどを実装
URLリンク(www.4gamer.net)
102:代打1号 ◆CoWqkZMvDY
09/04/10 19:09:55 sjY1FMAn
これも何故か未分類ですた
【リリース】「AngelLove」新キャラに制服プレゼント。新入生応援キャンペーン
URLリンク(www.4gamer.net)
103:名無し@お前ら落ち着け
09/04/12 19:21:21 pyXDO1Rn
>>101-102
( ゚Д゚)ゞ リョーカイ!!
104:名無し@お前ら落ち着け
09/04/12 19:39:11 pyXDO1Rn
土曜日までの未分類チェックして振り分けました!
次回からはとりあえず同じパターンなら大丈夫。
正規表現のとこ変更しなきゃなのですが、コツコツやります(。。
105:名無し@お前ら落ち着け
09/04/12 19:50:13 OtZDkYgr
正規表現は前後の//iをはずしたらいいだけかな
英大小文字区別しないのはmb_eregiのようで
mb_eregi
URLリンク(manual.xwd.jp)
んで、半角カナと全角英数字の処理は今どうなってるですか?
勝手に半角カナ>全角カナ・全角英数字>半角英数字で正規表現書いてたけど無問題?
106:名無し@お前ら落ち着け
09/04/12 19:54:14 pyXDO1Rn
>>105
いい情報をありがとう!
パターンのほうの変更は少なそうね。
mb_eregiイイb
>半角カナと全角英数字の処理は今どうなってるですか?
ここは何も考えてなかったです。
>半角カナ>全角カナ・全角英数字>半角英数字
この処理をしてからDBに格納することにしますね。
本来正しい処理だと思う!
107:名無し@お前ら落ち着け
09/04/12 19:59:57 OtZDkYgr
あいあい、んじゃ今後もそのつもりで書くってことで
あと、正規表現を設定ファイルとして別ファイルにしてうpしてもらえたら
チェックとか修正とかやりやすいんで、出来ればそんな設計で~
108:名無し@お前ら落ち着け
09/04/13 01:02:03 r3zulawx
>>107
設計考えてみます~!
109:名無し@お前ら落ち着け
09/04/13 21:09:31 r3zulawx
半角カナと全角英数字とmb_eregiまで出来ました。
パターン追加と公開する部分は後日・・・。
【リリース】「ドルアーガの塔」ハンゲームでの新規登録者に「まごころシール」
がシールオンラインになっているので処理はできてると思います!
110:名無し@お前ら落ち着け
09/04/13 22:39:21 ZtAefs6/
はいです~
>>94の英雄オンラインは前後にカナ来てもHitさせたほうがいい気がするです
後ろに”オンライン”がつかない場合はない気がするのでこんなんどうでしょ?
英雄[ ・\-]+(?:オンライン|online|ol)
111:名無し@お前ら落ち着け
09/04/14 17:37:14 x88vXGAC
>>110
4gamerは「英雄」で出してくるんですOrz
URLリンク(www.mmo-news.net)
112:名無し@お前ら落ち着け
09/04/15 13:27:56 DPY1lDq+
忙しくてちょっとずつしか進まない;;
113:名無し@お前ら落ち着け
09/04/16 15:40:33 eK7r1/gU
ネトゲ速報にあげようと思ったが情報量多すぎて
私には無理だった。。。
少し時間できたので前回の続き頑張り中。
114:名無し@お前ら落ち着け
09/04/16 16:30:38 eK7r1/gU
登録パターンのチェックページできたお!
URLリンク(www.mmo-news.net)
115:名無し@お前ら落ち着け
09/04/16 16:41:50 ckseHxyy
fmfm…あれ?これとか変ですぜ…
'(?:(?'(?:(?'(?:SILKROAD|シルクロード)'
ついでに
'(?:(?:GETAMPED|ゲットアンプド).{0,1}(?:[R|R|X|X]))'
↓
'(?:(?:GETAMPED|ゲットアンプド).{0,1}(?:[R|X]))'
'(?:ALTEIL|アルテイル).{0,1}(2|2|Ⅱ)'
↓
'(?:ALTEIL|アルテイル).{0,1}(2|Ⅱ)'
ALTEIL.NETはアルテイルとは別だったっけ?近くにあったほうがいいとおも
これもなんか変
'(?:(?'(?:RAGNAROK|(?'(?:GUILD.{0,1}WARS|ギルドウォーズ)'
116:名無し@お前ら落ち着け
09/04/16 16:43:44 ckseHxyy
>>115
ミス
'(?:(?:GETAMPED|ゲットアンプド).{0,1}(?:[R|R|X|X]))'
↓
'(?:(?:GETAMPED|ゲットアンプド).{0,1}[RX])'
'(?:ALTEIL|アルテイル).{0,1}(2|2|Ⅱ)'
↓
'(?:ALTEIL|アルテイル).{0,1}[2Ⅱ]'
[]は中のどれか1文字にHit・|で区切る意味はないですよん
117:名無し@お前ら落ち着け
09/04/16 16:50:29 eK7r1/gU
>半角カナ>全角カナ・全角英数字>半角英数字
この処理以前のパターンが残っていたね。
シルクのとこはその前にC21とA3の記述が消えてる;;もかい見直す~。
アルテイルネットは今日追加した!
アルテイルはカードゲームで
アルテイルネットはカードゲームコミュニティサイトのこと、色んなカードゲームがあるです。
118:名無し@お前ら落ち着け
09/04/16 17:00:03 eK7r1/gU
対応とれました < を <で表示させた。
アルテイル&ゲットアンプドも済!
119:名無し@お前ら落ち着け
09/04/16 17:27:56 ckseHxyy
うい、視認性考えるとアルテイル3種は近くにあったほうがよかです
あとコレ
'(?:(?<![a-z])SUN(?![a-z])|S.U.N|SOUL.{0,1}OF.{0,1}THE.{0,1}ULTIMATE.{0,1}NATION)'
↓
'(?:(?<![a-z])S\.?U\.?N\.?(?![a-z])|SOUL.?OF.?THE.?ULTIMATE.?NATION)'
・S.U.NをSUNに含めた
・{0,1}→?(MOE・FEZ他も同様にいけるかと)
それと、できれば形式はこうしたほうがあとあと見やすいはず
共通タイトル[Tab]正規表現/キーワード
120:名無し@お前ら落ち着け
09/04/16 20:34:12 dul9Tk9C
カキコみすぎて制限だった。
.{0,1}→.?の対応まで出来た。
タイトル出すのはDB参照しなきゃいけないんだ・・・。
ちょっと時間あれば出来そう。
121:名無し@お前ら落ち着け
09/04/16 20:58:22 ckseHxyy
S\.?U\.?N\.?でSUNとS.U.NにHitするですよ~
同様にAVAとかも省略できるかと
'(?:(?<![a-z])AVA(?![a-z])|(?<![a-z])A.V.A(?![a-z])|ALLIANCE.?OF.?VALIANTARMS)'
↓
'(?:(?<![a-z])A\.?V\.?A\.?(?![a-z])|ALLIANCE.?OF.?VALIANTARMS)'
他、単体のは(?:)不要かと
'(?:ZERA)'
↓
'ZERA'
他にもいろいろ…テキストファイルうpしたほうがいいのかな
122:名無し@お前ら落ち着け
09/04/16 21:26:15 dul9Tk9C
気が付いたのあったら教えてほしいです~。
(?:は付けるものだと思ってたw
了解です。
123:名無し@お前ら落ち着け
09/04/16 21:34:38 dul9Tk9C
正規表現楽しくなってきた(。。
124:名無し@お前ら落ち着け
09/04/16 21:40:09 ckseHxyy
パズル感覚だしw
125:名無し@お前ら落ち着け
09/04/16 21:46:40 ckseHxyy
あと、全体も(?:)でくくる必要ないでする
'(?:PRIUS.?ONLINE|プリウスオンライン)'
↓
'PRIUS.?ONLINE|プリウスオンライン'
126:名無し@お前ら落ち着け
09/04/16 21:51:50 ckseHxyy
'(?:(?<![a-z])EQ(?![a-z])|EVERQUEST)'
キーワード'EQ2'
↓
'(?:(?<![a-z])EQ(?![a-z])|EVERQUEST)[2Ⅱ]'
'(?:(?<![a-z])EQ(?![a-z])|EVERQUEST)'
つーか、キーワードは全部正規表現のとこに入れてもいいんじゃ?
FEZ・DDOとかダブってるし他にもありそう
127:名無し@お前ら落ち着け
09/04/17 00:20:32 ThAMlzyC
元々、キーワードだけだったの、
それを正規表現に移行中なんだけど時間とれたときに少しずつやったり
悩んだりしてたです。
時間さえあれば><
仕事の合間と帰宅後R2までの間に進めてる感じ(==
一覧で表示するまではダブりとか自分でも気づいてなかったのだ。
128:名無し@お前ら落ち着け
09/04/17 00:58:00 zSoqZGm/
キーワードの形式のまま正規のとこに移行したらいいだけのような
まだコード埋め込みのままで設定ファイル化してないならそっち優先デスガ
129:名無し@お前ら落ち着け
09/04/17 11:27:57 T1Mc3rZ5
正規化も進んでるけど、取り込み前の絞込みを強化(これも簡単な正規表現)した。
家庭用ゲーム機はヒットしなくなったので、だいぶ作業しやすくなったはず・・・。
あとはBASARAを除外してやればw
130:名無し@お前ら落ち着け
09/04/17 11:29:58 T1Mc3rZ5
マッチングの正規パターンは外部ファイル化してあって
配列でパターン→コードの形式。
ただワードマッチングのとき""でくくっていたのを''に置き換えつつ
同じコードの見つけて、1行で表現するよう移行してるです。
131:名無し@お前ら落ち着け
09/04/21 11:06:06 hbuzwxVC
自分用メモ
オンラインゲームニュースまとめ読み
URLリンク(www.mmo-news.net)
正規表現&キーワード 確認画面
URLリンク(www.mmo-news.net)
132:名無し@お前ら落ち着け
09/04/21 17:36:37 xyI4NIE/
タイトルまでもうちょとなんだけど
現在外勤(といっても田んぼの横とかw)続きの状況でつ。
133:名無し@お前ら落ち着け
09/04/22 15:12:26 73g0C1Rj
タイトル表示できた。
先週からのマッチング漏れチェック中。
134:名無し@お前ら落ち着け
09/04/22 15:22:54 zqZ+EOlm
乙ですです
タイトルと正規表現間はTab区切りのほうがなにかと便利かと
135:名無し@お前ら落ち着け
09/04/22 15:42:27 73g0C1Rj
Tab入れてるんだけどブラウザ表示できてないぽい。
ので前回同様の感じで表示しましたよ!
136:名無し@お前ら落ち着け
09/04/22 16:09:10 zqZ+EOlm
ほいー
C21とかの前後にある[a-z]は[0-9a-z]にしたほうがいいかも
あとは微調整ですかね~
137:名無し@お前ら落ち着け
09/04/24 11:50:42 VJheNVZH
今週分見直した~。
138:名無し@お前ら落ち着け
09/05/11 15:43:21 AXvsEVUI
デザイン綺麗にしたいTT
139:名無し@お前ら落ち着け
09/05/19 17:55:30 p3XhYmCE
トップだけちょっと綺麗になった。
でも記事上げてくれる人いない・・・。