07/10/23 02:22:15 0
(>>1のつづき)
検索に詳しいある技術者も「クローリングが遅いせい」という見方に対して懐疑的だ。「Yahoo!JAPANや
Googleの能力から考えると、インデックスのデータが古いというのはちょっとありえないのでは」と彼は言う。
クローリングの問題ではないとすれば例えば、「初音ミク」というキーワードが、検索が難しい特殊な単語
だったという可能性はあるだろうか。前出の技術者はこの見方も否定する。「『初音ミク』という言葉に検索
特性として特殊なことは一切ないし、あったとしても、『画像検索以外ではヒットしている』という事実の説明が
付かない。何らかの恣意的な操作が働いていることは間違いないのでは」
この技術者は「あくまで憶測だが」と断った上でこんな可能性を示唆する。
「画像検索用のNGワードフィルタに、何らかの事情で『初音ミク』というキーワードが入ったのでは。
フィルタが存在するというのは周知の事実で、Yahoo! JAPANとGoogleが、同じ会社が提供するデータを
部分的にでも使ってフィルタを構成しているならば、両者が同期しているというのも不思議ではない」
もしそれが真相だとして、なぜNGワードに初音ミクが入ったかはやはり不明だ。「担当者の入力ミスかも
しれないし、突発的理由で入ったり外れたりするようなアルゴリズムなのかもしれないが……」。彼の指摘も
あくまで憶測の範囲を出ず、真相は不明だ。
適切な検索結果が表示されるgooの画像検索について、運営元のNTTレゾナントは「画像検索はNTT
研究所の独自技術を採用している。『初音ミク』に関しては、検索結果に手を加えておらず、そのまま
結果が表示されている」と説明する。
ライブドアの場合は、ブログを中心に検索する仕組みを採用しているといい、「初音ミク」の画像検索
結果は現在、前日までの画像がインデックスに反映されている状態だという。(>>3-10につづく)