hns - 日記自動生成システム - Version 2.19.7

void GraphicWizardsLair( void ); //

otsune GWL
FreeBSD, AfterEffects, RETAS, animo, DigitalAnime, Linux, Mac OS, Win2k

[Who is otsune?] [title] [message] [Policy] [注目エントリー] [top]
Twitter Status :


Namazu for hns による簡易全文検索
詳しくは 詳細指定/ヘルプを参照して下さい

検索式:

先月 2003年08月 来月
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31


2003年08月22日(金) [長年日記]

#3 [www][unix] ipfwとBINDによるNaverRobot対策フィルタ_

ishinao.net_ から。
韓国からのWeb閲覧を全てdenyするのは、仕事上の都合で出来ないなぁ。

3 悪意に対策すればするほど、事態がややこしくなる罠:

Internet-Html-Searcherのデジタルアーツ *1 みたいに「デジタルアーツのIPでdenyされたら、個人むけのBフレッツからuser-agent詐称でロボット回収するから良いよ」というエクストリームすぎる行動をとったりするし。
(そういえば二階堂.comとか論壇とか探偵ファイルとか、その他のブラックジャーナリズム系でデジタルアーツをネタにした情報ってみないよなぁ。ひろゆきとかも潜伏して活動しているから表立って情報がでないのだろうか)
user-agent詐称もreffer詐称も、かなり不自然なログが残るから。デジタルアーツのロボット設計者の技術レベルはたかが知れるけど。おそらく今まで使っていた既存のクローラーのソースコードに、ちょこちょこと詐称機能を2行ぐらい付け加えたレベル。
しかしだ。
もし白いハッカーが黒くなって、こういうDQNな会社に「一般人の閲覧と見分けがつかないようなパターンでアクセスをするクローラー」 *2 なんてコードを提供したら。
もう悪意も善意も区別する事は不可能になる。
こうなったら 「世界の調和が取れていたことなど今まで一度もあったはずがない」_ って状態になったということか。
*1: 最近では2ch.netの トップページに張ってある警告文_ にひろゆきから名指しで「データの勝手な2次利用をするな」と言われている会社。ネットのオープン思想にどれだけそっているかはおしてしるべし。
*2: 1秒間にページの全リンクをクリックする人間は居ない。だからアクセスパターンをデータベースにして、テキスト量に応じてディレイするようにキューに入れる。とか。
Permalink: http://www.otsune.com/diary/2003/08/22/3.html#200308223
trackback
このエントリーを含むはてなブックマーク del.icio.us livedoor Clip View blog reactions
Last Updated 2003-08-22 00:00:00 By otsune