2024年 4月 27日 (土)

「非公開」でも「拒否設定」しないと グーグル・ロボットで「情報流出」

全国の工務店を掲載し、最も多くの地域密着型工務店を紹介しています

「そのサーバーの存在を隠しておくことはほぼ不可能です」

   グーグルでは、「グーグルボット(Googlebot)」と呼ばれるロボットがウェブ上を巡回しており、ロボットが「探検した成果」が、検索対象としてデータベースに反映される仕組みだ。しかも、「私のサイトは、どこからもリンクをされていないから見つからない」という訳にはいかないようなのだ。

   グーグルが提供しているウェブサイト管理者向けの文書には「Googlebot が 『非公開』のウェブサーバーから情報をダウンロードするのはなぜですか」という質問項目があり、その答えでは

「ウェブサーバーへのリンクを公開しなくても、そのサーバーの存在を隠しておくことはほぼ不可能です」

と断言している。
   グーグルボットから逃れるためには、明示的に巡回を拒否するという設定が必要だ。今回の流出事件は、ID・パスワードをかけていなかったのはもちろん、この設定を怠っていたことが原因だとも言えそうだ。

1 2
姉妹サイト
追悼
J-CASTニュースをフォローして
最新情報をチェック
電子書籍 フジ三太郎とサトウサンペイ 好評発売中