「非公開」でも「拒否設定」しないと グーグル・ロボットで「情報流出」

印刷

   Winnyなどでの情報流出が相次ぐなか、今度は検索エンジン経由の情報流出が発覚した。サーバーにアップロードしていた資料が、検索エンジンの「ロボット」に引っかかるようになっていた。ロボットから逃れるには、明示的に巡回を拒否するという設定が必要だ。

作業ミスで外部からアクセスできる状態に

検索エンジン経由で情報が流出した
検索エンジン経由で情報が流出した

   流出したのは、NHKの子会社「NHKエンタープライズ(NEP)」が文化庁から企画運営を委託されているイベント「国際文化フォーラム」に関連する資料だ。同イベントは奈良市で2007年11月10日に開幕。開会式には秋篠宮ご夫妻もご出席なさったが、流出した資料には、ご夫妻の日程や宿泊先、会場の見取り図も含まれていた。

   文化庁が11月12日、グーグルで資料の内容が検索できることをNEPに指摘して問題が発覚した。

   NEPが調査したところ、問題のデータは、同社の契約スタッフが試用していたサーバーに保存されていたもので、元々はIDとパスワードがないとアクセスできない設定になっていた。しかし、作業ミスで外部からアクセスできる状態になっていたため、グーグルで検索可能になっていた模様だ。

   指摘を受けたNEPは、直後にサーバーからデータを削除、グーグルにも検索結果に反映されないように依頼し、11月14日に対応が完了したという。問題となったデータがサーバーにアップロードされたのは11月5日なので、10日近くにわたって、データが一般にさらされていたことになる。

「そのサーバーの存在を隠しておくことはほぼ不可能です」

   グーグルでは、「グーグルボット(Googlebot)」と呼ばれるロボットがウェブ上を巡回しており、ロボットが「探検した成果」が、検索対象としてデータベースに反映される仕組みだ。しかも、「私のサイトは、どこからもリンクをされていないから見つからない」という訳にはいかないようなのだ。

   グーグルが提供しているウェブサイト管理者向けの文書には「Googlebot が 『非公開』のウェブサーバーから情報をダウンロードするのはなぜですか」という質問項目があり、その答えでは

「ウェブサーバーへのリンクを公開しなくても、そのサーバーの存在を隠しておくことはほぼ不可能です」

と断言している。
   グーグルボットから逃れるためには、明示的に巡回を拒否するという設定が必要だ。今回の流出事件は、ID・パスワードをかけていなかったのはもちろん、この設定を怠っていたことが原因だとも言えそうだ。

インヴァスト証券

   FX投資家の中には、専門家顔負けの熱心な投資家がいる。おそらくはそんな人が「勝ち組」なのかもしれないが、少なくとも初心者が「儲かった」という話はあまり聞かない。FX投資歴5年のサラリーマン・高山俊之さん(仮名)もそんな一人だ。続きを読む

PR 2016/11/17

役立つねっと

   社内研修や業務サポートをもっと手軽で簡単に。オール優を導入すると ビジネスが変わります・・・ 続きを読む

PR 2016/11/30

  • コメント・口コミ
  • Facebook
  • twitter
コメント・口コミを投稿する
コメント・口コミを入力
ハンドルネーム
コメント・口コミ
   

※誹謗中傷や差別的発言、不愉快にさせるようなコメント・口コミは掲載しない場合があります。
コメント・口コミの掲載基準については、コメント・口コミに関する諸注意をご一読ください。

注目情報

生き残るために「仕事くれ!」次はあなたの会社へGO!

カス丸「クビ」の崖っぷち!?

向田邦子、阿久悠、秋元康の作品から、現代の女性像を紐解く。

「女性と文化」WEB公開講座
追悼
電子書籍 フジ三太郎とサトウサンペイ 好評発売中