こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

締切り済みの質問

グーグルの検索エンジンについて

グーグルの検索エンジンについて質問があります。
このエンジンはロボットがクロールする際、あらゆるURLにGETリクエストをおこない
膨大なHTMLのキャッシュをかき集めていくと思いますが、
その際、ロボットはリクエストを投げてHTTPレスポンスを受け取るのだとおもいますが
質問1.
このときレスポンスコードが200,300,400,500系それぞれ問わずキャッシュを行っている
のでしょうか?一般的にドメインの永久転居の場合301ヘッダーを返すため、300系はキャッシュするのだろうなと想像できます、が400系500系もキャッシュしているのでしょうか?

質問2.
また、レスポンス200を受け取り、さあHTTPリクエストのボディ部分・・つまり肝心の
HTMLデータを取得する際、完全にHTMLノ読み込みが完了するまでそのURLに滞在しているのでしょうか?
言い換えると,ロボットはかならずJavaScriptの【onload】イベントが発生後の
コンテンツをキャッシュしているのでしょうか?
上記2点について、検索エンジンにお詳しいかたご教授ください。
よろしくお願いします。

投稿日時 - 2013-07-07 22:07:31

QNo.8166836

すぐに回答ほしいです

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(1)

Googleの検索エンジンについては、公開されていない情報が多く、推測しかできませんが

前何処かで聞いた話ですと、「有名なPageRankの他に数百種類のアルゴリズムを組み合わせてユーザーに最適な検索結果を届けている」そうですので、そのくらいはやっていそうです。

投稿日時 - 2013-07-07 23:12:07

あなたにオススメの質問