「はてなブログで書いているんだけど、サイトマップが読み込んでくれない。なんか理由があるのかな。対処法とかあったら教えてほしいなあ。」
こんなお悩みにお答えします。
この記事でわかること
- はてなブログのサイトマップ読み込んでくれない事件が多い
- はてなブログのサイトマップが読み込まれない理由
- はてなブログの送信すべきサイトマップの種類
- サイトマップ送信が失敗したときの対処法
記事の信頼性
こんにちわ、Jouji(@jouji0720)です。現在僕はwebライター4年目で、専業ライターとして、記事を書いて生活をしています。
そんな僕もはてなブログで記事を書いていて、サイトマップを読み込んでくれなくて、もやもやしました。
今回は、はてなブログのサイトマップを読み込まない理由をご紹介していきます。この記事を読めば、はてなブログのサイトマップを読み込みがうまくいかない理由と送信する種類や対処法まで網羅的に学ぶことができます。ぜひ最後までお読みくださいね。
はてなブログのサイトマップが読み込まれないが頻発!!
はてなブログでは、サイトマップを送信しても読み込まれていない事件が頻発しているようです。
調べてみると、どうやらはてなブログと、Google先生の相性が、よくないようです。僕自身もこの間まで、サイトマップを読み込んでもらえなくて、困っていました。
そこで、はてなブログのお問い合わせから連絡をしてみました。すると以下のような回答をいただきました。
はてなサポート窓口の〇〇と申します。
はてなをご利用いただきありがとうございます。ご利用のはてなブログが検索結果に反映されない件につきまして、
「URL のインデックス登録リクエスト」を行われていない場合にはお試しください。 リクエスト後、一定期間おいていただいても、
インデックス登録がされない場合には、「インデックス未登録の理由」等の記載があるかと存じますので、
そちらの内容をご確認の上、対応をご検討いただけますようお願いいたします。 ▽URL 検査ツール(Google Search Consoleヘルプ)
https://support.google.com/webmasters/answer/9012289?hl= ja
※上記ヘルプ内の「Google での登録状況」をご参考にインデックスの状況をご確認くださいなお、
Google検索につきましては弊社が提供しているサービスでは ございませんので、詳細につきましては回答を行うことができません。 ご了承ください。 もし、「URL のインデックス登録リクエスト」
を行ってから間隔があいてしまっている場合や、 まだ行われていない場合には、
再クロールのために、インデックス登録のリクエストを再度お試しいただけましたら幸い です。 どうぞ、よろしくお願いいたします。
要約すると、「ブログのサイトマップが読み込まれない理由は弊社ではわかりません。気になる場合は、Google先生に問い合わせてくださいね」とのことでした。
サイトマップの役割
サイトマップの役割は、サイトにどんな記事があるのかを示す地図のようなものです。というのもサイトを作ったばかりの時には、どんな記事があるかがわからないからです。
マップがあれば、あらかじめどんな記事があるのかをクローラーが把握でき、サイトにあるすべての記事を回ることができます。
また、サイトマップがあることでクローラーが、迷子になることを防いで、効率的に巡回できることができます。
サイトマップが読み込まれないと起こる問題
サイトマップが読み込まれないと起こる弊害は、次のことが起こります。
- Googleの巡回時に、クローラーが迷ってしまい、ブログ優先順位が下がる
- 記事がインデックスされにくくなるために、検索結果にも載りにくくなる
- 検索に上がらないので、情報を提供できず、検索者に不便が生じる
- 時間が勝負のジャンルを選定しているときには、問題が起こる
この状況は、あなたにとっても、検索者側にとってもデメリットしかありません。
はてなブログのサイトマップを読み込んでくれない理由
はてなブログのサイトマップを読み込んでくれない理由は、次のものがあります。
- はてなブログが作成するサイトマップの構造上の理由
- 送るサイトマップを間違っていた
- サイトマップ送信の自動化ができないこと
それぞれ、解説します。
はてなブログが作成するサイトマップの構造上の理由
はてなブログのサイトマップが読み込まれない理由の1つ目は、サイトマップの構造上の理由です。
サイトマップの構造
はてなブログのサイトマップの構造は、次のようになっています。
- はてなブログのサイトマップは、親階層と子階層の2階層構造になっている
- 親階層では、子階層へ続くリンクが貼られていて、月別ぺージの最終更新日時が書いてある
- 子階層は、月毎に公開した各記事ページがかいてあり、最終更新日時が書いてある
図解にすると、次のような感じです。
とはいえ、これは構造上の話で、はてなブログ運営側にしか改善できないため、どうしようもありません。はてなブログがサイトマップの構造を見直して、うまく読み込まれるようにしないと、無理ゲー感があります。
問題点は、最終更新日時が同じになっていること
サイトマップを見ると、最終更新日時が問題点だろうと考えました。というのも、通常は記事を書いて公開されるとそのタイミングで、公開された記事のURLと後悔した日時がサイトマップに記載されます
しかしはてなブログの場合には、今までの書いた記事の最終更新日時が新しく公開した記事と同じ日時になってしまいます。
イメージは、次の通りです。
<url> <loc>https://joujilog.com/new-exampleA <lastmod>2021-13T00:24:31+9:00</lastmod> </url> <url> <loc>https://joujilog.com/old-exampleB <lastmod>2021-13T00:24:31+9:00</lastmod> </url>
新記事Aを更新すると、サイトマップに更新していない記事Bの最終更新日時までも一緒に変わってしまいます。
記事の公開日は、すべて違うものです。すべての記事の更新日時が、同じ日時になることなんてあり得ません。
Google先生は、更新した記事URLだけをクロールしたいです。
でも上記の構造だと、すべての記事が更新したことになってしまうので、すべてをクロールしないといけないことになります。
つまり、クローラビリティという観点から見たときに、すべてのページを見ないといけないために、あまりよくない構造です。
そうなると「忙しいから、このブログは後回しにした方がいいや」という事になり、後回しにされ、クローリングの頻度が下がっていました。
最終日時の問題は解決している
とはいえ現在は、最終日時の問題は解決されているようです。
2020年の5月時点でサイトマップの形式が変わり、改善されています。
ブログを更新するとサイトマップが変更されて、Google先生側からサイトマップを読みに来てくれるようになりました。
現在は、サイトマップの構造的には問題なくなっています。
サイトマップの送信が自動化できないこと
はてなブログのサイトマップが読み込まれない理由の2つ目は、サイトマップの送信が自動化できないことです。理由は、プラグインが入れられないからです。
WordPressなどのCMSについては、サイトマップのプラグインがあるため自動化ができるのですが、はてなブログに関しては構造上プラグインが入れられません。
そのためにはてなブログのサイトマップは、読み込んでくれるかどうかはクローラー頼みとなります。
はてなブログは記事を更新時には、サイトマップは更新されますが、見に来てくれるかどうかはわかりません。そのために来ないので、読み込まれないという状態が発生しています。
サイトマップが読み込まれなくてもインデックス登録をされる
サイトマップが読み込まれなくても、インデックス登録されます。というのも、クローラーがURLを発見して記事がインデックスする方法は、サイトマップからだけではないからです。
クローラーが記事を読み込む方法は2つあり、次の通りです。
- サイトマップ
- リンク
サイトマップはサイトマップに載っている記事リンクから記事を見にくる方法です。リンクは、記事に貼ってある内部リンクや外部リンクから、記事を読み込む方法です。
一覧ページというのは、記事ページにリンクしている、すべてのページにアクセスするように設計されています。
そのためにサイトマップがなくても、Google先生に認識してもらえる構造になっています。そのために時間がたてば、どの記事もインデックスされるというお話です。
とはいえ早く認識してくれないと情報鮮度の問題が…
とはいえ、速く認識してくれない、記事の情報鮮度が悪くなってしまう可能性もあります。
Google先生が来た時に、どんな記事を掲載しているサイトかを一見しただけではわからなくては、時間がかかりますし、後回しにされます。
そのためにインデックスされるのも遅くなるのでサイトマップは送信しておいて損はないです。
はてなブログの送信すべきサイトマップの種類
はてなブログの送るべきサイトマップの種類は、迷ってしまうのではないでしょうか。というのもはてなブログのサイトマップは、種類があるからです。
送るべきサイトマップは、sitemap_index.xml
結論から言うと、送るべきサイトマップは、sitemap_index.xml
です。今までネット上には、サイトマップは、以下のものがありすべて送っていたのではないでしょうか。
- sitemap.xml
- sitemap_index.xml
- sitemap_periodical.xml?year=20xx&month=xx
robots.txtにて読み込まれているサイトマップの確認
上記のサイトマップから読み込んでいるのは、いったい何なのでしょうか。
そもそも間違ったサイトマップを送っていたのでは意味がないですよね。
robots.txtにて、読み込まれているサイトマップを確認しましょう。
サイトURLの後ろに、/robots.txtと入力して、確認がしてみましょう。すると、sitemap_index.xmlが、正しいことがわかりますね。
ですから、送信するサイトマップはsitemap_index.xmlにしましょう。
サイトマップのfeedも一緒に送信しよう
サイトマップと一緒にfeedも送信しましょう。というのもGoogle先生が推奨しているからです。
Google先生は、ウェブマスター向け公式ブログの中で、次のように言ってます。
- 「Google では、最適なクロールを行うために、XML サイトマップと RSS/Atom フィードの両方を使用することをおすすめしています。」
- 「RSS/Atom フィードによって、サイト内のすべての更新情報を取得することができるからです。」
- 「正規 URL であること。内容の重複した複数のページの URL が指定されていることがありますが、これは間違った指定方法です。そのままでは、インデックスが改善されない一方で、あなたのサーバーの負荷が増大してしまいます。」
(引用元:Google ウェブマスター向け公式ブログ [JA] : XML サイトマップと RSS/Atom フィードのベ ストプラクティス)
そのために、feedも一緒に送信しておいたほうがいいです。
定期的にサーチコンソールを確認しよう。
定期的にサーチコンソールを確認しましょう。というのも状況を知らないと、対策の打ちようがないからです。
僕はこのブログは3年たった今、ようやくエラーがなくなりましたが、”読み込みできませんでした”が多かった時期が、長かったです。
毎日のようにサーチコンソールを確認していました。確認しておきましょう。
サイトマップ送信が失敗したときの対処法
とはいえ、ここまでやってもうまくいかないときもあります。そんなときの対処法は次のものがあります。
- URL検査からインデックス登録の申請を行う
- 時間を置いて確認する
- それでもダメな時はサイトマップ上にある記事の更新を行う
それぞれ解説します。
記事ごとにインデックス登録申請を行う
サイトマップ送信が失敗したときの対処法の1つ目は、記事ごとにインデックス登録申請を行うことです。この方法は、投稿したページのみをインデックス登録の申請する方法です。
記事投稿するたびにサイトマップの送信をするのもいいんですが、そのたびにデータ量が多くなってしまいます。クローラーは、更新したページのみを確認したいので、この方法がおすすめです。申請のやり方は、次の通りです。
- 更新したページを表示して、URLをコピーする
- サーチコンソールにログインして、一番上の「https://●●●.com/のすべてのURLを検査」に先ほどコピーしたURLを貼り付ける
- インデックス登録をリクエストする
※とはいえ、あくまでインデックス登録のリクエストの受付が完了しているだけなので、確実性はありません。できていることを前提にせずに、確認を行っていきましょう。
時間を置いて確認する
サイトマップ送信が失敗したときの対処法の2つ目は、時間をおいて確認することです。
というのも、時間が解決することもあるからです。
僕のブログでは記事を書いてから、3か月後にやっとインデックスされたという記事もあったりします。
記事を書いたらすぐにインデックスしてほしい気持ちはよくわかりますが、時間をおいてみるのも悪くないです。待ってみましょう。
サイトマップ上にある記事の更新を行う
サイトマップ送信が失敗したときの対処法の3つ目は、サイトマップ上にある記事の更新を行うことです。というのも、サイトマップに載っている記事の内容に問題があると、クローリングの頻度が下がるからです。
URL検査からインデックス登録を申請して、ある程度時間がたっているのに、それでも認証されないということは、記事がGoogle先生にとってクロールするべき記事ではないと認識されている可能性が高いです。
そのためにリライトをしてもう一度、インデックス登録の申請を行うようにしましょう。リライトの方法に関しては、ブログ記事のリライトの仕方【できないと稼げないので注意】にて詳しく解説しているので、ぜひご覧くださいね。
まとめ|サイトマップの読み込まない理由を知って対策を
ここまでサイトマップを読み込まない理由から対策、読み込む種類などをお話してきました。
サイトマップを読み込んでくれないと、インデックスされるまでに時間がかかります。そのために鮮度がどんどん落ちていき、読者にも悪い影響があります。定期的に確認して、サイトマップを読み込みをするように努力が必要です。
そのためにも、サーチコンソールを確認する癖を、つけておきましょう。もし送信していないなら、アフィリエイトの強い味方、サーチコンソールの使い方を解説をご参考の上すぐに送信しましょう。
今回は以上です。
次に読むのにおすすめの記事
ブログのリライト方法を知りたいなら、
低品質な記事の見つけ方を知りたいなら、
記事の書き方を知りたいなら
はてなブログの記事の書き方を知りたいなら
ブログ収益化を本で勉強したいなら