Googleサーチコンソール:「ページのインデックス登録」に未登録URLが600も増えたので対応必須か調べてみた

ブログ運営

Googleサーチコンソールには、「ページのインデックス作成」という機能があって、インデックス済みのURLやされなかったURLを確認できます。

今回、クロール済みだがインデックス登録されなかったURLが600以上に増えていたことに気づき、何かしなければならないのか心配になり調べてみました。

結論、Google公式より、ブログ記事が500未満の場合、この機能は気にしなくてOKとのこと。

 

とはいえ、何百も灰色バーが増えていたら気になります。なので、簡単に確認するとしたら、インデックス登録されなかった記事がないかチェックしたらいいと思います。

確認方法は3ステップでできます。<こちらを参照(該当見出しに飛びます)

 

そもそも公式によるとサイトのページ数が 500 未満の場合、このレポートを使用する必要はおそらくありません」とのこと。なので、記事数が500未満の方は、このブログを読まなくて大丈夫です。

私は100記事ほどしかありませんが、気になったので一通り調べました。

興味ある方は続きをどうぞ↓

【結論】ブログ初心者が見るべきはここ!

Googleサーチコンソールでインデックス未登録のURLが増えたら、

結論、インデックス登録をリクエストした記事URLが「未登録」になっていないかだけ確認しましょう。

なぜなら、クロールされたけれどインデックス未登録の記事は、その内容が低品質だと見なされている可能性があるためです。リライトなど対策をとりたいですね。

 

確認方法は3ステップ。

① サチコを開く

未登録の理由は一旦無視

②画面上部のタブを「すべての送信済みページ」に切り替え

③「クロール済み- インデックス未登録」をチェック

もし記事URLがあればリライトするなど対応したい!

サチコの「ページのインデックス登録」は何をするページか?

Googleサーチコンソールの「ページのインデックス登録」ページは、Googleがブログサイトのページをインデックス登録しているかどうかを確認し、インデックス登録をリクエストするためのツールです。

このページでは、次の4つのことができます。

今回、取り上げるのは3点目。

  • インデックス登録状況を確認: 任意のURLを入力することで、そのページがGoogleにインデックス登録されているかどうかを確認できます。
  • インデックス登録をリクエスト: インデックス登録されていないページや、更新したページをGoogleにインデックス登録させるようリクエストできます。
  • インデックス登録のカバレッジレポート: インデックス登録されたページと、インデックス登録されていないページのリストを確認できます。
  • サイトマップの送信: サイトマップをGoogleに送信することで、Googleがあなたのウェブサイトの構造を理解しやすくすることができます。

そして、3つ目のカバレッジレポートは、サイト運営者が対応しなければならないURLがあるのか調べられます。

【誤解】灰色バー「クロール済み – インデックス未登録」とはどういう状態か?

カバレッジレポートにある「クロール済み – インデックス未登録」という灰色バー。

これは、GoogleがブログサイトのURLをクロール済みだが、現時点ではそのページを検索インデックスに登録していないことを意味します。

登録されなかったということは低品質なページが増えている、つまり、ネガティブな指標なのかと思いきや、全く違いました!

未登録のURLを確認すると、サイト運営者が意図してインデックス登録していないページがほとんど。

Google公式でも以下の通りに書かれています。

グレー(未登録)の URL がインデックスに登録されていない理由は正当なものか?

URLが正当な理由(想定内のサイトの robots.txt ルール、ページの noindex タグ、重複した URL、削除したが代わりがないページの 404 など)でインデックスに登録されないのは問題ありません。

Google search console「ページ インデックス登録レポート

私の観光ブログでは、

  • 3URLは、低品質などの理由からインデックス登録されなかったらしいブログ記事のリンク
  • 一方、残り669URLは、インデックス未登録のままで問題ないリンクでした。

【体験談】クロール済みだがインデックスが「未登録」の672リンクを調べてみた!

「ページがインデックスに登録されなかった理由」を1つずつ見ていきます。

私のブログでは理由は6つ↓

対応しなければならいことがないか調べていきます!

理由ソース確認ページ
noindex タグによって除外されましたウェブサイト開始前280
代替ページ(適切な canonical タグあり)ウェブサイト開始前130
ページにリダイレクトがありますウェブサイト開始前93
見つかりませんでした(404)ウェブサイト開始前63
重複しています。ユーザーにより、正規ページとして選択されていませんウェブサイト開始前1
クロール済み – インデックス未登録Google システム開始前105
Googleサーチコンソール「ページがインデックスに登録されなかった理由」取得日 2024/5/16

noindex タグによって除外されました

「noindex タグによって除外されました」に分類されるURLは、Google の検索結果に表示されないように設定されたページです。具体的には、以下のような種類があります。

  • 重複コンテンツ: 他のページと内容がほぼ同じであるページ
  • 低品質なコンテンツ: ユーザーにとって有益ではない、または読み込みにくいコンテンツを含むページ
  • ログインページ: ユーザー認証が必要なページ
  • マイページ: 個人の情報を含むページ
  • テストページ: 公開されていないページ
  • フィード: RSS や Atom などのフィード
  • 画像: 画像ファイル単独のページ
  • スタイルシート: CSS ファイルなどのスタイルシート
  • JavaScript: JavaScript ファイル

 

私のブログでは280件(URL)もありました。

「エクスポート」からデータをダウンロードして見てみたら、URLはRSS(文末がfeed/やatom/)や、タグやカレンダーのページでした。

つまり、意図された未登録URL。

結論、インデックス未登録のままでOKでした

 

ダウンロードデータを、ブログドメインの部分だけ変えていくつか載せておきます。

https://12345.com/coffee-roasting-airfryer/feed/
https://12345.com/ana-celebrates-25-years-of-service-to-hawaii/feed/
https://12345.com/review-the-jojolands/feed/atom/
RSSやAtomなどのフィード
https://12345.com/2023/07/
https://12345.com/2023/08/
https://12345.com/2024/03/18/
https://12345.com/2023/11/16/
https://12345.com/tag/cafe/
カレンダーやタグ

代替ページ(適切な canonical タグあり)

「代替ページ(適切な canonical タグあり)」に分類されるURLは、別のURLが正規URLとして選択され、検索結果に表示されるページです。具体的には、以下のような種類があります。

  • 正規URLと重複する内容を持つページ: 同じ内容を持つページが複数存在する場合、そのうちの1つが正規URLとして選択され、他のページは「代替ページ(適切な canonical タグあり)」に分類されます。
  • パラメータ付きURL: クエリパラメータ(?utm_source=rss&utm_medium=rss&utm… など)を含むURLは、正規URLと重複する内容を持つページとみなされる場合があり、「代替ページ(適切な canonical タグあり)」に分類されます。

 

私のブログでは130件ありました。

すべてのURLのパラメータを確認した結果、パラメータ付きURLでした。

結論、インデックス未登録のままで問題ありませんでした。

以下、内訳。

件数パラメータ説明URLに含まれるパラメータ
117?utm_source=rss: ユーザーがどの広告やキャンペーンから流入したのかを特定するために使用されます。rssは、RSSフィードからの流入を示します。
&utm_medium=rss: ユーザーがどの媒体を使用して流入したのかを特定するために使用されます。rssは、RSSリーダーを使用して流入したことを示します。
&utm_campaign=recommended-ebook: ユーザーがどのキャンペーンから流入したのかを特定するために使用されます。recommended-ebookは、「recommended-ebook」というキャンペーンから流入したことを示します。
?utm_source=rss&utm_medium=rss&utm_campaign=
12カテゴリーを指定するために使用されます。cat=0は、カテゴリーID 0のページであることを示します。?cat=0
1Accelerated Mobile Pages (AMP) サービスのパラメータです。AMPは、モバイル端末でのウェブページの読み込み速度を向上させるために開発された技術です。AMP対応ページへの直接アクセス時に自動的に付加されることが多いです。?amp=1

例えば、次のようなURLがありました。

https://12345.com/recommendation-food/?utm_source=rss&utm_medium=rss&utm_campaign=recommendation-food
https://12345.com/page/8/?cat=0
https://12345.com/customize-cocoon-prrules/?amp=1

ページにリダイレクトがあります

「ページにリダイレクトがあります」というメッセージは、インデックス登録が完了したページのうち、リダイレクト設定が施されているページに対して表示されます。

リダイレクトとは、あるURLから別のURLへ自動的に転送される仕組みです。さまざまな理由でリダイレクトが使用されます。

  • URLの変更: 古いURLから新しいURLへユーザーを誘導するために使用されます。
  • 古いコンテンツの削除: 古いコンテンツを削除した際に、そのコンテンツへのアクセスを別のページへ誘導するために使用されます。
  • 異なる言語のバージョンのページ: 異なる言語のバージョンのページを区別するために使用されます。
  • キャッシュの更新: コンテンツを更新した際に、古いキャッシュを削除するために使用されます。

 

私のブログでは75件ありました。

  • 57件は、カテゴリーとページ番号を指定するパラメータがついたURLで、インデックスに未登録で問題ありませんでした
  • 残り18件は、スラッシュ(/) なしの正規表現のURLでした。1つずつURLをクリックしてブラウザで開き、最終的に表示されるページを確認して、リダイレクトループなどの問題が起こっていないか確認しました。そして、ループなどの問題はなかったです。

結論、インデックス未登録のままで問題ありませんでした。

件数説明値の例
57カテゴリーとページ番号を指定するパラメータ?cat=0&paged=1
18スラッシュ(/) なしの正規表現のURLhttps://12345.com/costco-recommendation

例えば、以下のようなURLがありました。

https://12345.com/page/2/?cat=0&paged=1
https://12345.com/costco-recommendation

余談ですが、URL文末にスラッシュがない場合、SEOに悪影響を与えるか調べました。

結論、影響はないようです。詳しくは、以下をご覧ください。

見つかりませんでした(404)

公式サイトによると、ほとんどの404エラーは修正しなくても問題ないそうです。

なぜなら、「404 エラーはサイトのインデックス登録やランキングに影響を及ぼすことはないため」です。

また、404ページは1ヶ月ほどするとレポートに表示されなくなるそうです。公式より「ページが削除されており、代わりのページや同じようなページがない場合は、404 を返すようにしてください。1か月程すると、レポートにこの404 は表示されなくなります。」とのこと。

 

私のブログでは63件ありました。

ざっと確認したところ、削除したカテゴリーやタグ、そして非公開にした記事のURLでした。

結論、インデックス未登録のままで問題ありませんでした。

分類URL例内容
1https://12345.com/category/smalltalk/削除したカテゴリー
2https://12345.com/tag/wordpress/削除したタグ
3https://12345.com/wild-boar-spare-ribs/非公開にした記事

重複しています。ユーザーにより、正規ページとして選択されていません

「重複しています。ユーザーにより、正規ページとして選択されていません」は、他ページと重複していて、優先する正規ページが他にあるので、このページは検索結果に表示されないというURLです。

 

私のブログでは1件あり、feedのURLでした。

結論、インデックス未登録のままで問題ありませんでした。

クロール済み – インデックス未登録

「クロール済み – インデックス未登録」は、Googleにクロールされたけれどインデックス登録されなかったURLが表示されています。

 

私のブログでは105件が振り分けられていました。

そのうち、以下6つに分類できました。

結論、分類1の記事URLはリライトするなど対応したいです。

それ以外は、インデックス未登録のままでOK。

 

ただし、105件から記事URLだけ抽出するのはかなり苦労しました。。。

前述の方法を使えば、記事URLで、かつ、インデックス未登録のURLだけ抽出できるので便利です。

分類URL例どのURLかサイト運営者の判断
1https://12345.com/onsen-failure/記事低品質かYMYLの内容だったためインデックス登録されなかった可能性あり
2https://12345.com/category/parenting/カテゴリーOK
3https://12345.com/category/hawaiilife/costco/タグOK
4https://12345.com/page/11/ページOK
5https://12345.com/2022/09/02/カレンダーOK
6https://12345.com/recommended-spot1/feed/フィードOK

【体験談】「クロール済み – インデックス未登録」の記事はリライトすべき内容でした

前述の方法で確認した結果、「クロール済み – インデックス未登録」にあったブログ記事3つをリライト・削除することにしました。

というのも、内容が低品質だったりYMYLに抵触していたりしたからです。

  • 1つ目の記事:本文890字。内容が薄い。しかも、他記事と内容がほぼ被り
  • 2つ目の記事:3135文字で内容も濃い。ユニーク。たぶんYMYLに抵触してNGっぽい。「冬に帰省してご好意で叔父さんが宿を取ってくれたけど、大浴場しかなくて赤ちゃんと入った。だけど、赤ちゃんが震えててまずったから、真冬に大浴場はおすすめしない」という内容
  • 3つ目の記事:タイトルだけ、本文なしの公開記事。固定ページでサイトから動線を無くしていたので、公開しっぱなしにしていたのを忘れてました

【まとめ】初心者は灰色バー「クロール済み – インデックス未登録」の件数が多くても気にしなくていいことがほとんど

Googleサーチコンソールには、「ページのインデックス作成」という機能があり、インデックス登録されなかった記事を確認できます(灰色バー)。

しかし、そのほとんどは意図された対応なので、気にしなくて大丈夫です。

1点、確認するならば、「すべての送信済みページ」からGoogleに検索結果に表示したい記事URLがインデックス未登録扱いになっていないか確認しましょう。もしあればリライトするなど対応するといいと思います。

以上

備忘録としてまとめています。もし間違いなどあればコメント欄にてお知らせいただけると嬉しいです。

コメント

タイトルとURLをコピーしました