重複するコンテンツについてはグーグルの判断で処理されます。下記にグーグルのウェブマスターヘルプに書かれている内容を噛み砕いて考えてみましたので、ぜひご参考にしてみて下さい。
重複コンテンツ問題が起こったときの対処法になります。
閲覧用と印刷用のページなど、明らかに重複コンテンツを作成しているときは、印刷用のページを「robots.txt」ファイル等を用いて、インデックスに登録されないようにします。
そうすることで閲覧用のものが優先的に表示されるようになり、重複コンテンツ問題は解決できます。
301リダイレクトを用いて、「"RedirectPermanent"」を「.htaccess」ファイルで使用することにより解決できます。
トップページ直下に「.htaccess」ファイルを置き、リダイレクト時間を0秒にしてしまうと古いドメインにアクセスしてきてもすぐに同じフォルダ名称の別ドメインへクリック先が飛ぶようになります。
たとえば、http://www.fitone.info/、http://www.fitone.info、http://www.fitone.info/index.htmlのようにリンク先を分けてしまうとリンクの一貫性が保てず、3つのページに分かれているような形になります。
これを避けるため、トップページはhttp://www.fitone.info/のような形に統一して下さい。
ドメインはいろいろなものがありますが、トップレベルドメイン(「.jp」「.com」「.net」など)を使用することによって文書の適切なバージョンが表示されるようです。
一例としては、www.example.de を使用すれば、www.example.com/de や de.example.com の場合よりも、ドイツを対象としたコンテンツが含まれることを Google で認識できる可能性が高くなるとあります。
シンジケーションとは、ウェブサイトのコンテンツをフィードを通じて配信することで、近年は「RSSリーダー」などが有名です。
このシンジケーションを行っていて、コンテンツを他のサイトに提供している場合に重複コンテンツの問題が起こります。
どちらが配信元かどうかに関係なく検索結果では最適と判断されたバージョンが常に表示されます。
PING送信のようにリンク先のみを含めているような場合は有効に働くようです。
ウェブマスターツールを使用して、サイトをインデックスに登録する方法http://www.fitone.info/と http://fitone.info/のどちらを使用するかなどを分けることが出来ます。
多くのページで同じような表現を記載している場合(注意事項など)は、それを別のページにまとめ、リンクするという方法がよいです。
全てのページのコンテンツとして同じ文章が多ページに渡って記載されていると、重複コンテンツ問題が起こりうる可能性があります。
コンテンツが未完成、もしくは空のページにリンクを貼り、検索エンジンにクロールしてもらうのを待つようなページはユーザー観点からは好ましくありません。
枠組みだけしているページも同様です。
そのようなプレースホルダーページが存在する場合は、リンクを一時切っておくか、「robots.txt」を使用してクロールをブロックする必要があります。
ブログは、HTMLで制作されたホームページと異なり、全く同じコンテンツが個別ページ、アーカイブページなど複数に渡って記事が生成されます。
つまり、同じコンテンツが2重3重に発生してしまう仕組みをもともと持っているということになります。
ブログ特有のものですが、これらの仕組みを理解しておくことは非常に重要です。
現状は特に問題にはなっていないようです。
ページ数が多くなってくると類似する内容のページがいくつかあるということも珍しくありません。
そんなとき、重複コンテンツ問題は発生しやすくなります。
解決策としましては類似するページが多数存在する場合は、各ページに内容を追加するか、1 つにまとめます。
それにより独立したコンテンツページとしてみなされるようになります。
参考サイト重複するコンテンツ(Google)