ミラーサイト

ミラーサイトとは、元となるウェブサイト全部、または一部分と同一内容を持つウェブサイトのことである。サーバにかかる負荷を分散する目的で作られることが多く、元のウェブサイトとは異なるドメイン名を持つ場合もある。

概要

ミラーサイトは、ウェブサイト上のコンテンツアクセス要求が集中してサーバが過負荷で通信遅延が生じたり、あるいは機能停止してしまうことを予防する目的で、同一の情報を保持しているサイトのことである。一般に高負荷が予想される場合に事前設置するものだが、過去事故に懲りて急遽設置することもある。

これは一種の分散処理ともいえるが、ドメイン名が異なる場合、どちらにアクセスするかはサイト閲覧側の自由意志左右されるため、余り負荷分散にならない場合もある。その一方では、インターネット上のホームページ開設サービスでも無料のサイトでは、利用規約やサービス形態の変更などにより、突如として個人のホームページが消滅する場合もあり、こういった消滅に備えて同一内容のホームページを複数設置する者もいる。

なおプロキシプロキシサーバ(プロクシとも)はインターネットへの接続途中中継させることで、キャッシュ コンピュータシステムキャッシュと呼ばれるデータ通信通信データの一時複製を行い、同一リクエストに対してキャッシュ内のデータを提供することで通信の高速化を目指すが、過去に同サーバ経由でリクエストがあった内容しかキャッシュに残らないため、ミラーサイトとはその性格において異なる。

ミラーサイトの利点

ミラーサイトは一般に、あるサイトと同じ情報を複数の場所から閲覧できるようにする手段として使用される。特に、サイズの大きなファイル大量のファイルを提供する場合に、アクセスの集中によるダウンロード停滞などの混雑緩和し、安定した運営実現するのに役立っている。

アクセス集中による負荷を分散する

あるウェブサイトが、そのウェブサイト運営者の資本に対して多数ユーザを獲得してしまった場合、大量のアクセスによりウェブサイト側の提供が追いつかなくなる場合がある。この場合、通常はウェブサイトの通信帯域拡張して対処するが、アクセスの集中が一過性である、帯域の増強にかかる費用が見込まれる利益見合わない、といった事態が見込まれる場合に、代替手段としてミラーサイトを立て、負荷の分散を図ることがある。

具体的な例としては、

Linuxなどの著名ソフトウェアが新規リリース、またはバージョンアップされた場合。

スラッシュドット効果に代表されるような、ニッチなウェブサイトがある日突然、脚光を浴びてしまった場合。

等が挙げられる。

地理的距離による通信の遅延を補償する

地理的に離れたユーザに対し、サイトへのアクセスを高速化するために使用される場合がある。例えば、アメリカ合衆国米国にあるサイトのミラーサイトを日本に設置することにより、日本にいるユーザは高速かつ安定した速度で目的の情報を入手することが出来るようになる。また、該当サイトへのアクセスによる日米間の通信インフラの消費を押さえることが出来るメリットもある。これは特定のウェブサイト専用のプロキシまたはキャッシュ コンピュータシステムキャッシュと見なすことができる。

検閲等による規制や迫害に対処する

政治的、思想的などの理由により、特定のウェブサイトが政府などの機関によりネット検閲・公開禁止等の規制を受ける場合がある。この規制を回避し、情報公開を目的として、規制を受けていない国にミラーサイトを立て、運営を継続する場合がある。

例として、2002年に中華人民共和国政府によりGoogle遮断された際に、そのミラーサイトとなるelgooGが設置されている(関連中国のネット検閲)。

過去の記録を凍結保持する

活動的なウェブサイトは更新頻度が高く常に新しい情報を発信する反面、過去の情報や古いデータなどについてはウェブサイトの運営の都合上削除されることもある。しかしながら、古い情報が必要となる場合も往々にしてあるため、ある時点でのサイトの内容をその時の状態保存したミラーサイトもある。例として、ある企業でサポート対象外となった古い製品についての情報やファイルなどを提供する場合などが挙げられる。多くの場合、これらのミラーサイトは、元となるサイトの運営側ではなく、必要性を感じた有志やユーザの手によって設置される場合が多い。

ミラーサイトの問題

片側の情報が古くなる。

ミラーリングのように、平行して存在するサーバ間の同期処理(どちらかに新しい情報が書き込まれたら、もう片方をその情報に置き換える処理)を行わないと、片側の情報が古くなってしまう。

手間が二重化する

情報更新を手動で、双方のサーバに同一内容をアップロードしても良いが、手間が二重化する分、メンテナンス操作が煩わしくなる。

ログ結合が必要になる。

電子掲示板など閲覧者参加コンテンツがある場合、双方にあるログの結合処理が必要になる。

運営コストが二重化する

当然ながらサーバの運営コストも二重化する。

SEO対策・アフィリエイトなどの問題

SEO対策のためにミラーサイト化が行われたり、アフィリエイト収入を目的としてミラーサイトを量産するなどの問題も存在する。

-- 以下の記述は冗長で不要かと思いますが、議論のために一時コメントアウトとして残します。

障害(主にハードウェアの)によってデータが失われるのを防ぐため(ミラーディスク)。

  ミラーサイトの説明ではないし、データ損失の補償なら RAID などを挙げるべき。

サーチエンジンでの表示順位を上げるため。これは英語ではリンクファーム(英enLink farmLink farm)と呼ばれる手口であり、各ミラーサイトで互いにハイパーリンクリンクを張ることで、あちこちからリンクされた優良サイトであるかのように見せかけてサーチエンジンをだます。サーチエンジン管理者からも、ウェブサーファーたちからも、汚いやり方として嫌われる。

まれにだが、盗作の手段として。ただし、これはまず的外れなやり方である。盗作しがいがあるウェブサイトなら、たいていは非常にたくさんの読者がいるはずである。その中の誰かが偶然にその盗作サイトに行き当たったら、たちまち本家にばれてしまう。

広告収入を稼ぐ手段として。例えば、GNU Free Documentation License のもとで公開し広告などの収入を得るサイトが存在するが、ウィキペディアはそのような営利サイトに複製される素材の好例といえる。ウィキペディア自身はそのようなサイトと異なり非営利である。そのようなサイトのリストが英語版 enWikipediaMirrors and forks にある。実例を挙げると、英語版記事 enTelevision の複製が以下の場所にみられる。

nowikihttpomniknowcomcommonwikiphpinentermTelevisionnowiki

br nowikihttpfreeencyclopedianetindexphptitleTelevisionnowiki

br nowikihttpwwwdigeraticafecomreferenceTelevisionnowiki
br nowikihttpwwwstartlearningnowcomTVhtmnowiki

br nowikihttpfactsandlinkscomcommonwikiphpinentermChile252FCommunicationsnowiki

br nowikihttpwwwbaghdadmuseumorgrefindexphptitleTelevisionnowiki

br nowikihttplink-adscomresourcephptitleTelevisionnowiki

br nowikihttpwwwyourartcomresearchencyclopediacgisubjecttelevisionnowiki

br nowikihttpwwwapawncomsearchphptitleTelevisionnowiki

br nowikihttpwwwinternet-encyclopediaorgwikiphptitleTelevisionnowiki

br nowikihttprecipespaellamancomencyclopediaphptitleTelevisionnowiki

br nowikihttpwwwmygnunetarticlesTelevisionnowiki
br nowikihttpwwweverybasecomTelevisionnowiki
br nowikihttpconkcomsearchencyclopediacgiqTelevisionnowiki
br nowikihttpwwwfwshorgarticlephpTelevisionnowiki
br nowikihttpwwwnationmastercomencyclopediaTelevisionnowiki

br nowikihttpwwwworld-knowledge-encyclopediacomdefaultasptRotarydial-tuneTVnowiki

  上記三点はかなりイレギュラーな使用方法で Tips 的な内容だが、挙げるべきかどうか悩ましい。

ミラーサイトの例

有名な httpsourceforgenet SourceForgenet ウェブサイトは、ミラーサイトの好例である。

ソースフォージの基本コンセプトは、第一にはオープンソースソフトウェアプロジェクトに場所を提供することだが、第二には様々な場所に分散することによって、一つの目標 ユーザがいつでも安定してダウンロードできるようにすること を達成することである。

たくさんの革新的なコンピュータプロジェクトが、そのサイトとソフトウェアをソースフォージに置き、それによってアイルランドダブリンから日本の東京に至るまで、いくつかの国家国にミラーされている。

もっと大規模なミラーの例としては、Debian や FreeBSD ソフトウェアのプロジェクトがある。

百科事典サイトウィキペディアもまた、たくさんの場所でミラーされている。

  この項目は不要と思われる。

--

ミラーサイト用のプログラム

--

オフラインでの閲覧機能を持つブラウザの中には、目的のウェブサイトのミラーサイトする機能を持つものが多い。

その中のいくつかは個人向けに作られたもので、手許にサイトの内容のコピーを作って閲覧することができる。

これにより、最初の待ち時間はかかるものの、ひとたびミラー化が完了すれば、読み込み時間はずっと速くなる。

  ミラーリングとミラーサイトを区別していない

--

一般公開するミラーを立てるためのプログラムとして、以下のようなプログラムがある。

rsync enRsyncen
CVSup enCVSupen
関連項目
ミラーリング
オフラインブラウジング
リバースプロキシ
DEFAULTSORTみらさいと
Categoryウェブサイト
deMirror
esMirror
itMirror
ptMirror
ru