第8回 バーチャルホストによる複数サイトの同時運用

独自ドメインが使えるホスティングサービスは、どのように実現しているのだろうか? その鍵となるのが「バーチャルホスト」である。この機能を使うことによって、1台のマシンで複数のWebサイトを運用できるようになる。

バーチャルホストとは

 今回は、Apacheの特徴的な機能の1つである「バーチャルホスト」について解説する。この機能により、少ないリソースで複数のWebサイトを構築することが可能になる。

なぜバーチャルホストが必要なのか

 通常、Webサーバへのアクセスにはwww.atmarkit.co.jpやwww.tis.co.jpといったURLが利用される。URLの「atmarkit.co.jp」や「tis.co.jp」の部分はドメイン名、「www」の部分はホスト名と呼ばれる。第2回でも説明したとおり、実際にはURLをIPアドレスに置き換えなくてはWebサーバにアクセスできない。そこで、先方ドメインのDNSにIPアドレスを問い合わせ、アクセスするホストのIPアドレスを取得する。

 問題はここからで、例えば「www.atmarkit.co.jp」と「linux.atmarkit.co.jp」という異なるURLで同じページを表示したいとする。これは、どうすれば実現できるだろうか。あるいは、「www.atmarkit.com」と「www.atmarkit.co.jp」を同一のサーバで実現したいとしたらどうだろう。

 前者は、「ホスト名は違うが同じコンテンツを表示したい」という要求。後者は、「単一のサーバで複数のドメイン名を使いたい」という要求である。これらを実現する方法としては、以下のようなものが考えられる。

  1. サーバ自体を分割する
     最も単純明快な方法としては、サーバ自体を分割してしまうことが考えられる。この方法については、特に解説する必要などないだろう。コンテンツが複数のサーバに分散することが問題であれば、ファイルサーバを使ってコンテンツを共有するという方法もある。

  2. ネットワークカード(LANカード)を複数用意する
     次に考えられるのは、同一のサーバに複数のネットワークカードを装着する方法である。各ネットワークカードにはユニークなIPアドレスを割り当てておく。そして、Apacheを複数起動し、それぞれのApacheがアクセスを受け入れるIPアドレスを各ネットワークカードと1対1で対応するように限定する(BindAddressディレクティブを使う)。Apacheごとに設定を独立させられるため、あたかも複数のサーバで運用しているように扱える。

     この方法の問題は、サーバのリソースであろう。複数のApacheを起動すれば、それだけCPUやメモリを多く消費することになる。

  3. VIFを利用する
     Linuxのほか、多くのUNIXに搭載されている「VIF」という機能を使う方法もある。VIFとは、1つのネットワークカードに対して複数のIPアドレスを割り当てる機能である。この機能を使えば、ハードウェアに追加投資することなく複数のIPアドレスを利用できる。

     VIFを使った場合の弱点は、設定と運用が複雑化することと、複数のIPアドレスへのアクセスが単一のネットワークカードに集中することだろう。つまり、アクセスが集中した際にネットワークカードがボトルネックになる可能性があるのだ。

 3つの方法を挙げてみたが、それぞれに一長一短があって決め手にかける。場所などの制約でサーバを増やせなかったり、複数のApacheを立ち上げてリソースを消費したり、ネットワークカードがボトルネックになったり。それぞれの欠点をうまくカバーできる方法はないだろうか?

 そこで登場するのが、バーチャルホストである。この機能を使えば、1つ(あるいは複数)のIPアドレスと1台のサーバだけで複数台のWebサーバマシンと同じ役割を果たせるようになる。台数の制限はないから、理論上は何台分の役割をさせても構わない。追加投資なしに複数台のサーバを用意するのと同じことができるわけだ。先に挙げた例のように、ホスト名を使い分けたい場合や複数のドメインを管理したい場合に非常に有益な機能といえる。しかも、バーチャルホストなら「www.atmarkit.co.jpとlinux.atmarkit.co.jpで異なるページを表示したい」といったニーズにもこたえることができる。

コラム:異なるドメインのホスト

 異なるドメインのホストが同じサーバを指すことなどできるのか、と思う方もいるだろう。それどころか、本稿では同じIPアドレスを指そうとしている。

 これは、一見信じられないことだが、実は簡単に実現できる。本文でも述べたとおり、URLを使ったアクセスでは、まずドメインのDNSへ問い合わせが行われる。このとき、そのDNSが返すIPアドレスは何であってもWebブラウザは信用するしかない。つまり、ほかのドメインで使われているIPアドレスであっても信じるのである。従って、「www.atmarkit.com」と「www.atmarkit.co.jp」で同じIPアドレスが返ってきても問題はない。あとは、アクセスを受けたWebサーバ側の問題となる。

 独自ドメインのURLが使えるのが売りのプロバイダは、バーチャルホストを使って複数のドメインを1台のサーバで運用している。それどころか、DNSサーバすらも複数のドメインを1台のサーバで賄っているのだ。

バーチャルホストを実現する2つの方式

 バーチャルホストを利用するに当たって、検討しておかなければならないことがある。バーチャルホストには、「NAMEペース」「IPベース」という2種類の方式があるのだ。1つのIPアドレスで実現できるのが「NAMEベースのバーチャルホスト」、複数のIPアドレスを単一のApacheで処理するのが「IPペースのバーチャルホスト」で、それぞれメリット/デメリットがある。

IPベース

 IPベースのバーチャルホストは、IPアドレスでホストを区別する方式である。IPアドレスを複数用意することは可能だが、サーバを複数台用意するのが難しいという場合に有効だ。例えば、設置面積や消費電力の制約でサーバが増やせないといったケースが考えられる。この方式は、IPアドレスを消費するという点以外に特にデメリットもない。

 もう1つ、積極的にIPベースを採用する理由を挙げるなら、内部アドレスと外部アドレスの両方でアクセスできるようにする場合である。これは、最近流行の電子商取引や社外からもアクセス可能なイントラネットなどで用いられる。つまり、社内LANからのアクセスと社外(インターネット)からのアクセスにそれぞれIPアドレスを割り当てたサーバで利用するのだ。社内のサーバへアクセスするために、わざわざインターネットに出ていく必要も複数のサーバを用意する必要もない。コンテンツ管理を一元化することもできるし、社内からのアクセスか社外からのアクセスかを区別できるから、コンテンツへのアクセス制限も行いやすい(アクセス制限については次回に解説する)。

 なお、1台のサーバに複数のIPアドレスを割り当てるには、ネットワークカードを複数装着するか、前述したようにVIFを使う必要がある。本稿では、複数のIPアドレスが割り当てられたサーバ環境までは完成しているという前提で話を進める。

NAMEベース

 NAMEベースのバーチャルホストは、WebブラウザがWebサーバに対して送るホスト名を基にして応答するホストを決定する方式である。

 NAMEベースのバーチャルホストには、大きな弱点が存在する。クライアント(Webブラウザやプロキシ)が、NAMEベースのバーチャルホストに対応していなければならないということである。つまり、アクセスしているサーバのホスト名をサーバに送り返す機能がクライアントに実装されていないと、NAMEベースのバーチャルホストが機能しないのである。最近のクライアントであれば問題ないが、一部の古いWebブラウザやプロキシはホスト名を送り出さずにIPアドレスだけをサーバに送信する。すると、サーバはどのホストへのアクセスなのかが判断できないことになる。

 いずれにしても、バーチャルホストにはハードウェアコストがかからず、設定や運用が簡単であるといった多くのメリットが挙げられる(編注1)。やたらと多くのWebサーバを用意する前に、こうした機能が存在することを理解し、ハードウェア資源を有効活用するようにしたいものである。

IPベースのバーチャルホスト

 前置きが長くなってしまったが、設定の解説に移ろう。バーチャルホストは、概念が複雑な割に設定そのものは単純である。ただし、バーチャルホストにはDNSの設定が不可欠である。複数のホストを賄うにしろ複数のドメインを担うにしろ、DNSの変更なしにアクセスを受け入れることなどできないからである。

DNSの設定

 まず、DNSの設定を済ませてしまおう。IPベースの場合は、ホストごとにIPアドレスを持つので特殊な設定は必要ない。ゾーンファイルに、

www    IN      A       172.16.1.11
linux  IN      A       172.16.1.12

という具合に、Aレコードを羅列していくだけである(ゾーンファイルの設定については、「BINDで作るDNSサーバ」第2回 名前解決の仕組みとゾーンファイルの設定を参照)。つまり、それぞれユニークなIPアドレスを持った複数のWebサーバが存在するものとして、各ホストを通常どおりに登録するだけである。

Apacheの設定

 Apacheの設定には、VirtualHostディレクティブを利用する。VirtualHostディレクティブは、

<VirtualHost IPアドレス>

</VirtualHost>

のように記述し、これが1ホスト分のブロックとなる。つまり、バーチャルホストでホスティングしたいホストの数だけ、このブロックを記述すればよい。IPベースで注意する点は、<VirtualHost IPアドレス>のIPアドレスを各ブロックで異なるものにしなければならないということである。Apacheは、このIPアドレスでホストの設定のブロックを識別するからである。

 <VirtualHost>と</VirtualHost>の間には、各ホストの設定に必要なディレクティブを列挙する。最低限、ホスト名を表すServerNameディレクティブとそのホストのコンテンツディレクトリを表すDocumentRootディレクティブを記述しなくてはならない。これ以外はオプション的な扱いとなるが、管理者のメールアドレスを表すServerAdminディレクティブやログファイルの位置を表すErrorLogTransferLogディレクティブくらいは記述しておくことをお勧めする。従って、VirtualHostディレクティブで囲まれたブロックの基本構造は、

<VirtualHost IPアドレス>
ServerName ホスト名
DocumentRoot コンテンツディレクトリ
ServerAdmin 管理者メールアドレス(省略するとデフォルト値)
ErrorLog エラーログファイル名(省略するとデフォルト値)
TransferLog アクセスログファイル名(省略するとデフォルト値)
</VirtualHost>

となる。

 以上の条件に従って、「www」と「linux」という2つのホストを定義したものが次の例である。このようなものをApacheの設定ファイルhttpd.confの最後に記述する。最後でなくても構わないが、httpd.confの最後にVirtualHostディレクティブの例が示されているため、これに準じて最後に記述するのが一般的だ。

<VirtualHost 192.168.1.11>
ServerName www.atmarkit.co.jp
DocumentRoot /www/httpd/www
ServerAdmin webmaster@www.atmarkit.co.jp
ErrorLog logs/error_log
TransferLog logs/access_log
</VirtualHost>

<VirtualHost 192.168.1.12>
ServerName linux.atmarkit.co.jp
DocumentRoot /www/httpd/linux
ServerAdmin linuxmaster@www.atmarkit.co.jp
ErrorLog logs/linuxerror_log
TransferLog logs/linuxaccess_log
</VirtualHost>

 最後に、IPベースのバーチャルホストではBindAddressディレクティブにも注意してほしい。BindAddressディレクティブは、そのApacheがリクエストを受け付けるIPアドレスを定義する。例えば、

BindAddress 192.168.1.11

と書かれていたら、そのApacheは192.168.1.11にアクセスされた場合しか要求を受け付けなくなる。IPベースでは複数のIPアドレスを受け付けなければならないので、これではまずい。複数のIPアドレスでアクセスを受け付けたければ、

BindAddress 192.168.1.11 192.168.1.12

のようにIPアドレスを続けて書くか、

BindAddress 192.168.1.*

としてワイルドカードを使う。また、

BindAddress *

とすれば、そのサーバに割り当てられたすべてのIPアドレスへのアクセスを受け入れるようになる。

NAMEベースのバーチャルホスト

 こちらもIPベースと同様、DNS、Apacheの順で解説する。

DNSの設定

 IPベースの場合は、Aレコードで各ホストとIPアドレスの対応をDNSに登録していた。しかし、NAMEベースの場合はIPアドレスが1つしかないため、Aレコードで登録することはできない。NAMEベースでは、1ホスト分のみAレコードで登録し、残りのホストはCNAMEレコードで別名定義する。例えば、「www」と「linux」という2つのホストを172.16.1.11という1つのIPアドレスで運用するなら、

www        IN      A       172.16.1.11
linux      IN      CNAME   www

と記述する。まずAレコードでwwwというホストに172.16.1.11というIPアドレスを割り当てる。linuxというホストはCNAMEを使ってwwwの別名として登録する。こうすることで、172.16.1.11というIPアドレスにはwwwとlinuxという2つのホスト名が割り当てられたことになる。ホストを増やす場合は、同様に

ホスト名   IN      CNAME   www

という行を追加していけばよい。

Apacheの設定

 NAMEベースの場合、使うIPアドレスは1つだけなのでBindAddressディレクティブへの注意は必要ない。その代わり、NameVirtualHostディレクティブを使って複数のホスト名で共有するIPアドレスを示さなくてはならない

 以下の例は、192.168.1.11でwwwとlinuxの2つのホスト名を利用する場合の設定例だ。

NameVirtualHost 192.168.1.11

<VirtualHost 192.168.1.11>
ServerName www.atmarkit.co.jp
DocumentRoot /www/httpd/www
ServerAdmin webmaster@www.atmarkit.co.jp
ErrorLog logs/error_log
TransferLog logs/access_log
</VirtualHost>

<VirtualHost 192.168.1.11>
ServerName linux.atmarkit.co.jp
DocumentRoot /www/httpd/linux
ServerAdmin linuxmaster@www.atmarkit.co.jp
ErrorLog logs/linuxerror_log
TransferLog logs/linuxaccess_log
</VirtualHost>

 NameVirtualHostの追加と、VirtualHostに記述するIPアドレスが共通であることを除けば、IPベースの設定とNAMEベースの設定に違いはない(編注2)。

編注2:ところで、NAMEベースのバーチャルホストを構築しているサイトに、IPアドレスでアクセスしたらどうなるだろうか? 答えは、「最初に記述されたブロックの設定が使われる」である。つまり、上記の例の場合はwwwというホストとして処理されるのである。バーチャルホストを構築する場合は、デフォルトとして機能するホストを最初に記述するようにしよう。

まとめと次回予告

 以上のように、バーチャルホストは概念が少々複雑だから方針の決定や設計には注意が必要だが、設定そのものは難しくない。

 次回は、Webのセキュリティについて紹介しようと思う。Webサーバで提供するコンテンツのセキュリティ管理には、十分に気を使わなくてはならない。ファイアウォールやセキュリティホールの管理、ウイルスへの対応策ばかりに注目が集まるが、だれもがアクセスできるWebサーバのコンテンツにも注意が必要なのである。