Quantcast
Channel: Microsoft Office 365 Community
Viewing all articles
Browse latest Browse all 566

信頼できるクラウド サービス、Office 365 の可用性

$
0
0

対象: 旧Office 365 Office 365 for EnterpriseOffice 365 for Small BusinessOffice 365 for Education

        新Office 365 Office 365 EnterpriseOffice 365 Small BusinessOffice 365 Midsize Business

 

(この記事は 2013 年 8 月 8 日に Office 365 Technology Blog に掲載された記事の翻訳です。)

 

投稿者:Rajesh Jha、投稿日: 8 月 8 日

「クラウドから提供される、すべての機能を備えた Office」、マイクロソフトでは Microsoft Office 365 をこのように捉えています。私たちは、10 億人に Office をご利用いただいている現状をたいへん誇りに思うと同時に、日々お客様の期待に応え、それ以上のものを提供しなければならないという大きな責任も感じています。生産性アプリケーションは業務に不可欠であり、生産性アプリケーションを使用することが業務遂行の手段そのものとなっています。マイクロソフトでは、Office 365 に絶えず新機能を追加しながら、サービスの信頼性と安全性を確保し続けることを責務と考え、この測定基準としてサービス可用性を使用しています。

 

Office 365 の可用性

2 年前に Office 365 を公開して以来、サービスの高度な可用性を実現するため、インフラストラクチャに多大な投資を続けています。現在ご利用中のお客様には詳細情報をお伝えしてきましたが、本日はこの情報を Office 365 を検討しているすべてのお客様にご提供します。可用性は、1 暦月に Office 365 サービスが利用可能である時間 (分数) を、その月の総分数で割ることで算出されます。このように測定される可用性は「稼働率」と呼ばれ、企業向け、公共機関向け、教育機関向けのサービスが対象となります。直近の 4 四半期 (2012 年 7 月から 2013 年 6 月) における全世界での Office 365 稼働率は、それぞれ 99.98%、99.97%、99.94%、99.97%でした。今後、稼働率の数値は四半期ごとに Office 365 セキュリティ センターで公開する予定です。

では、稼働率についてもう少し詳しく説明しましょう。

 

  1. 稼働率は、Exchange、SharePoint、Lync、Office Web Apps を対象とし、各サービスのユーザー数に応じて比重を調整します。お客様はこれらのサービスを併用するので、稼働率を計算するときはこれらすべてのサービスを考慮します。
  2. この稼働率は、企業向け、教育機関向け、公共機関向けの Office 365 を対象として算出されるもので、コンシューマー向けサービスは含まれません。
  3. Office 365 ProPlus は、マイクロソフトが提供するサービスの重要な一部ですが、大部分がユーザーのデバイス上で実行されるため、稼働率の計算には含まれません。
  4. 個々のお客様が実際に得られる稼働率は、場所や使用状況によって、全世界の稼働率を上回る、または下回ることがあります。

 

高度な可用性を誇るサービスを提供することのお約束として、マイクロソフトでは返金制度のあるサービスレベル契約 (英語)の中で 99.9% の稼働率を保証しています。

 

可用性のための設計原則

マイクロソフトは、エンタープライズクラスのソリューションを長年にわたり構築してきました。さらに、Office 365、Windows Azure、CRM Online、Outlook.com、SkyDrive、Bing、Skype、Xbox Live をはじめ、多くのクラウド サービスも運営しています。このように多様なサービスを提供していることで、各サービスのベスト プラクティスを他のサービスにも活用することができ、ソフトウェアの設計と運用プロセスの両面を向上させてきました。

 

以下に、Office 365 の設計と運用プロセスに適用されているベストプラクティスの一部を例として紹介します。

 

冗長性: 物理、データ、機能の全層における冗長性

  • 障害対策として、物理的な冗長性を確保しています。これは、サーバー内ではディスク レベルおよびカード レベルで、データ センター内ではサーバー レベルで、地理的に分散されたデータ センター間ではサービス レベルで実施されます。各地域用のデータ センターをそれぞれ複数設置し、各データ センターでは設備と電源を冗長化します。
  • データレベルでの冗長性を確保するため、データは、地理的に離れたデータセンター間で常時複製されます。設計上の目標は、処理中も保管後もデータの複数のコピーを保持することと、短時間での復旧が可能なフェールオーバー機能を備えることです。
  • 物理的な冗長性とデータの冗長性に加えて、マイクロソフトの大きな強みとなっているのが、機能的な冗長性を提供する Office クライアントです。ネットワーク接続がない場合、ユーザーはオフライン機能を使用して作業を続行できます。

 

回復性: 積極的な負荷分散と障害ドメイン間での継続的な復旧テスト

  • エンドユーザーに優れたエクスペリエンスを可能な限り提供するため、自動化された負荷分散を積極的に実施します。このメカニズムには、動的な優先度付けも含まれます。優先度の低いタスクは、負荷が高い時間には保留され、活動が少ない時間に実行されます。
  • ハードウェアまたはソフトウェアの障害時や監視アラートの発生時には、自動フェールオーバーと手動フェールオーバーの両方を使って正常なリソースへの切り替えを実行します。
  • フェールオーバーが必要な状況への対応に万全を期すため、障害ドメイン間での復旧を定期的に実施します。

 

分散サービス: 機能的に分散されたコンポーネント サービス

  • Exchange、SharePoint、Lync、Office Web Apps など、Office 365 のコンポーネントサービスは機能的に分散されています。このため、1 つのエリアで障害が発生した場合、障害範囲はそのエリアに限定され、他のエリアに影響が及ぶことはありません。
  • ディレクトリデータは、これらのコンポーネントサービス間で複製されます。このため、1 つのサービスで問題が発生しても、ユーザーは問題なくログインして他のサービスを使用できます。
  • サービスの分散により、運用チームおよび展開チームには、保守と展開、診断、修復と復旧といったすべての面が簡素化されるというメリットがもたらされます。

 

監視: 広範な監視、復旧、診断のためのツール

  • マイクロソフト内部の監視システムを使用して、サービスに障害が発生していないかを絶えず監視しています。また、監視システムはサービスの自動復旧を実行するように作られています。
  • システムによって、サービスの動作に異常がないかを分析し、もし異常があれば、待機しているエンジニアに予防措置をとるようにアラートが通知されます。
  • 世界各地の複数の場所で、外側からの監視を常に実行しています。信頼性の高いサード パーティ製サービス (独立した SLA 検証のため) と、マイクロソフトの世界各地のデータ センターの両方を活用して、アラートが通知されるようにしています。
  • 診断のために、詳細なログ記録、監査、トレースを実施しています。細部にわたるトレースと監視は、問題の根本原因の究明に役立ちます。

簡素化: 複雑性を抑え、予測可能性を向上

  • 可能な限り、標準化されたコンポーネントを使用しています。これにより、展開や問題の原因究明における複雑性が軽減され、障害復旧の予測可能性が向上されます。
  • 可能な限り、標準化されたプロセスを使用しています。重視するべきポイントは自動化だけではありません。重要なプロセスは常に繰り返して実施し、また繰り返して実施することができるようにする必要があります。
  • ソフトウェア コンポーネントは疎結合となるように設計されているため、展開時や稼動中の正常性維持に、複雑な調整作業を必要としません。
  • 変更管理は、各範囲において段階的かつ機械的に実施し、世界中に展開される前に検証が実施されます。

スタッフによるサポート: 24 時間体制で対応するサポート スタッフ

  • 復旧処理を可能な限り自動化する一方で、お客様をサポートするため、24 時間体制で専門チームのスタッフが待機しています。このチームには、サポート エンジニア、製品開発者、プログラム マネージャー、製品マネージャー、および上級管理者が含まれています。
  • チーム全体で、問題解決に向けた迅速な対応と情報収集が可能な体制を整えています。
  • 専門チームのスタッフは、サポートを提供するだけでなく、サポートが必要となったすべてのケースを基に自動化システムの強化に努めています。

 

継続的な調査と研究

サービスの中断は、今後も発生する可能性があります。問題が起きた場合には、影響の大きさにかかわらず、すべてのケースについて事後調査を徹底的に行います。事後調査では、発生した事象と実施した対応を分析し、今後の再発防止策を検討します。透明性と説明責任の観点から、重大なサービス障害でお客様の組織に影響が及んだ場合には事後調査の結果をご提供します。マイクロソフトは、大規模エンタープライズ企業の一社として、"ドッグフードを食べる" という原則にのっとっています。つまり、運用前のサービスを日常業務に使用しているのです。継続的な改善は、可用性の高い、世界トップレベルのサービスを提供するための重要な要素です。

 

一貫した情報伝達

透明性には、一貫した情報伝達が欠かせません。特に、オンライン生産性サービスを使用して事業を行っている場合にはこれが重要です。情報伝達の経路として、電子メール、RSS フィード、サービス正常性ダッシュボードなど、多くのチャネルを用意しています。Office 365 のお客様は、自身の組織に関係するサービスの可用性を細かく確認することができます。Office 365 サービス正常性ダッシュボードは、自身のサービスおよびライセンスの現在の状況を確認することができるウィンドウです。お客様がサービスの正常性を完全に把握できるよう、サービス正常性ダッシュボードには、タイムリーな更新の実行など、繰り返し改良を施しています。

 

 

また、お客様が常にサービスについての最新情報を得られるように、新しい魅力的なツールも提供しています。  先日、管理ポータルに「メッセージ センター」という新機能を追加しました。メッセージ センターは、サービスに関する情報の伝達やテナント レポート、管理者が行う必要のある操作に役立つ中心的な場所となります。  また、年内には、サービス正常性情報などのサービスに関する情報を提供する新しいモバイル アプリケーションを管理者向けに提供することも予定しています。

 

絶えず進化する包括的サービスを、かつてない規模に拡大しながら稼働させ続けることは容易ではありません。さまざまな対策を講じたにもかかわらず、サービスの中断は発生する可能性がありますが、マイクロソフトは、お客様のご期待に応えるような優れた信頼性と高度な可用性を誇るサービスを提供するため、継続的な調査、研究とたゆまぬ努力を続けることをお約束します。  サービスの継続性は、SLA でお客様に保証している技術的な基準以上に大きな意味を持っています。マイクロソフトでは、Office 365 セキュリティ センターで掲げているプライバシー、セキュリティ、法令遵守、透明性の 4 つの項目と並ぶ重要な柱として、サービスの継続性を捉えています。今回、Office 365 の稼働率を公表したことで、マイクロソフトがサービスの継続性と透明性の両方に継続的に取り組んでいることをご理解いただけると幸いです。


Viewing all articles
Browse latest Browse all 566

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>