要件定義とシステム分析
[更新日:2025年09月30日]
ワークロード特性の把握
ワークロードとは、ビジネスロジックとデータ要件において他から独立した機能単位を指します。各ワークロードを適切に分析することで、効率的なリソース配分と最適な設計判断が可能になります。
分析すべき観点は以下のとおりです。
機能的特性:処理内容、データフロー、外部システムとの連携
非機能的要件:可用性、拡張性、データ整合性、復旧時間
ビジネス影響度:サービス停止時の業務への影響範囲と重要度
この要素を総合的に評価し、システム全体の優先順位を決定します。
利用パターンの分析
システムの利用パターンを詳細に分析し、要件に反映させる必要があります。たとえば経理システムにおいては月末の数日間は絶対に停止できませんが、平常時であれば短時間のメンテナンスは許容されるかもしれません。このような特性を把握することで、必要な時期にのみ追加のリソースを投入する効率的な設計が可能になります。
考慮すべき要素は以下のとおりです。
ピーク時間の特定:高負荷が予想される時間帯や期間の把握
季節変動:月末処理、年度末処理など、周期的な負荷変動の考慮
地域特性:さくらのクラウドの拠点分散を活用した負荷分散の検討
季節変動や地域特性を含めた包括的な分析により、最適化されたシステム設計を実現します。
重要コンポーネントの識別
システム内のすべてのコンポーネントが同等の重要度を持つわけではありません。この分析により、限られたリソースを最も重要な部分に集中投資し、効果的な復旧戦略を策定できます。
識別すべき要素は以下のとおりです。
クリティカルパス:業務継続に必須のコンポーネントとデータフロー
オプション機能:停止しても基本業務を継続できる付加機能
依存関係:コンポーネント間の依存関係と影響範囲
優先順位に基づいたリソース配分により、コスト効率と信頼性のバランスを最適化します。
外部依存関係の評価
さくらのクラウド外部のサービスや、他システムとの連携における影響を評価します。これらの依存関係を明確にすることで、適切な分離設計や代替手段の準備が可能になります。
評価項目は以下のとおりです。
外部API依存:外部サービスの障害が自システムに与える影響の分析
データ連携:他システムとのデータ交換における障害波及の評価
ネットワーク依存:インターネット接続や専用線の障害時の影響評価
外部依存による単一障害点を特定し、適切な冗長化戦略を策定します。
可用性目標の設定
高可用性の目標は通常、稼働率として定義されます(表1)。さくらのクラウドは各サービスのSLA(サービスレベル合意)を公開しており、これらの数値を参考にシステム全体の可用性目標を設定します。特にさくらのクラウドのマネージドサービスは高い可用性を組み込んで提供されているため、これらを活用することで目標達成が容易になります。
表1: 可用性目標と許容停止時間
可用性レベル |
年間許容停止時間 |
---|---|
99.9% |
約8.7時間 |
99.95% |
約4.4時間 |
99.99% |
約53分 |
さくらのクラウドでは「月間のサーバ稼働率が、99.95%以上であること」とSLAを定義しています。これは表1のとおり、年間許容停止時間が約4.4時間を意味します。
復旧指標の確立
RTO(Recovery Time Objective) は、障害発生から復旧完了までの目標時間を定義します。これは業務影響とコストのバランスを考慮して決定します。
RPO(Recovery Point Objective) は、障害時に許容できるデータ損失の最大時間を定義します。これによりバックアップ頻度やレプリケーション戦略が決まります。さくらのクラウドのストレージサービスでは、自動バックアップ機能により定期的なデータ保護が可能です。バックアップ間隔を短くすることでRPOを改善できますが、コストとのトレードオフを考慮する必要があります。
災害の定義と分類
災害復旧計画においては、明確な「災害」の定義が重要です。各災害レベルに応じた対応手順と責任者を明確に定義し、緊急時のコミュニケーション計画を確立します。
災害の分類は以下のとおりです。
システム災害:サーバ障害、ストレージ障害、ネットワーク障害
データセンター災害: 火災、停電、自然災害によるデータセンター機能停止
地域災害:地震、台風などによる広域的な影響
サイバー災害:セキュリティ侵害、ランサムウェア攻撃
段階的なエスカレーション体制により、適切なレベルでの対応を確保します。
コスト考慮とFinOps
信頼性向上には必ずコストが伴います。FinOpsの観点から、効率的な投資判断を行う必要があります。
評価すべき要素は以下のとおりです。
投資対効果:可用性向上に必要なコストと得られるビジネス価値
運用コスト:冗長化やバックアップに伴う継続的なコスト
機会損失:障害時のビジネス損失と投資コストの比較
定量的な分析により、適切な投資レベルを決定します。
参考リンク
さくらのクラウド品質保証(SLA) :可用性の目標設定で言及されるSLAの公式な定義を記載