閲覧数の差分とパレートの法則によるリストア後のテスト対象の限定と時間の短縮

東京工科大学コンピュータサイエンス学部の研究室であるCloud and Distributed Systems Labora-tory (以後CDSL) の日本語サイトはWordPress で運用されている. Web サイトのページを確認する際, サイト内の全体のページ, ハイパーリンクを対象にアクセスできるかテストする. 課題は, バックアップデータのコンテンツ全体のテストを実行する際に, コンテンツを限定してテストを実行した際と比べ時間がかかることである. 提案では, 複数日のバックアップデータをリストアした際に生じるWordPress の閲覧数の差分を算出した. その後, パレートの法則から閲覧数に差分の大きい値上位20%をWordPress のサイトの確認対象として定めた. 評価では, 提案適用前と提案適用後における, テストの実行時間を比較した. テストの実行対象として, コンテンツ全体を計測した時間, 閲覧数に差分のあったコンテンツ全体を計測した時間, 閲覧数の差分の大きい値上位20%のコンテンツを計測した時間をそれぞれ10 回計測した. コンテンツの全数のテストを実行した際の時間は, 平均で約123.46 秒であり, 閲覧数の差分のあったコンテンツ全体を検索した際の実行時間は, 平均で約26.53 秒, 閲覧数の差分が大きい値上位20%のコンテンツをテストの実行対象として定めた際, テストの実行時間は約5.35 秒であった. コンテンツの全数と閲覧数の差分のあったコンテンツ全体のテストを実行した際は平均約79%, コンテンツの全数と閲覧数に差分の大きい値上位20%のテストを実行した際は平均約96%実行時間を削減できた. テストの実行時間を削減することでバックアップデータに不備があった際, 原因の探索により早く取り組むことができる. ...