WebアクセスログのステータスコードとURLの分類による検索時間の削減

システム管理者はシステムの障害発生時にログを検索することで原因を調査する.検索のクエリによって検索の応答時間は異なる.応答時間が異なる原因はログの配置やインデックスにある.課題はシステムの原因調査のために月単位でログの検索をする際に,検索対象の件数が多くなるために,検索の応答時間が長くなることである.例えば,障害の影響範囲を調べるためにURL ごとのステータスコードの集計をした際の検索の応答時間は,EClog を検索対象とした場合,1 ヶ月分の7,175,241[件] では1.52[秒] であったが,6 ヶ月分の35,157,691[件] では5.00[秒] となった.解決方法として,HTTP アクセスログから共通したステータスコードとURL ごとにHTTP アクセスログを分けて保存する.共通したステータスコードとURL でHTTP アクセスログを分けることで,検索対象となるログの中から検索条件に合致するログを予め用意することができる.検索条件に合致するログの保存場所が分かることで,検索のためにログのレコードが検索条件に合致するかを調べる必要がなくなり,検索時間の短縮が可能になる.評価手法として,Elasticsearch と改善した提案手法とで検索の応答時間を比較した.検索の応答時間は検索対象が1 ヶ月分の7,175,241[件] で2.0[秒],6 ヶ月分の35,157,691[件] で16.2[秒] の検索の応答時間の増加があった.Elasticsearch に比べて改善した提案手法は1 ヶ月から6 ヶ月分の検索の応答時間を比較すると,平均で438[%] 上昇した. ...