問い合わせメールに含まれる日時を用いたログのプリフェッチによるキャッシュヒット率の向上
- 著者:
- ラベル: CDSL-TR-217
- 公開日: Dec. 20, 2024
- 更新日: Dec. 20, 2024
- ダウンロード数: 0
管理者は障害が発生した際に原因を調査するためにログを検索する.その際に,キャッシュがあると検索の応答時間が速くなる.初めて検索するクエリの場合,プリフェッチをすることで応答時間が速くなる.課題は,既存の履歴ベースとコンテンツベースのプリフェッチ手法では時間の範囲が指定されておらず,キャッシュヒット率が低下することである.本稿では,サイトが閲覧できない場合に,サイト閲覧者の問い合わせメールの受信日時からプリフェッチする対象のログを決定する方法を提案する.提案方式では,問い合わせメールを受信した日時以前のステータスコードが400 番台か500 番台のログを検索する.ヒットしたログの中で問い合わせメールを受信した日時に最も近いログに含まれる日時を検索範囲の終了時刻に設定する.ステータスコードが200 番台のログも同じ条件で検索し,問い合わせメールを受信した日時に最も近いログに含まれる日時を検索範囲の開始時刻に設定する.実験では,ログサーバーの2024年6 月24 日から2024 年10 月31 日までの130 日間に収集した114,336,114 件のコンテナログを使用する.評価では3 種類の実験を行い,1 つ目は提案ソフトウェアが作成したクエリと3 人の管理者役の学生が作成した3 つのクエリの時間差をそれぞれ求めた.3 つのクエリ全てで検索範囲の終了時刻の時間差は20 分以下,検索範囲の開始時刻の時間差は5 時間から12 時間であった.2 つ目はキャッシュヒット率の算出を行った.管理者A のキャッシュヒット率は100%,管理者B は約29.5%,管理者C は約84.3%となった.3 つ目は,提案ソフトウェアのプリフェッチをした場合とプリフェッチをしない場合の検索時間の比較を行った.検索の応答時間の測定では各クエリで10 回ずつ測定して中央値を求めた.キャッシュがない場合と比べてキャッシュがある場合は管理者A で1.5 秒から0.8 秒になり約46.7%の短縮,管理者B で1.7 秒から0.7 秒になり約58.8%の短縮,管理者C で1.5 秒から0.6 秒になり約60.0%短縮した.上記の結果から,管理者が作成する検索クエリの期間が短い方がプリフェッチするログの件数が少ないためキャッシュヒット率が高くなった.プリフェッチした場合の方がプリフェッチしない場合より検索の応答時間が短くなった.また,プリフェッチした期間によって応答時間の変化は見られなかった. ...