分散トレーシングのためのログ検索の高速化

分散トレーシングは,マイクロサービスアーキテクチャでログによる動作の解析を実現する.Scatter-Gather パターンは,トラフィックや期間が増えるにつれ件数が増加する大量のログを高速に検索する手法である.Scatter-Gather パターンの課題は,検索クエリによるログデータへのアクセス傾向と,Scatter-Gather パターンのリーフノードへのログデータの配置の不一致である.これにより,一部のリーフノードへディスクアクセスが偏り検索の応答時間が遅延する.本研究では,システム管理者による特定の条件による絞り込みや,特定のリクエストID をもつログの絞り込みに着目した.提案手法は,条件にもとづき同一の属性をもつログをクラスタリングし,時系列の昇順でソートする.その後,ソートしたデータを固定長のブロックに分割し,属性ごとにリーフノードへまとめて配置する.これにより,分散トレーシングでの検索クエリに着目した高速なログ検索を実現する. ...