テキストに含まれる定義した文字列の検出によるファイルのログタイプの特定時間の短縮

ログはシステムの障害対応に使用される.ログの管理や検索にはElasticsearch を使用する.ログファイルを収集するためにFilebeat を使用し,収集したログはLogstash で変換され,Kibana で可視化する.Filebeat の設定では収集対象のログのファイルパスとタイプの指定を行う必要がある.課題は,ログタイプの種類を把握していない場合に管理者はログタイプの種類を調べる必要があり,特定までに時間を要することである.提案手法は,管理者が入力したファイル内テキストに定義した文字列をもとに,ログタイプを特定する.すべての行にstdout またはstderr が検出された場合,ログタイプをContainer と特定し,すべての行にホスト名,プロセス名とプロセスID が連続しているプロセス識別子が検出された場合,ログタイプをSyslog と特定する.ログタイプがContainer とSyslog ではない場合ログタイプをFilestream と特定する.3 人の学生を評価対象とし,提案ソフトウェア使用前と使用後のログタイプの特定開始から提示されたコマンドに特定したログタイプを記入するまでの時間を評価した.提案ソフトウェアを使用せずに18 個のファイルのログタイプを特定してもらい,ログタイプの特定開始から提示されたコマンドに特定したログタイプを入力するまでの時間を計測した.18 個のファイルのログタイプの特定に要した3 人の学生の平均時間は約319 秒であり,特定したログタイプは実際のログタイプとすべて一致していた.3 人の学生の提案ソフトウェア使用前と使用後の18 個のファイルのログタイプの特定に要した平均時間は約319秒から約46 秒で約273 秒短縮し,約85.6%削減した.提案ソフトウェアを使用した場合もログタイプは実際のログタイプとすべて一致していた. ...