Sock Shopにおける内部トラフィックの取得とCPU使用率の比較による応答時間の増加の原因の特定

マイクロサービスアーキテクチャを用いてEC サイトのアプリケーションを運用する事例がある.その際,アプリケーション内の1つのマイクロサービスの応答時間が増加することがあり,他のマイクロサービスの応答時間も増加する.その中で,原因となるマイクロサービスの特定を行うことが困難であることが今回の課題である.本稿の提案手法ではKialiAPI を用いてアプリケーション内の各マイクロサービスのトラフィックを取得することで通信経路を把握する.その後,負荷試験から各エンドポイントの応答時間から原因の候補の選定を行い,各マイクロサービスのCPU 使用率のメトリクスを取得し比較することでアプリケーションの応答時間増加の原因となるマイクロサービスを特定する.対象のアプリケーションであるSock Shop と提案手法の機能を持つソフトウェアをK3s クラスタに実装して実験を行う.実験ではアクセス集中によって応答時間を増加させる8 個のテストシナリオを用いて特定の精度を確かめる評価実験を行い,6 つのシナリオで正確な特定が行われ,75.0%の精度で特定を行うことができた. ...