2. ログエントリの表示
特定のログ行を見る前に、これまでに行ったことと、可観測性の 3 本柱に基づいてなぜここにいるのかを簡単に振り返ってみましょう:
メトリクス | トレース | ログ |
---|---|---|
問題がありますか? | 問題はどこですか? | 問題は何ですか? |
- メトリクスを使用して、アプリケーションに問題があることを特定しました。これはサービスダッシュボードのエラー率が、あるべき値よりも高かったことから明らかでした。
- トレースとスパンタグを使用して、問題がどこにあるかを見つけました。paymentserviceには
v350.9
とv350.10
の 2 つのバージョンがあり、v350.10
のエラー率は 100% でした。 - paymentserviceの
v350.10
からのこのエラーが、複数の再試行とオンラインブティックのチェックアウトからの応答の長い遅延を引き起こしたことを確認しました。 - トレースから、関連コンテンツの力を使用して、失敗したpaymentserviceバージョンのログエントリに到達しました。これで、問題が何であるかを特定できます。
演習
おめでとうございます
Splunk Observability Cloud を正常に使用して、オンラインブティックでショッピング中に不良なユーザーエクスペリエンスを体験した理由を理解しました。RUM、APM、ログを使用して、サービス環境で何が起こったかを理解し、その後、可観測性の 3 本柱であるメトリクス、トレース、ログに基づいて根本原因を見つけました。
また、アプリケーションの動作パターンを検出するためにTag Spotlightでインテリジェントなタグ付けと分析を使用する方法と、問題のコンテキストを維持しながら異なるコンポーネント間を迅速に移動するために関連コンテンツのフルスタック相関パワーを使用する方法も学びました。
ワークショップの次のパートでは、問題発見モードから緩和、防止、プロセス改善モードに移行します。
次は、カスタムダッシュボードでのログチャートの作成です。