2. ログエントリの表示

特定のログ行を見る前に、これまでに行ったことと、可観測性の 3 本柱に基づいてなぜここにいるのかを簡単に振り返ってみましょう:

メトリクストレースログ
問題がありますか?問題はどこですか?問題は何ですか?
  • メトリクスを使用して、アプリケーションに問題があることを特定しました。これはサービスダッシュボードのエラー率が、あるべき値よりも高かったことから明らかでした。
  • トレースとスパンタグを使用して、問題がどこにあるかを見つけました。paymentserviceにはv350.9v350.10の 2 つのバージョンがあり、v350.10のエラー率は 100% でした。
  • paymentservicev350.10からのこのエラーが、複数の再試行とオンラインブティックのチェックアウトからの応答の長い遅延を引き起こしたことを確認しました。
  • トレースから、関連コンテンツの力を使用して、失敗したpaymentserviceバージョンのログエントリに到達しました。これで、問題が何であるかを特定できます。
演習
  • ログテーブルのエラーエントリをクリックします(リストに別のサービスからのまれなエラーもある場合は、hostname: "paymentservice-xxxx"と表示されていることを確認してください)。

メッセージに基づいて、問題を解決するために開発チームに何を伝えますか?

開発チームは、有効な API トークンでコンテナを再構築してデプロイするか、v350.9にロールバックする必要があります

ログメッセージ ログメッセージ

  • ログメッセージペインのXをクリックして閉じます。
おめでとうございます

Splunk Observability Cloud を正常に使用して、オンラインブティックでショッピング中に不良なユーザーエクスペリエンスを体験した理由を理解しました。RUM、APM、ログを使用して、サービス環境で何が起こったかを理解し、その後、可観測性の 3 本柱であるメトリクストレースログに基づいて根本原因を見つけました。

また、アプリケーションの動作パターンを検出するためにTag Spotlightインテリジェントなタグ付けと分析を使用する方法と、問題のコンテキストを維持しながら異なるコンポーネント間を迅速に移動するために関連コンテンツフルスタック相関パワーを使用する方法も学びました。

ワークショップの次のパートでは、問題発見モードから緩和防止プロセス改善モードに移行します。

次は、カスタムダッシュボードでのログチャートの作成です。

OSZAR »