Einzelheiten des Autopilot-Auftrags Bericht über die Qualität des Modells

Leistungsbericht des Modells

Ein Amazon- SageMaker Modellqualitätsbericht (auch als Leistungsbericht bezeichnet) liefert Erkenntnisse und Qualitätsinformationen für den besten Modellkandidaten, der von einem AutoML-Auftrag generiert wird. Dazu gehören Informationen über die Auftragsdetails, den Modellproblemtyp, die Zielfunktion und verschiedene Kennzahlen. In diesem Abschnitt wird der Inhalt eines Leistungsberichts für Probleme mit der Bildklassifizierung beschrieben und es wird erklärt, wie Sie auf die Metriken als Rohdaten in einer JSON-Datei zugreifen können.

Das Amazon S3-Präfix für die Artefakte des Modellqualitätsberichts, die für den besten Kandidaten generiert wurden, finden Sie in der Antwort auf DescribeAutoMLJobV2 unter BestCandidate.CandidateProperties.CandidateArtifactLocations.ModelInsights.

Der Leistungsbericht besteht aus zwei Abschnitten:

Der erste Abschnitt enthält Einzelheiten über den Autopilot-Auftrag, bei dem das Modell hergestellt wurde.
Der zweite Abschnitt enthält einen Bericht zur Modellqualität mit verschiedenen Leistungskennzahlen.

Einzelheiten des Autopilot-Auftrags

Dieser erste Abschnitt des Berichts enthält einige allgemeine Informationen über den Autopilot-Auftrag, der das Modell hervorgebracht hat. Diese Angaben umfassen die folgenden Informationen:

Name des Autopilot-Kandidaten: Der Name des besten Modellkandidaten.
Name des Autopilot-Auftrags: Der Name des Auftrags.
Problemtyp: Der Problemtyp. In unserem Fall Bildklassifizierung.
Objektive Metrik: Die objektive Metrik, die zur Optimierung der Leistung des Modells verwendet wird. In unserem Fall Genauigkeit.
Optimierungsrichtung: Gibt an, ob die Zielmetrik minimiert oder maximiert werden soll.

Bericht über die Qualität des Modells

Informationen zur Modellqualität werden durch Einblicke in Autopilot-Modelle generiert. Der Inhalt des Berichts, der generiert wird, hängt von der Art des Problems ab, mit dem er sich befasst hat. Der Bericht gibt die Anzahl der Zeilen an, die im Bewertungsdatensatz enthalten waren, und den Zeitpunkt, zu dem die Auswertung stattfand.

Tabellen mit Metriken

Der erste Teil des Modellqualitätsberichts enthält Metriktabellen. Diese sind für die Art des Problems geeignet, das mit dem Modell behoben wurde.

Die folgende Abbildung zeigt ein Beispiel für eine von Autopilot generierte Metriktabelle für ein Problem mit der Bild- oder Textklassifizierung. Es zeigt den Namen, den Wert und die Standardabweichung der Metrik.

Beispiel für einen Bericht über Amazon SageMaker Autopilot Model Insights-Image- oder Textklassifizierungsmetriken.

Informationen zur Leistung grafischer Modelle

Der zweite Teil des Modellqualitätsberichts enthält grafische Informationen, die Ihnen bei der Bewertung der Modellleistung helfen. Der Inhalt dieses Abschnitts hängt vom ausgewählten Problemtyp ab.

Verwechslungsmatrix

Eine Konfusionsmatrix bietet eine Möglichkeit, die Genauigkeit der Vorhersagen zu visualisieren, die von einem Modell für die binäre und die Mehrklassenklassifizierung für verschiedene Probleme getroffen wurden.

Eine Zusammenfassung der in der Grafik enthaltenen Komponenten Falsch-Positiv-Rate (FPR) und True-Positiv-Rate (TPR) ist wie folgt definiert.

Richtige Voraussagen
- Richtig positiv (TP): Der vorausgesagte Wert ist 1, und der richtige Wert ist 1.
- Richtig negativ (TN): Der vorausgesagte Wert ist 0, und der richtige Wert ist 0.
Falsche Voraussagen
- Falsch positiv (FP): Der vorausgesagte Wert ist 1, und der richtige Wert ist 0.
- Falsch Negative (FN): hat den Wert 0 vorausgesagt, aber der tatsächliche Wert ist 1.

Die Konfusionsmatrix im Modellqualitätsbericht enthält Folgendes.

Die Anzahl und der Prozentsatz der richtigen und falschen Vorhersagen für die tatsächlichen Labels
Die Anzahl und der Prozentsatz der genauen Vorhersagen auf der Diagonale von der oberen linken zur unteren rechten Ecke
Die Anzahl und der Prozentsatz der ungenauen Vorhersagen auf der Diagonale von der oberen rechten zur unteren linken Ecke

Die falschen Vorhersagen in einer Konfusionsmatrix sind die Konfusionswerte.

Das folgende Diagramm ist ein Beispiel für eine Konfusionsmatrix für ein Mehrklassen-Klassifizierungsproblem. Die Verwechslungsmatrix im Modellqualitätsbericht enthält Folgendes.

Die vertikale Achse ist in drei Zeilen unterteilt, die drei unterschiedliche tatsächliche Bezeichnungen enthalten.
Die horizontale Achse ist in drei Spalten unterteilt, die Bezeichnungen enthalten, die vom Modell vorhergesagt wurden.
Der Farbbalken weist einer größeren Anzahl von Stichproben einen dunkleren Farbton zu, um die Anzahl der Werte, die in jeder Kategorie klassifiziert wurden, visuell darzustellen.

Im folgenden Beispiel hat das Modell die tatsächlichen 354 Werte für Bezeichnung f, 1094 Werte für Bezeichnung i und 852 Werte für Bezeichnung m korrekt vorhergesagt. Der Unterschied im Ton weist darauf hin, dass der Datensatz nicht ausgewogen ist, da es für den Wert i viel mehr Bezeichnungen gibt als für f oder m.

Beispiel für eine Konfusionsmatrix mit mehreren Klassen in Amazon SageMaker Autopilot.

Die Verwechslungsmatrix im bereitgestellten Modellqualitätsbericht bietet Platz für maximal 15 Bezeichnungen für Problemtypen bei der Mehrklassen-Klassifizierung. Wenn eine Zeile, die einer Bezeichnung entspricht, einen Nan Wert enthält, bedeutet dies, dass der Validierungsdatensatz, der zur Überprüfung der Modellvorhersagen verwendet wurde, keine Daten mit dieser Beschriftung enthält.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Bericht zur Erklärbarkeit

Erstellen eines Textklassifizierungsauftrags mit der AutoML-API