MA2.3
Das KI-System muss in Entwicklung und Betrieb überwacht werden (können)
Menschliche Aufsicht und Kontrolle
Menschliche Aufsicht
Maßnahme
System

AccuracyRecallPrecisionF1-ScoreFalse Positive RateFalse Negative RateTrue Positive RateTrue Negative RateFalse Omission RateMatthews correlation coeffictientROC-AUCCalibration ErrorBrier ScoreCohen Kappa scoreR2RMSEMAEMAPEmAPIoUmIoUPanoptic QualityMutual information scoreHomogeneity ScoreSilhouette ScoreMahalanobis DistanceWasserstein metricDICE ScoreHOTA (Higher Order Tracking Accuracy)MMLUBoolQOpenBookQATruthfulQAHellaSwagQuACNaturalQuestionsNarrativeQAXSUMCNN/DailyMailIMDBRAFTGSM8KMATHAPPSLSATHumanEvalLegalBenchData imputationROUGEBLEUStructural similarity index measure (SSIM)Fréchet Inception Distance (FID)Inception ScoreCIDEr: Consensus-based Image Description EvaluationCosine SimilartiyCLIP Image Quality AssessmentCLIP scoreSignal-to-Noise Ratio (SNR)Perceptual evaluation of Speech Quality (PESQ)Short-Time Objective Intelligibility (STOI)Fuzzy TestingNeuron CoverageOut-of-distribution (OOD) generalizationMonte Carlo DropoutStatistical ParityEqualized OddsPredictive Rate ParityAccuracy EqualityEqual OpportunityError rate balanceFraction of toxic outputGender-based Illicit Proximity EstimateCoverage ErrorAdversial accuracyTime until Adversary's SucessMinimum Distortion Radius Success Rate of Membership Inference AttacksSuccess Rate of Data Poisoning AttacksSucess Rate of Backdoor AttacksSucess Rate of Label Poisoning AttacksAmount of leaked informationEntity - and referential IntegrityDomain integrityData concistencyData timelinessData validityKolmogorov-Smirnov Test for Drift DistributionPopulation Stability IndexPage-Hinkley Testk-Projection CoverageCombinatorial TestingMaximum Mean Discrepancy

In Tabelle anzeigen

Observablen

Qualitätslevels A bis D

Tech. Maßnahme - Betrieb Eine kontinuierliche Überwachung muss für die Implementierung des KI-Systems vorgesehen sein und auf Basis entsprechender Protokollierung (siehe TR1.7) umgesetzt werden können. Dies beinhaltet die Erprobung folgenden Möglichkeiten:

  • Monitoring der Leistung inklusive einer Überwachung der Modelle und Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis)
  • Monitoring von Verzerrungen inklusive einer Überwachung der Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis) im Kontext der Vermeidung von ungerechtfertigter Diskriminierung und Verzerrungen
  • Durchführung von Tests (z.B. Sanity Checks), die im Rahmen des Monitorings eingesetzt werden, um etwa Model und Concept Drift oder auch schädliche Eingabedaten zu erkennen
  • Falls anwendbar, Durchführung von Tests zur Erkennung von Missbrauch und schädlichen Eingabedaten
  • Ggf. Qualitätsüberprüfung der sich erweiternden Trainingsdatenbasis

Organisatorische Maßnahme - Systemnahe Prozesse Zusätzlich zur technischen Ermöglichung des Monitorings sollten die folgenden Aspekte vorbereitet werden:

  • Konzept zur (automatischen) Überwachung und -prüfung größerer Veränderungen am KI-System, inklusive bei Soft- und Hardware-Komponenten, aber insbesondere im Fall von Online Learning
  • Empfohlene Tests müssen als Teil eines kontinuierlichen Testplans dokumentiert sein, insbesondere im Fall von Online Learning
  • Falls möglich, Mechanismen in Form sinnvoller Definition von Schwellwerten bzw. Szenarien, bei denen (menschliche) Überprüfung und Mitigationsmaßnahmen eintreten sollten
  • Mechanismen zum Teilen von neuen Informationen über mögliche sicherheitsrelevante Vorfälle und ihrer Vermeidung

Tech. Maßnahme - Betrieb Eine kontinuierliche Überwachung muss für die Implementierung des KI-Systems vorgesehen sein und auf Basis entsprechender Protokollierung (siehe TR1.7) umgesetzt werden können. Dies beinhaltet die folgenden Möglichkeiten:

  • Monitoring der Leistung inklusive einer Überwachung der Modelle und Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis)
  • Monitoring von Verzerrungen inklusive einer Überwachung der Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis) im Kontext der Vermeidung von ungerechtfertigter Diskriminierung und Verzerrungen
  • Durchführung von Tests (z.B. Sanity Checks), die im Rahmen des Monitorings eingesetzt werden, um etwa Model und Concept Drift, oder auch schädliche Eingabedaten zu erkennen

Organisatorische Maßnahme - Systemnahe Prozesse Zusätzlich zur technischen Ermöglichung des Monitorings sollten die folgenden Aspekte vorbereitet werden:

  • Konzept zur (automatischen) Überwachung und -prüfung größerer Veränderungen am KI-System, inklusive bei Soft- und Hardware-Komponenten, aber insbesondere im Fall von Online Learning
  • Empfohlene Tests müssen als Teil eines kontinuierlichen Testplans dokumentiert sein, insbesondere im Fall von Online Learning

Tech. Maßnahme - Betrieb Eine kontinuierliche Überwachung muss für die Implementierung des KI-Systems vorgesehen sein und auf Basis entsprechender Protokollierung (siehe TR1.7) umgesetzt werden können. Dies beinhaltet die folgenden Möglichkeiten:

  • Monitoring der Leistung inklusive einer Überwachung der Modelle und Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis)
  • Monitoring von Verzerrungen inklusive einer Überwachung der Daten (d.h. einkommende Produktionsdaten und ggf. sich erweiternde Trainingsdatenbasis) im Kontext der Vermeidung von ungerechtfertigter Diskriminierung und Verzerrungen
  • Durchführung von Tests (z.B. Sanity Checks), die im Rahmen des Monitorings eingesetzt werden, um etwa Model und Concept Drift, oder auch schädliche Eingabedaten zu erkennen