Kreuzvalidierung

Was ist Kreuzvalidierung?
Die Kreuzvalidierung ist eine Technik, mit der beurteilt wird, wie die Ergebnisse der statistischen Analyse auf einen unabhängigen Datensatz verallgemeinert werden. Die Kreuzvalidierung wird hauptsächlich in Einstellungen verwendet, bei denen das Ziel eine Vorhersage ist und die Genauigkeit der Leistung eines Vorhersagemodells geschätzt werden muss. Der Hauptgrund für die Verwendung der Kreuzvalidierung anstelle der herkömmlichen Validierung besteht darin, dass nicht genügend Daten verfügbar sind, um sie in getrennte Trainings- und Testsätze zu unterteilen (wie bei der herkömmlichen Validierung). Dies führt zu einem Verlust der Test- und Modellierungsfähigkeiten.

Die Kreuzvalidierung wird auch als Rotationsschätzung bezeichnet.

Für ein Vorhersageproblem wird ein Modell im Allgemeinen mit einem Datensatz bekannter Daten versehen, der als Trainingsdatensatz bezeichnet wird, und mit einem Satz unbekannter Daten, gegen die das Modell getestet wird, bekannt als der Testdatensatz. Ziel ist es, einen Datensatz zum Testen des Modells in der Trainingsphase zu haben und dann einen Einblick zu geben, wie sich das spezifische Modell an einen unabhängigen Datensatz anpasst.

Eine Runde der Kreuzvalidierung umfasst die Partitionierung von Daten in komplementäre Teilmengen und dann die Analyse einer Teilmenge. Danach wird die Analyse für andere Teilmengen (Testsätze) validiert. Um die Variabilität zu reduzieren, werden viele Runden der Kreuzvalidierung unter Verwendung vieler verschiedener Partitionen durchgeführt, und dann wird ein Durchschnitt der Ergebnisse genommen. Kreuzvalidierung ist eine leistungsfähige Technik bei der Schätzung der Modellleistungstechnik.


War die Erklärung zu "Kreuzvalidierung" hilfreich? Jetzt bewerten:

Weitere Erklärungen zu