Convalida incrociata
Laconvalida incrociata(cross-validationininglese) è una tecnicastatistica[1]utilizzabile in presenza di una buona numerosità delcampione osservato.In particolare, la convalida incrociata cosiddettak-foldconsiste nella suddivisione dell'insieme di datitotale inkparti di uguale numerosità e, a ogni passo, lakª parte dell'insieme di dati viene a essere quella di convalida, mentre la restante parte costituisce sempre l'insieme di addestramento.Così si addestra il modello per ognuna dellekparti, evitando quindi problemi disovradattamento,ma anche dicampionamentoasimmetrico (e quindi affetto dadistorsione) delcampione osservato,tipico della suddivisione dei dati in due sole parti (ossia addestramento/convalida). In altre parole, si suddivide il campione osservato in gruppi di egual numerosità, si esclude iterativamente un gruppo alla volta e si cerca di predirlo coi gruppi non esclusi, al fine di verificare la bontà del modello di predizione utilizzato.
Note
[modifica|modifica wikitesto]- ^Metodo Cross-validation,susimone.it.URL consultato il 28 ottobre 2009(archiviato dall'url originaleil 25 ottobre 2013).
Bibliografia
[modifica|modifica wikitesto]- I. Witten, E. Frank:Data Mining: Practical Machine Learning Tools and Techniques,Morgan Kaufmann
- R. Duda, P. Hart, D. Stork:Pattern Classification,Wiley
- T. Hastie, R. Tibshirani, J. Friedman:The Elements of Statistical Learning,Springer
Voci correlate
[modifica|modifica wikitesto]Altri progetti
[modifica|modifica wikitesto]- Wikimedia Commonscontiene immagini o altri file suconvalida incrociata
Collegamenti esterni
[modifica|modifica wikitesto]- (EN)Cross-Validation tutorial by Andrew Moore, Carnegie Mellon University, Stati Uniti,suautonlab.org.URL consultato il 28 ottobre 2009(archiviato dall'url originaleil 16 aprile 2010).