Convalida incrociata

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Laconvalida incrociata(cross-validationininglese) è una tecnicastatistica[1]utilizzabile in presenza di una buona numerosità delcampione osservato.In particolare, la convalida incrociata cosiddettak-foldconsiste nella suddivisione dell'insieme di datitotale inkparti di uguale numerosità e, a ogni passo, lakª parte dell'insieme di dati viene a essere quella di convalida, mentre la restante parte costituisce sempre l'insieme di addestramento.Così si addestra il modello per ognuna dellekparti, evitando quindi problemi disovradattamento,ma anche dicampionamentoasimmetrico (e quindi affetto dadistorsione) delcampione osservato,tipico della suddivisione dei dati in due sole parti (ossia addestramento/convalida). In altre parole, si suddivide il campione osservato in gruppi di egual numerosità, si esclude iterativamente un gruppo alla volta e si cerca di predirlo coi gruppi non esclusi, al fine di verificare la bontà del modello di predizione utilizzato.

  1. ^Metodo Cross-validation,susimone.it.URL consultato il 28 ottobre 2009(archiviato dall'url originaleil 25 ottobre 2013).
  • I. Witten, E. Frank:Data Mining: Practical Machine Learning Tools and Techniques,Morgan Kaufmann
  • R. Duda, P. Hart, D. Stork:Pattern Classification,Wiley
  • T. Hastie, R. Tibshirani, J. Friedman:The Elements of Statistical Learning,Springer

Collegamenti esterni

[modifica|modifica wikitesto]