Definizione di Dataset
Un dataset è un insieme strutturato di dati (testi, immagini, audio, numeri) usato per addestrare o valutare un modello AI. La qualità del dataset è il fattore più sottovalutato e più decisivo: un modello, per quanto sofisticato, eredita gli errori, i pregiudizi e le lacune dei dati con cui ha imparato. Per questo si parla di “pulizia del dataset” e di “data curation” come professione a sé. Un piccolo dataset ben costruito spesso batte un grande dataset disordinato. Per una scuola che vuole creare un assistente sui propri materiali, o per una PMI che vuole automatizzare le risposte commerciali, lavorare sulla qualità dei dati di partenza è il primo investimento sensato.
Vedi anche: Addestramento, Fine-tuning, Bias algoritmico