Definizione di Mixture of Experts
Mixture of Experts è un’architettura in cui un modello AI è composto da molti sotto-modelli specializzati (“esperti”), e per ogni richiesta solo una piccola parte si “accende”: quelli più adatti al compito. È come avere un team di consulenti: parla solo chi sa rispondere, gli altri restano in attesa. Il risultato pratico è che il modello complessivo può essere molto grande (centinaia di miliardi di parametri) ma il costo di ogni risposta resta basso, perché non viene attivata tutta la struttura. Molti modelli di punta del 2025-2026 usano MoE, ed è una delle ragioni per cui la qualità è salita senza far esplodere i costi.
Vedi anche: Transformer, Parametri, Inferenza