Definizione Stop Words
Le stop words sono parole di uso comune (come “in”, “a”, “la”, “dentro”) che vengono filtrate prima dell’elaborazione dei dati in linguaggio naturale. Vengono rimossi perché: le Stop Words non aggiungono significato.
Parole come “in”, “a”, “la”, “dentro” sono usate molto frequentemente, ma non forniscono contesto o contenuto.
Le Stop Words possono distorcere i risultati di ricerca, se non rimosse, queste parole estremamente comuni possono far sembrare alcuni documenti più importanti solo perché capita di usare le parole più frequentemente.
Il SEO, guidando il copy, rimuove queste parole non importanti, altre parole/frasi più significative hanno la possibilità di emergere.
Alcune parole di arresto comuni in italiano includono:
- un, un, il
- dentro, su, a
- per, di, con, di
- è, sono, sono
- essere, stato, essere
- come, così, tale
- e, o, ma
- se, allora, altro
- perché, dunque
- sebbene, sebbene, comunque
- da, sopra, sotto
- io, tu, lui, lei, noi, loro
- questo quello Questi quelli
- anche a due
- caro, per favore, grazie, sinceramente
La rimozione delle parole non significative è un importante passaggio di pre-elaborazione in molte attività di elaborazione del linguaggio naturale come:
- Classificazione del testo,
- Analisi del sentiment del testo,
- Raggruppamento di documenti
- Modellazione di argomenti
Google e gli altri motori di ricerca ormai sono in grado di elinare dalle loro analisi autonomamente le “stop Words”.
Blu7 Agenzia Seo e Ottimizzazione Contenuti per Posizionamento nei motori di Ricerca.