(Autor: Adam Przepiórkowski)
Znaczniki morfosyntaktyczne, tzw. tagi, przypisane są segmentom (tokenom, w przybliżeniu słowom). Segmenty nie są dłuższe niż słowa ortograficzne (słowa ’od spacji do spacji’), ale w niektórych wypadkach segmenty mogą być krótsze niż takie słowa:
Nie są natomiast dzielone skrótowce zawierające łącznik sygnalizujący odmianę, np. PRL-u.
Z powyższych zasad wynika, że segmentacja tekstu w 1. wygląda tak, jak to przedstawiono w 2.