\item Index : Indice de la colonne du format de sortie dans laquelle le contenu de cette bande sera écrit.
\item Name : Nom de cette bande.
\item ref/hyp : Le contenu de cette bande est donné (ref) ou prédit (hyp).
\item dict : Le nom du dictionnaire qui contient les valeurs de cette bande.
\item Policy : Le dictionnaire est figé (Final) ou peut évoluer (FromZero) ?
\item Must print ? : Faut-il afficher cette bande dans la sortie ?
\end{enumerate}
\end{frame}
\subsection{Transition Machine ({\tt tm})}
\begin{frame}[fragile]{\tm{}}
Type de fichier qui décrit la Transition Machine.\\
Une telle machine ressemble à un automate, elle comporte des états et des transitions étiquetées qui relient ces états entre eux.\\ A chaque état est associé un classifieur. Exemple :
\footnotesize
\begin{verbatim}
Name : Parser Machine
Dicts : parser.dicts
%CLASSIFIERS
strategy strategy.cla
signature signature.cla
parser parser.cla
%STATES
strategy strategy
signature signature
parser parser
%TRANSITIONS
strategy signature MOVE signature
strategy parser MOVE parser
parser strategy *
signature strategy *
\end{verbatim}
\normalsize
\end{frame}
\begin{frame}[fragile]{\tm{}}
\begin{enumerate}
\item Name : Le nom de la machine.
\item Dicts : Le fichier qui décrit les dictionnaires.
\item CLASSIFIERS : Sur chaque ligne le nom d'un classifieur et le fichier qui le décrit.
\item STATES : Sur chaque ligne le nom d'un état de la machine et le nom du classifieur correspondant.
\item TRANSITIONS : sur chaque ligne on a un état de départ, un état d'arrivée, et l'étiquette sur la transition.
\end{enumerate}
Dans l'exemple donné plus haut, l'état parser s'occupe de construire l'arbre syntaxique, l'état signature appose une signature sur chaque mot (qui comporte des informations sur les parties de discours possibles pour ce mot) et l'état strategy s'occupe de décider à qui il donne la main à un instant t (à parser ou à signature).
\end{frame}
\begin{frame}[fragile]{\tm{}}
Toujours dans le même exemple, l'état initial est strategy car il est définit le premier.\\
\begin{enumerate}
\item On peut passer de l'état strategy à l'état signature avec l'action MOVE signature.
\item On peut passer de l'état strategy à l'état parser avec l'action MOVE parser.
\item On passe de l'état parser à l'état strategy avec n'importe quelle action.
\item On passe de l'état signature à l'état strategy avec n'importe quelle action.
\end{enumerate}
\end{frame}
\subsection{Action Set ({\tt as})}
\begin{frame}[fragile]{\as{}}
Type de fichier qui définit la liste des actions que peut effectuer un classifieur. Exemple :
\footnotesize
\begin{verbatim}
REDUCE
LEFT ccomp
RIGHT ccomp
LEFT dep
RIGHT dep
LEFT cop
RIGHT cop
LEFT conj
RIGHT conj
LEFT iobj
RIGHT iobj
EOS
Default : SHIFT
\end{verbatim}
\normalsize
L'action préfixée par Default : est celle utilisée par defaut quand aucune autre action n'est applicable. Les actions sont ordonnées par priorité décroissante, lorsque 2 actions sont possibles on préfère celle de plus grande priorité.
Ainsi output.txt contiendra la prédiction du parser, on va ensuite ajouter des colonnes vides à cette sortie car le script d'évaluation a besoin de 10 colonnes :
\footnotesize
\begin{verbatim}
../tools/conlluAddMissingColumns.py \
output.txt data/conllu.mcd > output.conllu
\end{verbatim}
\normalsize
Maintenant on utilise un script d'évaluation pour comparer la prédiction et le gold :