Update Criteres authored by Agata Savary's avatar Agata Savary
...@@ -116,15 +116,19 @@ Il existe cependant des cas où il est difficile de trouver un mot simple pour s ...@@ -116,15 +116,19 @@ Il existe cependant des cas où il est difficile de trouver un mot simple pour s
# Structures non-traitées # Structures non-traitées
On n'annote que les cas où il existe une forme "canonique" (sans extraction, sans modification de type déterminant complexe etc...) où l'EP forme un sous-arbre syntaxique (donc connecté). Par exemple: On n'annote que les cas où
<!-- il existe une forme "canonique" (sans extraction, sans modification de type déterminant complexe etc...) où -->
l'EP forme un sous-arbre syntaxique (donc connecté).
<!-- Par exemple:
- _Luc **met** Lea **en garde**_ : la forme canonique est _mettre en garde_; les 3 composants sont connectés, avec _mettre_ comme racine - _Luc **met** Lea **en garde**_ : la forme canonique est _mettre en garde_; les 3 composants sont connectés, avec _mettre_ comme racine
- _Paul a **pris** une multitude de **décisions** inutiles_: la forme canonique est _prendre une décision_ les deux composants sont connectés - _Paul a **pris** une multitude de **décisions** inutiles_: la forme canonique est _prendre une décision_ les deux composants sont connectés
Ainsi on garde bien les EP admettant des variations syntaxiques comme les constructions à verbe support, même en cas d'extraction du nom, ou de déterminant complexe sur le nom. Ainsi on garde bien les EP admettant des variations syntaxiques comme les constructions à verbe support, même en cas d'extraction du nom, ou de déterminant complexe sur le nom. -->
Cette contrainte implique que l'on ne prend pas des séquences comme _ce N-là_ où les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre
Cette contrainte implique que l'on ne prend pas des séquences comme _ce N-là_ ni _faire du_ dans _faire du INSTRUMENT/SPORT_, car leurs formes canoniques ne forment pas des sous-arbres de dépendances 100% lexicalisés. En particulier: <!-- ni _faire du_ dans _faire du INSTRUMENT/SPORT_, car leurs formes canoniques ne forment pas des sous-arbres de dépendances 100% lexicalisés. En particulier:
- _ce N-là_ : les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre - _ce N-là_ : les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre
- _faire du INSTRUMENT_ comme _faire du (piano+violon+...)_: les deux composants _faire_ et _du_ ne sont pas connectés directement (_faire_ est tête de INSTRUMENT et _du_ est dépendant de INSTRUMENT). - _faire du INSTRUMENT_ comme _faire du (piano+violon+...)_: les deux composants _faire_ et _du_ ne sont pas connectés directement (_faire_ est tête de INSTRUMENT et _du_ est dépendant de INSTRUMENT). -->
# Critères suffisants pour l'identification manuelle d'une EP # Critères suffisants pour l'identification manuelle d'une EP
... ...
......