... | ... | @@ -26,6 +26,23 @@ L'utilisation de critères suffisants est voulue comme une solution au problème |
|
|
|
|
|
Nous avons recensé [quelques cas déjà tranchés grâce aux critères ci-dessous](cas_deja_traites), pour accélérer et uniformiser l'annotation.
|
|
|
|
|
|
# Structures non-traitées
|
|
|
|
|
|
On n'annote que les cas où l'EP forme un sous-arbre syntaxique (donc connecté). Cette contrainte implique que l'on ne prend pas des séquences comme _ce N-là_ où les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre.
|
|
|
|
|
|
<!-- il existe une forme "canonique" (sans extraction, sans modification de type déterminant complexe etc...) où -->
|
|
|
<!-- Par exemple:
|
|
|
- _Luc **met** Lea **en garde**_ : la forme canonique est _mettre en garde_; les 3 composants sont connectés, avec _mettre_ comme racine
|
|
|
- _Paul a **pris** une multitude de **décisions** inutiles_: la forme canonique est _prendre une décision_ les deux composants sont connectés
|
|
|
|
|
|
Ainsi on garde bien les EP admettant des variations syntaxiques comme les constructions à verbe support, même en cas d'extraction du nom, ou de déterminant complexe sur le nom. -->
|
|
|
|
|
|
|
|
|
<!-- ni _faire du_ dans _faire du INSTRUMENT/SPORT_, car leurs formes canoniques ne forment pas des sous-arbres de dépendances 100% lexicalisés. En particulier:
|
|
|
- _ce N-là_ : les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre
|
|
|
- _faire du INSTRUMENT_ comme _faire du (piano+violon+...)_: les deux composants _faire_ et _du_ ne sont pas connectés directement (_faire_ est tête de INSTRUMENT et _du_ est dépendant de INSTRUMENT). -->
|
|
|
|
|
|
|
|
|
# Quels composants annoter?
|
|
|
|
|
|
### Elements lexicalisés
|
... | ... | @@ -122,21 +139,6 @@ Il existe cependant des cas où il est difficile de trouver un mot simple pour s |
|
|
(fin catégorisation morphosyntaxique)
|
|
|
-->
|
|
|
|
|
|
# Structures non-traitées
|
|
|
|
|
|
On n'annote que les cas où l'EP forme un sous-arbre syntaxique (donc connecté). Cette contrainte implique que l'on ne prend pas des séquences comme _ce N-là_ où les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre.
|
|
|
|
|
|
<!-- il existe une forme "canonique" (sans extraction, sans modification de type déterminant complexe etc...) où -->
|
|
|
<!-- Par exemple:
|
|
|
- _Luc **met** Lea **en garde**_ : la forme canonique est _mettre en garde_; les 3 composants sont connectés, avec _mettre_ comme racine
|
|
|
- _Paul a **pris** une multitude de **décisions** inutiles_: la forme canonique est _prendre une décision_ les deux composants sont connectés
|
|
|
|
|
|
Ainsi on garde bien les EP admettant des variations syntaxiques comme les constructions à verbe support, même en cas d'extraction du nom, ou de déterminant complexe sur le nom. -->
|
|
|
|
|
|
|
|
|
<!-- ni _faire du_ dans _faire du INSTRUMENT/SPORT_, car leurs formes canoniques ne forment pas des sous-arbres de dépendances 100% lexicalisés. En particulier:
|
|
|
- _ce N-là_ : les 2 composants _ce_ et _là_ dépendraient syntaxiquement du N, qui lui n'est pas figé, donc les 2 composants ne forment pas formellement un sous-arbre
|
|
|
- _faire du INSTRUMENT_ comme _faire du (piano+violon+...)_: les deux composants _faire_ et _du_ ne sont pas connectés directement (_faire_ est tête de INSTRUMENT et _du_ est dépendant de INSTRUMENT). -->
|
|
|
|
|
|
# Critères suffisants pour l'identification manuelle d'une EP
|
|
|
|
... | ... | |