... | ... | @@ -5,7 +5,16 @@ |
|
|
PARSEME-FR annotation guidelines - v1.0
|
|
|
-------------------
|
|
|
|
|
|
### Expressions nominales
|
|
|
- [Notations](notations)
|
|
|
- [Interaction with tokenization](tokenisation)
|
|
|
- [Top decision tree](Guide-annotation-PARSEME_FR-chapeau#Top_decision_tree), which serves to direct the annotator to either
|
|
|
- [the PARSEME v.1.1 guide for **verbal** MWE (external link)](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1)
|
|
|
- [Guide PARSEME-FR d'identification des expressions polylexicales (EP) non verbales](Criteres)
|
|
|
- [Guide PARSEME-FR d'identification des entités nommées (EN)](ep_et_en)
|
|
|
|
|
|
|
|
|
### Introduction
|
|
|
#### Nominal expressions
|
|
|
Pour les **expressions polylexicales nominales**, on considère une première distinction concernant la convention de nommage liant l'expression et la ou les entités auxquelles elle peut référer. L’intuition de départ est que
|
|
|
- (1) certaines unités polylexicales nominales fonctionnent comme des **noms directs d’entités spécifiques** (par ex. *Anna Duval*)
|
|
|
- (2) versus comme le nom d’un concept, qui peut être utilisé pour désigner des instances de ce concept (*arme blanche*).
|
... | ... | @@ -37,19 +46,13 @@ Pour les cas de type (1c), les tests linguistiques sont plus proches du cas (2), |
|
|
Bien que cette distinction entre dénomination directe vs par description classifiante soit plus une distinction logique que linguistique, on la juge utile d'un point de vue applicatif et utile dans la manière d'appliquer les tests. En effet malgré des similitudes dans certains tests, on ne va pas forcément insister sur les mêmes difficultés dans les deux cas.
|
|
|
-->
|
|
|
|
|
|
### Expressions verbales
|
|
|
#### Verbal expressions
|
|
|
|
|
|
Les expressions polylexicales **verbales** ont été traitées à part, dans le projet PARSEME international, dans le cadre de la production des corpus pour la [_PARSEME shared task 1.1 (2018)_](http://multiword.sourceforge.net/sharedtask2018/). Ainsi, nous avons adopté le guide externe [PARSEME v.1.1](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1) pour l'identification des expressions verbales. Les membres du projet français PARSEME-FR ont été très impliqués dans le projet international PARSEME et notamment dans la rédaction du guide d'annotation d'expressions verbales. Par conséquent, les deux guides, PARSEME (expressions verbales) et PARSEME-FR (expressions non verbales) sont compatibles et similaires dans l'esprit.
|
|
|
|
|
|
### Organisation du guide
|
|
|
### Top decision tree
|
|
|
On a ainsi organisé le présent guide en deux sous-parties, une pour les noms d'entités (le guide des "entités nommées", ci-après **EN**, restreint en outre à certains types sémantiques pré-définis: personne, organisation, lieu, produit humain et évènement) et un autre guide pour les expressions non verbales (ci-après simplement **EP**).
|
|
|
|
|
|
Le guide est donc découpé comme suit:
|
|
|
- [Notations](notations)
|
|
|
- [Interaction avec la tokenisation](tokenisation)
|
|
|
- [Guide PARSEME v.1.1 d'identification des EP verbales (lien externe)](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1)
|
|
|
- [Guide PARSEME-FR d'identification des expressions polylexicales (EP) non verbales](Criteres)
|
|
|
- [Guide PARSEME-FR d'identification des entités nommées (EN)](ep_et_en)
|
|
|
|
|
|
Nous mettons aussi à disposition une liste de [cas difficiles tranchés grâce aux critères](cas_deja_traites)
|
|
|
|
... | ... | |