... | ... | @@ -14,6 +14,14 @@ PARSEME-FR annotation guidelines - v1.0 |
|
|
|
|
|
|
|
|
## Introduction
|
|
|
|
|
|
#### Verbal expressions
|
|
|
|
|
|
**Verbal** multi-word expressions were the focus of the [_PARSEME shared task 1.1 (2018)_](http://multiword.sourceforge.net/sharedtask2018/), organized within the international PARSEME (COST) project. The [PARSEME v1.1 guide for verbal MWEs](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1) was designed and used to produce annotations for 20 languages, including French . For French, the PARSEME dataset for French comprised the [Sequoia corpus](https://deep-sequoia.inria.fr/) and the [UD_French-GSD corpus](https://github.com/UniversalDependencies/UD_French-GSD/blob/master/README.md). For PARSEME-FR, we have thus focused on other MWEs (non verbal MWEs), and extended the annotations the Sequoia corpus. Members of the French spin-off project PARSEME-FR were much involved in the multilingual PARSEME guide, so both guides are similar in spirit.
|
|
|
|
|
|
|
|
|
<!--Les expressions polylexicales **verbales** ont été traitées à part, dans le projet PARSEME international, dans le cadre de la production des corpus pour la [_PARSEME shared task 1.1 (2018)_](http://multiword.sourceforge.net/sharedtask2018/). Ainsi, nous avons adopté le guide externe [PARSEME v.1.1](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1) pour l'identification des expressions verbales. Les membres du projet français PARSEME-FR ont été très impliqués dans le projet international PARSEME et notamment dans la rédaction du guide d'annotation d'expressions verbales. Par conséquent, les deux guides, PARSEME (expressions verbales) et PARSEME-FR (expressions non verbales) sont compatibles et similaires dans l'esprit.-->
|
|
|
|
|
|
#### Nominal expressions
|
|
|
For **nominal multi-word expressions**, we use a primary distinction concerning the naming convention that links the expression and the entity or entities the expression can refer to. The starting intuition is that one can distinguish:
|
|
|
- (1) **entity names** : some nominal MWEs work as the **direct name of a specific entity** (for instance *Anna Duval*)
|
... | ... | @@ -51,9 +59,7 @@ Note that from this difference, it follows that dictionaries usually differentia |
|
|
Bien que cette distinction entre dénomination directe vs par description classifiante soit plus une distinction logique que linguistique, on la juge utile d'un point de vue applicatif et utile dans la manière d'appliquer les tests. En effet malgré des similitudes dans certains tests, on ne va pas forcément insister sur les mêmes difficultés dans les deux cas.
|
|
|
-->
|
|
|
|
|
|
#### Verbal expressions
|
|
|
|
|
|
Les expressions polylexicales **verbales** ont été traitées à part, dans le projet PARSEME international, dans le cadre de la production des corpus pour la [_PARSEME shared task 1.1 (2018)_](http://multiword.sourceforge.net/sharedtask2018/). Ainsi, nous avons adopté le guide externe [PARSEME v.1.1](http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1) pour l'identification des expressions verbales. Les membres du projet français PARSEME-FR ont été très impliqués dans le projet international PARSEME et notamment dans la rédaction du guide d'annotation d'expressions verbales. Par conséquent, les deux guides, PARSEME (expressions verbales) et PARSEME-FR (expressions non verbales) sont compatibles et similaires dans l'esprit.
|
|
|
|
|
|
## Top decision tree
|
|
|
On a ainsi organisé le présent guide en deux sous-parties, une pour les noms d'entités (le guide des "entités nommées", ci-après **EN**, restreint en outre à certains types sémantiques pré-définis: personne, organisation, lieu, produit humain et évènement) et un autre guide pour les expressions non verbales (ci-après simplement **EP**).
|
... | ... | |