|
|
**`THIS PAGE BELONGS TO THE` _`PUBLIC`_ `DOC OF PARSEME-FR`**
|
|
|
|
|
|
(4) Figement lexical: le critère de la rupture paradigmatique
|
|
|
-------------------
|
|
|
|
|
|
[Retour aux critères des EP](Criteres)
|
|
|
|
|
|
### (4.1) Figement des éléments lexicalement pleins (tête ou complément) [LEX]:
|
|
|
La substitution d'un des éléments lexicalement pleins (i.e. de catégorie N , V, A, Adv) ne fonctionne pour aucun élément paradigmatiquement proche (synonyme, antonyme, hyperonyme), i.e. produit soit une inacceptabilité soit une séquence dont le sens comporte une modification qui va au-delà de la substitution initiale (ce que l'on note avec un # infra)
|
|
|
|
|
|
Par exemple, pour la paire _eau sucrée_ à _boisson sucrée_, le différentiel de sens entre "eau" est "boisson" se retrouve entre "eau sucrée" et "boisson sucrée". Alors qu'en passant de _eau de vie_ à _boisson de vie_ on a un différentiel de sens supérieur à celui existant entre "eau" et "boisson".
|
|
|
|
|
|
Exemples:
|
|
|
- nom:
|
|
|
- _eau de vie_, _#boisson de vie_
|
|
|
- _(conseil+#comité+#commission) général_
|
|
|
- verbe:
|
|
|
- _Max (**ronge**+#mord+#mange) **son frein**_
|
|
|
- _Max a (**pris** + \*contracté + \*saisi) un **virage**._
|
|
|
- adverbial:
|
|
|
- _**à la** (**suite** + #succession+\*continuité) [de]_
|
|
|
|
|
|
<!--
|
|
|
**2 solutions: A TRANCHER**
|
|
|
==
|
|
|
|
|
|
|
|
|
**SOLUTION 1: distinction entre LEX et "SURPLUS"**
|
|
|
On fait cependant une distinction entre les exemples ci-dessus (critère LEX), et le cas d'expressions où la substitution d'un élément plein conduit à une perte de surplus de sens (critère SURPLUS). C'est en particulier le cas de termes techniques, dont la formulation s'est figée (les parties ne sont pas sélectionnées librement) et comprend de fait un surplus de sens par rapport à la composition des parties. Par exemple, pour _traduction automatique_, le remplacement _traduction automatisée_ n'est pas inacceptable, mais ne réfère plus vraiment au domaine technique de la _traduction automatique_. C'est aussi typiquement le cas pour des noms de profession au sein desquelles changer les éléments lexicaux casse la référence à un concept institutionnalisé (par exemple un nom de profession dépendant de l'organisation institutionnelle, comme _ministre du Budget_, ou encore, _juge d'instruction_ vs _juge d'investigation_: cette deuxième formulation n'est pas inacceptable, mais on perd le sens précis d'une profession spécifique au système judiciaire).
|
|
|
|
|
|
A noter que les termes techniques sont plus ou moins spécialisés, et peuvent ne pas être connus des locuteurs non spécialisés dans le domaine du terme. Il faut avoir recours à des ressources externes pour juger. Par exemple, la profession _administrateur national du diamant_ sera considérée comme une EP SURPLUS: _#gestionnaire national du diamant_, car après vérification il s'agit d'un titre précis.
|
|
|
|
|
|
Exemples:
|
|
|
- _ministre du Budget_ (SURPLUS, domaine politique)
|
|
|
- _juge d'instruction_ (SURPLUS, domaine juridique)
|
|
|
- _eau de vie_ (LEX)
|
|
|
- _chambre froide_ (SURPLUS)
|
|
|
|
|
|
**SOLUTION 2: on ne garde qu'un seul type LEX**
|
|
|
-->
|
|
|
|
|
|
On considère en particulier qu'il y a modification sémantique allant au-delà de la substitution initiale pour les termes techniques ou institutionnels.
|
|
|
Par exemple passer de _juge d'instruction_ à _juge d'investigation_ ne crée pas d'inacceptabilité mais on perd le sens précis d'une profession spécifique au système judiciaire. On considère donc le critère LEX comme vérifié pour tous les noms de professions liées au système institutionnel (tous les noms précis de ministre par exemple: _ministre du Budget_, _ministre de l'Agriculture_, _ministre de la Défense_...), et pour des termes techniques, dont on sait ou dont on peut voir d'après ressources externes, qu'ils correspondent à un concept technique précis dont la formulation s'est figée et comprend un surplus de sens par rapport à la composition des parties. Par exemple, pour _traduction automatique_, le remplacement _traduction automatisée_ n'est pas inacceptable, mais ne réfère plus vraiment au domaine technique de la _traduction automatique_.
|
|
|
|
|
|
Les noms propres polylexicaux désignant des types comme _Renault 5_ qui désigne une classe de véhicules peuvent aussi rentrer dans ce critère. En effet, ils ne passent pas le test de référence unique pour être traités comme des entités nommées. Par contre, ils passent ce critère et doivent donc être annotés comme des EP classifiantes:
|
|
|
_Cette (**Renault** + \*Peugeot + \*voiture) **5** bleue devant nous est sale_
|
|
|
_La protéine (**Alpha** + \*Beta) **2** se trouve dans le plasma sanguin_
|
|
|
|
|
|
Attention, certains noms propres polylexicaux auront des traitements différents selon le contexte.
|
|
|
_**Land Rover** a licencié 2000 employés._ -> EN (cf. [guide des entités nommées](ep_et_en))
|
|
|
_Ma **Land Rover** se conduit très bien._ -> EP classifiante
|
|
|
|
|
|
De même, pour les noms de personnes, on peut avoir différentes analyses suivant le contexte:
|
|
|
_**Lucie Dupond** est née en 1980._ -> EN (cf. [guide des entités nommées](ep_et_en))
|
|
|
_Je ne connais pas beaucoup de **Lucie Dupond** nées en 1980._ -> EP classifiante
|
|
|
|
|
|
<!--
|
|
|
Mathieu:
|
|
|
Pour info pour plus tard: attention, cas limite! Le critère LEX tel qu'il est écrit là ne passerait pas car substituer *Lucie* par un autre prénom (ex. *Lea*) ne modifie pas le sens de l'expression au-delà de la substitution initiale, cf. la proposition LEX-REF d'Agata comme piste.
|
|
|
-->
|
|
|
|
|
|
|
|
|
<!--
|
|
|
**Le cas particulier des entités nommées**: le fait de casser le lien vers une entité précise (pas un concept) ne parait en revanche pas suffisant pour valider la rupture paradigmatique. En effet, pour le _président de Renault_, le fait que la _présidente de Renault_ n'existe pas à un moment donné ne doit pas nous amener à considérer _président de Renault_ comme une EP. Voir [page spécifique sur les défis de l'annotation des entités nommées](defis-en).
|
|
|
-->
|
|
|
|
|
|
|
|
|
<!--
|
|
|
En outre, dans le cas où la substitution de la tête produit une modification sémantique supplémentaire, on distingue le cas où c'est la référence à une entité autonome qui est rompue, du cas où c'est la référence à un concept. On notera ces critères respectivement RE (rupture référence à entité) vs RC (rupture référence à concept). Le critère RE met en évidence des entités nommées.
|
|
|
Exemples:
|
|
|
- RE: Association+#comité+#commission d'insertion des pays de la Saux => "comité d'insertion ..." est grammatical et interprétable. La substitution de "association" par "comité" produit un changement régulier de sens, mais au niveau pragmatique, on perd la référence à l'entité précise (qui se trouve s'appeler "association..." et pas "comité...").
|
|
|
|
|
|
- RC: _eau de vie_, _#boisson de vie_
|
|
|
|
|
|
On peut avoir à la fois RC et RE. Par exemple en passant de _Conseil général de PACA_ à _conseil spécifique de PACA_, non seulement on perd la référence à l'organisation, mais on a aussi un changement de sens supérieur au changement de "général" à "spécifique" : le "conseil spécifique" n'est pas au "conseil général" ce que "spécifique" est à "général", ou dit plus rapidement "général" n'a pas son sens habituel.
|
|
|
|
|
|
(MARIE: Je ne suis moi-même pas complètement convaincue de ce que j'écris... Tout ça pour essayer d'approcher que "général" n'a pas son sens habituel..., je me demande si on ne pourrait pas simplement donner ce critère plus simple??? Il vaudrait aussi pour "ministre de l'Intérieur" => Intérieur n'a pas son sens habituel???)
|
|
|
|
|
|
La substitution peut aussi concerner des éléments non tête de l'EP. On a la même distinction à opérer selon que la substitution est sémantiquement régulière, mais fait perdre la référence à une entité nommée:
|
|
|
Exemple:
|
|
|
- _Banque (centrale+#essentielle+#principale) européenne_
|
|
|
|
|
|
Versus le cas où la substitution n'est pas sémantiquement régulière : le différentiel de sens est supérieur à la substitution lexicale opérée:
|
|
|
Exemple:
|
|
|
- _arme blanche_/_#arme noire_
|
|
|
|
|
|
Et là encore on a des cas à la fois de RC et de RE:
|
|
|
- nom:
|
|
|
- _ministre de l'(Intérieur+*dedans+*extérieur+*entrailles)_
|
|
|
|
|
|
Les autres parties du discours ne sont pas a priori concernées par le critère RE, mais seulement RC:
|
|
|
Exemples:
|
|
|
- adverbe:
|
|
|
- _d'une (part+*partie+*morceau)_
|
|
|
- verbe:
|
|
|
- _Luc casse sa (pipe+#cigarette)_
|
|
|
- conjonction:
|
|
|
- _(bien+*mal+*parfaitement) que_
|
|
|
- adverbial:
|
|
|
- _en (dépit+*contrariété+*déception) [de]_
|
|
|
|
|
|
-->
|
|
|
|
|
|
<!--
|
|
|
### (4.2) Cas particulier de type Prep + (det) + nom + (compléments/ajouts) : figement de la préposition [PREP]
|
|
|
|
|
|
**Mathieu/Marie: Est-ce que ce critère est utile?**
|
|
|
**En effet, si LEX est faux sur le nom (i.e. s’il y a variation possible sur le nom), alors PREP est faux (cf. si le nom peut varier au sein d’une classe sémantique, PREP n'est pas valide). Donc**
|
|
|
- __si LEX est vrai, alors on a une EP (critère suffisant), et inutile de tester PREP__
|
|
|
- __si LEX est faux, alors PREP sera également faux (cf. supra), et donc inutile de le tester__
|
|
|
|
|
|
|
|
|
On introduit un critère spécifique pour les cas où un nom "sélectionne" non pas une préposition qui va dépendre syntaxiquement du nom, mais une préposition qui gouverne le nom. On vérifie que la préposition (gouverneure) est figée par rapport au nom. On exclut les cas où le nom peut varier au sein d'une classe.
|
|
|
|
|
|
|
|
|
Exemples:
|
|
|
- _en France_ : le critère n'est pas rempli : certes la prep _en_ est figée, mais le nom varie au sein de la classe de tous les pays féminins. On considère alors que ce phénomène relève de la grammaire du français. Le statut d'EP d'une séquence qui n'aurait que ce critère reste encore à décider, ce phénomène pouvant être considéré comme relevant de la grammaire (sujet à débat...). **MARIE: cette dernière phrase est mal placée, et on peut peut etre meme l'enlever complètement?**
|
|
|
|
|
|
- _(à + * en + * par + *de) la (suite+*succession) [de]_ : la préposition _à_ n'est pas substituable, et on ne voit pas de classe de noms pouvant se substituer à _suite_. (rem: ici l'alternance _à la suite de X_ / _à sa suite_ fait que l'on ne va annoter comme éléments stables que _à_ et _suite_) **MARIE: cette dernière phrase me paraît obsolète, cf. on ne prend finalement pas les prep meme si pas d'alternance, cf. supra)**
|
|
|
|
|
|
**Note:** Avec ce critère, on ne capture pas _en (concubinage+union libre+*mariage)_ ou _sans (relâche+interruption)_ car il y a une toute petite combinatoire
|
|
|
|
|
|
Par ailleurs, pour aider à vérifier ce critère, on peut aussi vérifier que changer la préposition ne change pas le sens du nom: par exemple, _(en+au+vers le) début [de]_. Dans ce cas, le critère ne peut pas être utilisé.
|
|
|
-->
|
|
|
<!--
|
|
|
MC: pas sûr que le paragraphe ci-dessous soit nécessaire (car cela semble couvert par le prochain critère sur le figement du déterminant), mais il a l'avantage de préciser certaines choses.
|
|
|
|
|
|
On peut déjà distinguer deux cas, selon que le det du nom est figé ou pas:
|
|
|
- les séquences où _prep_, _det_ (incluant det zero) et _nom_ sont figés le critère DET s'applique (figement des déterminants)
|
|
|
- les séquences où seuls prep et nom sont figés: _**à** (une) grande **vitesse**_, _**de** (une) **couleur** grise ravissante_. QUESTION OUVERTE: ces cas sont bien non prédictibles (caractère idiosyncratique de la préposition à utiliser), mais s'agit-il d'EP??? Un critère pour distinguer le cas det figé ou pas: voir infra 4.3: _à quelle altitude?_ MARIE:mais ici _vitesse_ et _couleur_ varient bien au sein d'une classe (_à une certaine vitesse+altitude+hauteur+nom de mesure_ , _d'une certaine couleur+teinte+matière+matériau+taille+nom de caractéristique physique_), donc le critère ne s'applique pas??
|
|
|
|
|
|
-->
|
|
|
|
|
|
|
|
|
|
|
|
### (4.3) Figement total du déterminant à l'intérieur de la séquence (en incluant le déterminant zéro noté E) [DET]
|
|
|
|
|
|
On peut tester le critère sur le déterminant possible pour chaque N au sein de la séquence candidate.
|
|
|
|
|
|
Arbre de décision pour ce critère:
|
|
|
- si aucun déterminant n'est possible pour le N, et le N n'est pas introduit par la prep "en" **=> satisfait**
|
|
|
- sinon, (ajout Marie pour distinguer bien les 2 cas) **pour les séquences qui NE SONT PAS de la forme "prep det N de SN"**, s'il y a un déterminant, et qu'il ne peut pas varier du tout ou bien ne varie qu'en genre, nombre, et/ou possesseur (pour les dets possessifs) **=> satisfait**
|
|
|
- pour les séquences de la forme "prep det N de SN", voir infra tests spécifiques
|
|
|
- sinon, **critère non satisfait**
|
|
|
|
|
|
Exemples:
|
|
|
- verbe:
|
|
|
- _faire (E+*une+*la) face_
|
|
|
- _perdre (la+*une) face_
|
|
|
- nom:
|
|
|
- _garde du corps/*garde d'un corps_
|
|
|
|
|
|
- adverbiaux:
|
|
|
- _**à (E+*la+*une) force** [de]_
|
|
|
- _**à (le+*E+*un+*ce) sein** [de]_
|
|
|
- _dans la mesure [où]_/_*dans une mesure [où]_/_#dans cette mesure_
|
|
|
|
|
|
A noter qu'un déterminant possessif est considéré comme figé dès lors qu'il n'alterne pas avec un déterminant non possessif:
|
|
|
|
|
|
- _casser **sa** pipe_ / _#casser la pipe_
|
|
|
|
|
|
On a en outre en général un accord obligatoire entre la personne d'un des actants (en général le sujet) et le possesseur, mais il est inutile de le tester (_il a cassé sa pipe / #il a cassé leur pipe_).
|
|
|
|
|
|
#### Alternances fréquentes, bloquant la satisfaction du critère
|
|
|
|
|
|
On considère qu'il n'y a pas figement du det dans le cas assez fréquent d'un det forcément défini lorsque le N n'est pas modifié, mais avec possibilité de det indéfini lorsque le N est modifié:
|
|
|
- _à 5 heures du matin_ / _à 5 heures d'un matin de juillet_ ==> critère de figement non satisfait
|
|
|
|
|
|
Idem le critère de figement du det n'est pas satisfait si pour une utilisation en contexte négatif, il y a variation du déterminant:
|
|
|
- _faire des histoires_ / _ne pas faire d'histoires_ / _ma banque n'a fait aucune histoire pour me rembourser_
|
|
|
|
|
|
|
|
|
#### Cas du det zéro
|
|
|
Pour le déterminant zéro, on exclut les cas productifs comme _sauf accident_, _la notion de syndicalisme_, _possibilités de diversification_, _un verre de vin_. De ce fait, le critère det zéro est très lié au critère de substitution lexicale.
|
|
|
Certaines prépositions, comme "en" permettent facilement le déterminant zéro : dans ce cas, ce critère n'est pas suffisant.
|
|
|
|
|
|
Exemple d'application:
|
|
|
le *sans* permet habituellement le det zero mais alterne avec d'autres déterminants (ex. *aucun*). Les cas avec *sans* uniquement avec det zéro rentrent bien dans ce critère:
|
|
|
|
|
|
il fait _sans (E+*aucun) arrêt_ des commentaires stupides (det zero figé)
|
|
|
il a parlé _sans (E+aucune) interruption_ de l'auditoire (det zero possible mais de manière régulière donc pas un critère)
|
|
|
|
|
|
|
|
|
#### Cas d'une EP candidate de type "prep det N de SN"
|
|
|
|
|
|
Si le déterminant alterne seulement avec un possessif reprenant un SP (_à la recherche du Graal_ / _à sa recherche_), et en particulier pas avec un déterminant interrogatif reprenant le SP (_*à quelle recherche_) **=> satisfait**
|
|
|
|
|
|
Rem: s'il y a alternance avec un possessif reprenant le de SN, on décide de ne pas inclure le det
|
|
|
|
|
|
Pour tester que le déterminant n'est PAS figé : le det interrogatif _quel_ est-il possible à la place du SP?
|
|
|
- _à quelle altitude_
|
|
|
- _en quel honneur_
|
|
|
|
|
|
**Restrictions:**
|
|
|
|
|
|
ATTENTION: Ce critère ne peut pas être utilisé si le det est forcément absent, cf. auquel cas le _quel_ sera automatiquement impossible (_en fin de réunion_ /_*en quelle fin_).
|
|
|
|
|
|
ATTENTION: si le "de N" est **forcément animé**, la reprise en _quel_ n'est jamais possible. **Le critère ne peut pas être utilisé dans ce cas**.
|
|
|
|
|
|
ATTENTION: En outre, on remarque que pour les noms spécifiant des localisations temporelles (fin, début...) ou spatiales (sud, extrémité, bout, milieu...), on n'a jamais reprise du "de N" par _quel_. Du fait de ce fonctionnement régulier, **l'impossibilité de reprise par _quel_ n'est pas utilisée comme critère suffisant pour ces cas**.
|
|
|
|
|
|
- _au début du film_ => #à quel début : critère non utilisé dans le cas d'un spécifieur temporel ou spatial
|
|
|
Et en revanche, la reprise du SP par un déterminant possessif n'est pas considérée comme une variation bloquant l'application du critère. Donc par exemple:
|
|
|
- _à la recherche du Graal_ / _en sa présence_ (variation non prise en compte) / _*à quelle recherche_ -> le critère est satisfait
|
|
|
Dans ce dernier cas cela dit, **on décide de ne pas inclure le déterminant à l'EP**:
|
|
|
- _**à** la **recherche** du Graal_ / _**à** sa **recherche**_
|
|
|
|
|
|
|
|
|
#### Inclusion du déterminant figé
|
|
|
Si le critère de figement du déterminant est satisfait, alors le déterminant est naturellement inclus à l'EP, sauf dans le cas supra d'alternance _prep le N SP_ / _prep son N_, où le critère peut être tout de même satisfait, mais on n'inclut pas le det.
|
|
|
|
|
|
|
|
|
|
|
|
### (4.4) Possibilité de det zéro [ZERO]
|
|
|
|
|
|
Peut-on avoir un det zéro, en dehors de cas productifs de det zéro?
|
|
|
|
|
|
Plus précisémant, outre le figement complet du déterminant, on considère aussi des cas où le déterminant zéro est possible, mais pas obligatoire.
|
|
|
|
|
|
- _avoir peur_ / _avoir une grande peur_
|
|
|
|
|
|
Comme pour le critère précédent, on ignore ici les cas réguliers de déterminant zéro (i.e. où une large classe de nom peut apparaître).
|
|
|
On exclut les cas productifs de possibilité de Det zero, en particulier la plupart des prépositions admettent des det zero (ex. (avec+pour+sans) interruption). Ce critère s'applique essentiellement pour les objets directs.
|
|
|
|
|
|
### (4.5) Presque figement lexical [LEXflou]
|
|
|
|
|
|
Dans le cas où aucun critère suffisant précédent n'est vérifié, mais que la variation lexicale est tout de même limitée, on teste de noter tout de même la séquence comme EP. Plus précisément, noter LEXflou si
|
|
|
un élément plein peut certes être remplacé par un synonyme ou hyperonyme), mais pas par tous.
|
|
|
<-- , la variation est réduite, et ne couvre pas toute la classe sémantique.--> |