Annexe : les patrons lexico-syntaxiques Les différents patrons qui sont proposés ici sont des adaptations de patrons issus des travaux de divers chercheurs, par ordre alphabétique : Natalia Grabar, Josette Rebeyrolle, Patrick Séguéla, Ludovic Tanguy. Dans ces patrons, les étiquettes morpho-syntaxiques sont celles de la version courante du TreeTagger (fin 2006). Chaque élément du patron est séparé par une espace. L'expression des patrons suit la syntaxe des expressions régulières plus d'autres particularités : le symbole * seul signifie un joker indéfini (on ne précise pas le nombre de mots, cela va de 0 à ...) ; un chiffre tout seul représente un joker défini : ">^être$" 1 ">^[cl]e$" signifie le verbe "être" suivi d'un mot au plus (0 à 1) suivi de "le" ou "ce" ; le symbole "> avant une forme signifie que l'on cherche le lemme : ">^être$" recherche le verbe être sous toutes ses formes alors que "^être$" recherche uniquement la forme "être" ; lorsqu'une forme est associée à une série d'étiquettes (pas d'espace entre la forme et les étiquettes), cela signifie que la forme doit être de la catégorie stipulée par l'une des étiquettes, par exemple, dans les définitions, le patron 'dire' correspond au lemme 'dire ou dit' de catégorie 'adjectif ou verbe au futur, à l'imparfait, au passé simple ou au présent ou participe passé' les accolades regroupent un ensemble (formes, lemmes ou étiquettes morpho-syntaxiques) associé à un joker : {NOM|NAM}1 signifie au plus 1 nom commun ou un nom propre, {ADV}* signifie un nombre indéfini d'adverbes. La première ligne indique le nom du patron et la fourchette de variation de son taux de précision (en pourcentage) sur les 8 corpus étudiés. Définition definir 98-100 ">^(définir|défini)$" {SYM|NOM|NAM|ABR|ADV|DET.*|PRO.*|INT|NUM|ADJ|PRP.*|KON}* ">^comme$" PRO:POS|NAM|SYM|NOM|DET.*|ADJ|INT|PRO:DEM|PRO:REL|PRO:IND|ABR|NUM|VER.*|KON denom1 58-96 ">^(appeler|appelé|nommé|nommer|désigner|désigné|dénoter|dénoté|dénommer|dénommé|baptiser|baptisé)$" denom2 10-100 ">^(porter|appliquer|employer|réserver|recevoir|prendre|utiliser|donner|proposer|mériter)$" 6 ">^[cl]e$" ">^(nom|terme|mot|expression|vocable|appellation|désignation|dénomination)$" denom3 0-100 ">^être$" 1 ">^[cl]e$" ">^nom$" denom4 0-100 ">^[cl]e$" ">^(nom|terme|mot|expression|vocable|appellation|désignation|dénomination)$" * ">^(donné|donner|porté|porter|appliqué|appliquer|employé|employer|réservé|réserver|reçu|recevoir|pris|prendre|utilisé|utiliser|proposé|proposer|recouvrir|regrouper|grouper)$" denom5 (pas d'occurrences) ">^avoir$" ">^pour$" ">^nom$" denom6 67-100 ">^(sous|où)$" ">^[cl]e$" ">^(nom|terme)$" denom7 0-100 ">^(parler|qualifier)$" {PRO.*|NOM|INT|KON|DET.*|ADV|ADJ|NUM|NAM|ABR|PRP.*|SYM}* ">^d[eu]$" denom8 25-100 ">^(nom|terme|mot|expression|vocable|appellation|désignation|dénomination|concept|notion|idée)$" * ">^(référer|renvoyer|référence|allusion)$" {ADV}1 ">^à$" dire 0-82 ADJ|VER:futu|VER:pper|VER:simp|VER:impf|VER:pres">^(dire|dit)$" entendre_par 33-100 ">^entendre$" 6 ">^par$" etre1 17-23 PRO:REL|PRO:IND|INT|PRP.*|ABR|NOM|VER.*|NUM|KON|PRO:POS|SYM|NAM|DET.*|ADJ|ADV VER:futu|VER:ppre|VER:pres|VER:impf|VER:simp">^être$" {KON|ADV}1 DET.*|PRO:DEM|NUM|PRP.*| etre2 0-11 PRP.*|NOM|SYM|DET.*|INT|PRO:IND|ABR|ADV|PRO:REL|ADJ|NUM|KON|NAM|PRO:POS|VER.* VER:simp|VER:impf|VER:futu|VER:ppre|VER:pres">^être$" ABR|NAM|PRO:IND|PRO:POS|NOM|SYM|VER:ppre|INT 6 PRO:DEM|NUM|DET.* etre3 4-26 ">^ce$" VER:impf|VER:futu|VER:ppre|VER:pres|VER:simp">^être$" {KON|ADV}1 NUM|DET.* il s'agit 3-13 ">^il$" {">^se$"}1 "agit$" par_*_entendre 75-100 ">^par$" 5 ">^entendre$" signifier 14-38 ADJ|ADV|VER.*|PRO:REL|ABR|NOM|NAM|NUM|KON|INT|PRP.*|DET.*|SYM ">^signifier$" ">^[^q]" vouloir_dire 0-100 ">^vouloir$" ">^dire$" Hyperonymie distinguer_plusieurs_X_tel_que_Y (pas d'occurrences) VER:ppre|VER:impf|VER:simp|VER:pres|VER:futu">^(distinguer|reconnaître|différencier|discriminer|isoler|séparer|discerner|remarquer)$" 4 ">^plusieurs$" {DET.*|NOM|KON|ADV|PRP.*|ADJ}* ">^(tel|dont)$" divers_X_comme_Y 100 ">^divers$" {ADV|PRP.*|NOM|DET.*|ADJ|KON}* ">^comme$" et_Adv_Y 0-58 ">^et$" 1 ADV">^(notamment|notablement|spécialement|particulièrement|surtout)$" et_Adv_Y2 0-100 ">^et$" 1 ADV">^(notamment|notablement|particulièrement|spécialement)$" et_Adv_Y3 0-25 ">^et$" 1 ">^(par|en|avant)$" ">^(exemple|particulier|tout)$" et_autres 0-71 ">^(et|ou)$" {">^(de|tout)$"}1 ">^autre$" etre_le_plus_de_tous_les_X 0 VER:ppre|VER:pres|VER:impf|VER:simp|VER:futu">^être$" 1 DET:ART">^le$" ">^(plus|moins)$" 1 ">^de$" ">^tout$" ">^le$" etre_le_X_le_plus 0-86 VER:simp|VER:ppre|VER:impf|VER:futu|VER:pres">^être$" 1 DET:ART">^le$" {PRP.*|NOM|ADV|ADJ|KON|DET.*}* DET.*">^le$" ">^(plus|moins)$" etre_un 11-40 ADJ|SYM|DET.*|NAM|KON|NOM|ABR|VER.*|ADV|PRP.*|PRO:REL|INT|NUM|PRO:IND|PRO:POS VER:futu|VER:ppre|VER:pres|VER:simp|VER:impf">^être$" {ADV|KON}1 PRP:det|PRO:DEM|DET.*|NUM etre_un_X_très 0-67 VER:impf|VER:futu|VER:simp|VER:pres|VER:ppre|VER:pper">^être$" 1 DET:ART {ADJ|ADV|PRP.*|NOM|KON}6 ">^(très|absolument)$" etre_un_X_très2 0-29 VER:ppre|VER:futu|VER:pres|VER:pper|VER:impf|VER:simp">^être$" 1 DET:ART * ">^(très|absolument)$" inclusion1_X_,_Y 100 ">^parmi$" {">^tout$"}1 DET:ART|PRP:det {PRP.*|NOM|ADJ|DET.*|KON|ADV}* ">^,$" DET:ART {PRP.*|ADJ|NOM|ADV|DET.*|KON}* VER:subi|VER:pres|VER:ppre|VER:futu|VER:simp|VER:cond|VER:subp|VER:impf inclusion2_X_,_Y (pas d'occurrences) "^(dans|au)$" {DET:ART}1 "^(ensemble|nombre)$" PRP:det {DET.*|KON|PRP.*|ADV|ADJ|NOM}* ">^,$" DET:ART {PRP.*|ADV|NOM|ADJ|KON|DET.*}* VER:cond|VER:futu|VER:pres|VER:ppre|VER:subp|VER:subi|VER:simp|VER:impf le_plus_adj_des_X_,_soit_Y (pas d'occurrences) DET.*">^le$" ">^(plus|moins)$" ADJ PRP.*">^(de|du)$" {ADJ|NOM|ADV|PRP.*|KON|DET.*}* PUN.*">^,$" ">^(c'est-à-dire|soit)$" sorte_de 33-100 VER:simp|VER:pper|VER:impf|VER:futu|VER:pres|VER:ppre">^être$" 1 DET:ART ">^(sorte|type|genre|style|variété|espèce)$" ">^de$" tout_autre_type_de 0 ">^tout$" ">^autre$" ">^(type|genre|sorte|espèce|variété|style)$" ">^de$" tout_X_est_un_Y (pas d'occurrences) ">^tout$" NOM|ADJ {DET.*|PRP.*|ADV|NOM|KON|ADJ}* VER:pres|VER:impf|VER:ppre|VER:futu|VER:simp">^être$" ">^(un|du)$" DET.*|PRP:det utiliser_Y_comme_X 55-100 VER:pres|VER:ppre|VER:simp|VER:futu|VER:impf">^utiliser$" {NOM|ADJ|ADV|KON|DET.*|PRP.*}* ">^en$" ">^tant$" ">^que$" utiliser_Y_en_tant_que_X (pas d'occurrences) VER:impf|VER:futu|VER:ppre|VER:simp|VER:pres">^utiliser$" {ADJ|ADV|DET.*|KON|NOM|PRP.*}* ">^en$" ">^tant$" ">^que$" X_,_adv_exc1_Y 0-67 ADJ|NOM PUN.*">^,$" "^(sauf|hormis|excepté)$" PRO:DEM|DET.*|PRP:det X_,_adv_exc2_Y 0-42 NOM|ADJ PUN.*">^,$" 2 "^exception$" 2 PRO:DEM|DET.*|PRP:det X_,_Adv_Y 0-100 NOM|ADJ PUN.*">^,$" ADV">^(notamment|notablement|spécialement|particulièrement|surtout)$" PRP:det|DET.* X_,_Adv_Y2 20-100 NOM|ADJ PUN.*">^,$" ">^(par|en|avant)$" ">^(exemple|particulier|tout)$" DET.*|PRP:det X_,_tout_en_comptant_Y (pas d'occurrences) ADJ|NOM PUN.*">^,$" ">^tout$" ">^en$" ">^comptant$" X_,_Y_Adv 0-50 ADJ|NOM PUN.*">^,$" DET.*|PRP:det {PRP.*|ADV|NOM|KON|ADJ|DET.*}* ADV">^(notamment|notablement|spécialement|particulièrement|surtout)$" X_,_Y_Adv2 0-100 ADJ|NOM PUN.*">^,$" DET.*|PRP:det {PRP.*|NOM|ADV|ADJ|DET.*|KON}* ">^(par|en|avant)$" ">^(exemple|particulier|tout)$" X_,_y_compris_Y 0-100 NOM|ADJ PUN.*">^,$" ">^y$" "^compris$" PRO:DEM|PRP:det|DET.* X_?_desquels_Y (pas d'occurrences) ADJ|NOM "^au$" {">^premier$"}1 ">^(nombre|rang)$" ">quel$" X_est_special_de_Y 0-50 NOM|ADJ VER:ppre|VER:simp|VER:pres|VER:impf|VER:futu">^être$" 4 ">^(spécification|spécialisation|précision|détermination)$" ">^(de|du)$" X_parmi_lesquels_Y 0-100 ADJ|NOM ">^parmi$" ">^lequel$" DET.*|PRP.* X_se_présente_sous_forme_de_Y 67-100 NOM|ADJ ">^se$" VER:simp|VER:impf|VER:pres|NOM|VER:futu|ADJ|VER:ppre">^présenter$" 2 ">^(sous|en)$" 3 ">^forme$" X_v_special_de_Y 0 NOM|ADJ VER:ppre|VER:pres|VER:simp|VER:impf|VER:futu">^(former|représenter|constituer|consister)$" 4 ">^(spécification|spécialisation|précision|détermination)$" ">^(de|du)$" Y_app_classe_X 0-100 ADJ|NOM VER:pres|VER:futu|VER:impf|VER:simp|VER:ppre">^(appartenir|ressembler|dériver)$" 2 ">^(à|de|du)$" 1 ">(classe|caste|catégorie|groupe|division|espèce|sorte|race|ensemble|variété|type|modèle|famille|genre|collection|partie)" Y_virgule_le_plus_adj_des_X 0 ADJ|NOM PUN.*">^,$" DET:ART">^le$" ">^(plus|moins)$" ADJ PRP.*">^(de|du)$" PRP.*|NOM|ADJ|KON|ADV|DET.* Y_virgule_le_X_le_plus 0-100 NOM|ADJ PUN.*">^,$" DET:ART">^le$" {NOM|ADJ|ADV|DET.*|PRP.*|KON}* DET:ART">^le$" ">^(plus|moins)$" {KON|PRP.*|NOM|DET.*|ADV|ADJ}* PUN.*">^,$" Méronymie composition_parties_identiques 43-100 VER:pper">^(réunir|rassembler|unir|regrouper|grouper|collecter)$" 2 ">^(en|dans|sur|relatif)$" N_compo_non_org 67-75 ">^(tas|amas|ramassis|masse|accumulation|entassement)$" 1 ">^(de|du)$" {PRP.*|NOM|KON|DET.*|ADV|ADJ}* ">^dans$" npartie_de 0-100 VER:pres|VER:ppre|VER:simp|VER:futu|VER:impf">^être$" {DET.*|ADV}2 ">^(constituant|composant|composante|ingrédient|membre|organe|élément|partie|bout|case|division|fraction|fragment|morceau|parcelle|part|pièce|portion|étape|période|phase|stade)$" "^(de|des)$" X_compo_identique 0-77 VER:impf|VER:simp|VER:futu|VER:ppre|VER:pres">^(réunir|unir|rassembler|regrouper|grouper|collecter)$" 2 DET:ART|PRP:det X_etre_decompose_en_Y 60-100 VER:simp|VER:impf|VER:pres|VER:futu|VER:ppre">^être$" 1 VER:pper">^(analyser|décomposer|démembrer|désassembler|disjoindre|dissocier|désagréger|séparer|découper|couper|partager|trancher|diviser|fractionner|fragmenter)$" 2 ">^en$" X_etre_nom_groupe_de_Y 50-100 VER:pres|VER:futu|VER:impf|VER:simp|VER:ppre">^être$" {ADV}2 DET:ART|PRP:det ">^(ensemble|groupe|classe|réunion|famille|collection)$" 2 ">^(de|du)$" X_formé_de_Y 17-91 VER:pper">^(former|constituer)$" 2 ">^(de|du)$" X_inclure_Y 19-100 NOM|ADJ VER:simp|VER:futu|VER:pres|VER:impf|VER:ppre">^(abriter|comporter|comprendre|compter|inclure|intégrer)$" X_renferme_Y 27-94 NOM|ADJ NOM|VER:futu|VER:ppre|ADJ|VER:impf|VER:pres|VER:simp">^(renfermer|contenir|englober|abriter|emprisonner|loger|incorporer)$" X_se_decomp_en_Y 0-100 NOM|ADJ ">^se$" VER:pres|VER:impf|VER:ppre|VER:futu|VER:simp">^(analyser|décomposer|démembrer|désassembler|disjoindre|dissocier|désagréger|séparer|découper|partager|trancher|diviser|fractionner|fragmenter|dissoudre)$" 3 ">^en$" Y_etre_classe_dans_X 33-100 VER:pres|VER:futu|VER:simp|VER:ppre|VER:impf">^être$" VER:pper">^(classer|classifier|cataloguer|ranger|placer|inclure|étiqueter|catégoriser|grouper)$" 2 ">^(en|dans|intérieur|parmi|coeur|centre|milieu|dedans|fond|sein|sur)$" Y_etre_interne_à_X 0 VER:pres|VER:impf|VER:simp|VER:futu|VER:ppre">^être$" {PRP.*|DET.*|ADV}3 ">^(interne|intérieur)$" ">^à$" Y_rapprocher_dans_X 0 VER:pper">^(rapprocher|recueillir)$" 2 ">^(dans|sur|en|vers)$" Y_verbe_constitution_classe_X0-67 VER:pres|VER:ppre|VER:simp|VER:futu|VER:impf">^(former|représenter|constituer|consister)$" 2 ">(classe|caste|catégorie|groupe|division|espèce|sorte|race|ensemble|variété|type|modèle|pattern|famille|genre|collection|concept|partie|partition)" Reformulation X_cad_Y 29-100 ADJ|NOM {">^(à|,)$"}2 "^(c'est-à-dire|savoir)$" PRP:det|DET.* Varia baser 75-100 VER:pper">^(fonder|baser)$" ">^sur$" Y_situé_dans_X 0-75 VER:pper">^(situer|localiser|placer|positionner|disposer|insérer|installer|poser|accrocher|fixer|sceller|attacher|mettre|caser|nicher|déposer|ficher|loger|adosser|appliquer|camper|jucher|flanquer|arrimer|amarrer|boulonner|clouer|coincer|enchâsser|épingler|river|riveter|visser|implanter|ranger|garer|immobiliser|introduire|enfoncer|plonger|enfouir|ensevelir|contenir|emprisonner|abriter|dresser|étendre|trouver)$" 3 ">^dans$"