Utilisation du corpus MED-CRTT pour le repérage des termes.

 

Google : med crtt (deuxième lien)

 

Décompresser RevueRhuma_75.rar

 

Créer dans Mes Documents le dossier Rhuma

 

A) Utilisation de Cordial Analyseur

 

Syntaxe – Etiqueter tous les fichiers d’un dossier.

 

Décocher l’affichage « DEBUT/FIN DE PHRASE »

Pas de numérotation des mots ni des paragraphes.

Lemmes

Texte intégral

Aucune expression

Type grammatical abrégé en majuscules

Codage spécialisé : aucun

Ne pas corriger, ne pas signaler

 

B) Utilisation de ReplaceText

 

Placer le dossier contenant les fichiers dans « A Sample Replace Group »

(Replace – Insert File(s) to – A Sample Research Group)

 

(Use Folder, Include File filter : *.cnr

 

Clic droit pour « Advance Edit »

 

4 remplacements successifs :

 

Tab --> Underscore

Enter Enter --> ***

Enter --> Space

*** --> Enter

 

Replace /

File/Folder properties

 

Use folder

Include File Filter : *.cnr

Tick : Treat file as text

 

File/Save Replace Groups (saves your settings)

 

Replace /

    Start Replacing

 

 

C) Utilisation de Monoconc

 

Charger tous les fichiers du dossier Rhuma (75)

 

75 files

1 579 061 words

 

Set to a maximum of 500 000 hits

 

 

Principaux patrons syntaxiques des candidats termes.

 

1) NOM-ADJECTIF

 

*_*_NC* *_*_ADJ*

 

Interrogation sur le lemme

 

*_osseux_ADJ*

 

Ctrl F

 

Présence de formes adjectivales dans la colonne 1-Left et 1 Rightà

 

2) NOM-ADJECTIF-ADJECTIF

 

*_*_NC* *_*_ADJ* *_osseux_ADJ*

Alt Q A

 

*_*_NC* *_osseux_ADJ* *_*_ADJ*

 

kyste osseux anévrismal

 

3) NOM-PREPOSITION-NOM

 

*_*_NC* *_*_PREP* *_*_NC*

Alt Q A

 

La requête suivante permet de récupérer les expressions contenant à la fois les prépositions et les déterminants contractés (du) :
*_*_NC* ??%_* *_*_NC*

 

On peut augmenter la taille de l’expression contenant le résultat de la requête dans le menu Advanced Collocation :

 

ALT-Q-A avec paramétrage Search Term + 1 right :

 

IRM, prise en charge thérapeutique, syndrome du canal carpien, marqueurs du remodelage osseux, syndrome de fatigue chronique, indice de masse corporelle, articulations des membres inférieurs

 

ALT-Q-A avec paramétrage Search Term + 1 right + 2 right :

 

injection de produit de contraste

augmentation du risque de fracture

fracture du col du fémur

IRM nucléaire

biopsie de(s) glandes salivaires accessoires

tendon du muscle long fléchisseur

 

ALT-Q-A avec paramétrage 1 left + Search Term est peu productif pour l’extraction de termes (les quadrigrammes commencent par des articles).

 

Idem pour ALT-Q-A avec paramétrage 2 left +1 left + Search Term (les quintigrammes commencent par des prépositions suivies d'articles).

 

 

 

4) NOM-PREPOSITION-NOM- ADJECTIF

 

Imagerie par résonance à

 

4) NOM-PREPOSITION-NOM- ADJECTIF

 

*_*_NC* *_*_PREP* *_*_NC* *_*_ADJ*

 

Prise en charge thérapeutique

Indice/Index de masse corporelle

Syndrome de fatigue chronique

Facteurs de risque cardiovasculaires

 

5) NOM-DETERMINANT-NOM

Prise en compte des déterminants contractés

*_*_NC* *_*_DET* *_*_NC*

 

Syndrome du canal à

 

6) NOM-DETERMINANT-NOM- ADJECTIF

 

*_*_NC* *_*_DET* *_*_NC* *_*_ADJ*

 

Fracture du col à

 

7) NOM-DETERMINANT-NOM-DETERMINANT-NOM

 

*_*_NC* *_*_DET* *_*_NC* *_*_DET* *_*_NC*

 

Maladie des griffes du chat

Calcification du tendon du subscapulaire

 

8) NOM- ADJECTIF-DETERMINANT-NOM

 

*_*_NC* *_*_ADJ* *_*_DET* *_*_NC*

Scintigraphie osseuse au technétium

 

 

9) COLLOCATIONS V-N

 

*_*_V* *_*_DET* *_*_NC*

75 158 matches

 

Alt Q A

Show first 10 000

 

Save to TXT file V_DET_N_rhuma

Import into Excel

 

35095 combinations used at least twice

Over 40 000 hapax legomena

 

*_jouer_V*

Ctrl F

Jouer un role

 

*_répondre_V*

Critères, questionnaire, traitement, question

 

*_*_V* au%_* traitement%_*

 

*_évaluer_V*

2552

 

*_rapporter_V*

2791

 

*_diagnostic_NC*

4987

Ctrl F

 

*_*_V* *_*_DET* *_diagnostic_NC*

1155

Alt Q A

 

*_évoquer_V*

1021

diagnostic 74

Ctrl-F

*_confirmer_V*

1586

diagnostic 132

 

*_être_V* *_*_DET* *_siège_NC*

106

Mi. Frequency 1

negative semantic prosody

 

*_montrer_V*

5055