Comment trouver plus efficacement Ngram avec Google Ngram Viewer

Google gère une base de données multilingue de la langue publiée. En examinant les livres collectivement, Google peut traiter le texte et fournir une fréquence basée sur des données statistiques pour l’apparence du mot. Avec Google Ngram Viewer, vous pouvez effectuer une recherche rapide et efficace dans ces données statistiques volumineuses. En comparant la popularité relative des mots, vous pouvez définir comment changer la langue La culture au fil du temps. Ngram peut faire beaucoup plus que simplement signaler la fréquence des mots dans le vaste corpus de texte de Google.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Recherches de base (1-grammes)

1. Tapez votre mot clé dans Boîte de recherche Ngram.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

2. Si vous souhaitez rechercher toutes les lettres majuscules du mot, cochez la case "insensible à la casse". Dans cette recherche, "pizza" et "pizza" renverront les résultats.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

3. Définissez les paramètres de recherche sous la zone de recherche. Cela inclut la plage de dates et le groupe de langues.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

La date spécifie les contraintes sur l’axe Y du graphique. Selon le groupe que vous choisissez, les dates maximales et minimales varieront considérablement.

La valeur de lissage supprime les ondulations inhabituelles et diminue de vos données. Les valeurs moins glissantes sont plus précises, tandis que les valeurs plus élevées ne révèlent que des directions plus profondes.

Choisissez Corpus

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Corpus est l'ensemble de textes que Ngram Viewer étudiera. Le "Anglais" par défaut est acceptable pour la navigation occasionnelle, mais peut être très académique.

«English Fiction» reflétera plus étroitement la langue commune. Le corpus "anglais" standard peut être lourd, non fantaisiste, avec beaucoup de mots techniques. Google fournit une brève description de ce que chaque groupe contient.

Recherche avancée (2 à 5-grammes)

En ajoutant des termes de recherche supplémentaires ("grammes" dans la langue du moteur de recherche), vous pouvez créer des comparaisons complexes dans le temps. Vous pouvez affiner votre recherche à l'aide de commandes de mots clés, telles que les fonctionnalités avancées de Google Search.

Séparez les termes de recherche par une virgule.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Ngram Viewer affiche la fréquence relative de vos termes de recherche dans un seul graphique. Survolez les lignes du graphique pour voir des points de données précis.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Trouver le caractère générique

Utilisez l'astérisque ("*") dans vos termes de recherche en tant que caractère générique. Par exemple, "Bachelor of *" affichera les résultats de nombreux diplômes de licence.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Traduction d'une recherche

Pour trouver toutes les formes Et des reflets Pour un terme, ajoutez la commande de script "_INF". Ceci cherche chaque reflet du mot attaché, tel que diverses formes de "to be" en anglais.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Parties du discours

Si un mot contient plusieurs parties du discours, vous pouvez y ajouter des opérateurs de texte. Les parties du mot correct dans la base de données Google incluent tous les éléments suivants:

  • _ADJ_: Adjectif (rapide, grand, intelligent)
  • _ADV_: Circonstance (rapidement, plus tard, toujours)
  • _PRON_: Conscience (eux, lui, nous)
  • _DET_: Définition d'un objet (a, an, the)
  • _ADP_: (Prépositions et postpositions)
  • _NUM_: Nombre (I, II, V)
  • _CONJ_: Appariement (et non, mais)
  • _PRT_: La particule, une classe rare, est rarement utilisée pour d'autres fonctions de mots

Chacun de ces grammes peut être combiné en phrases. Par exemple, «_ADJ_boy» auquel le mari renverra l'adjectif + les mots «garçon».

Pour spécifier une partie spécifique du discours pour un seul terme de recherche, ajoutez-la à la fin: "water_VERB", sans tiret bas.

Pour inclure chaque partie du discours d'un mot particulier, utilisez l'opérateur de caractère générique après le tiret inférieur, comme indiqué ci-dessous.

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

Utilisation de variables fonctionnelles

Les variables de fonction vous permettent de trouver la manière dont la fonction ou la position des mots.

  • _ROOT_ Un espace réservé pour les routines d'analyse de la phrase. Il s'agit généralement du sujet ou du mot principal modifié par le verbe.
  • Suggérer _START_ Au début de la phrase ("_START_ President" ne renvoie que les phrases commençant par "President").
  • Suggérer _END_ Jusqu'à la fin de la phrase ("_ADP_ _END_" renvoie les phrases qui se terminent par des caractères de fin).

Superposition

En combinant des termes de recherche avec des opérateurs mathématiques, vous pouvez effectuer une analyse mathématique simple avec des valeurs pour la plage de fréquences:

Comment rechercher Ngram plus efficacement avec Google Ngram Viewer - Articles

  1. Ajoute plusieurs expressions dans un seul terme de recherche
  2. - L'expression est affichée à droite de l'expression à gauche, ce qui permet de comparer rapidement l'utilisation relative d'un terme de recherche.
  3. / Divise l'expression à gauche et l'expression à droite
  4. * Multipliez l'expression pour comparer des programmes de fréquence très variée. Assurez-vous que l'intégralité du ngram est entre parenthèses pour éviter d'analyser l'astérisque comme un caractère générique.
  5. : Chercher le ngram à gauche dans le corps à droite

Les dépendances

Enfin, vous pouvez définir les dépendances avec «=>» pour rechercher les relations linguistiques. «Voiture => rapide» mènera à des résultats où «rapide» dépend grammaticalement du mot «voiture» ou le modifie. Cela peut être librement mélangé avec n'importe laquelle des recherches avancées.

Conclusion

Lorsque vous travaillez avec Ngram, votre recherche peut être rapidement compliquée. Certains Techniques de recherche Ceux-ci jouent bien les uns avec les autres, tandis que d'autres ne sont pas compatibles. La meilleure façon de voir si quelque chose fonctionne est de l'essayer. Par exemple, la balise _INF est très flexible, alors que _VERB est difficile à satisfaire. Vous reconnaîtrez rapidement les bizarreries lorsque vous explorerez la boîte à outils Ngram Viewer.

Aller au bouton supérieur