Google mantiene una base de datos multilingüe del idioma publicado. Al examinar los libros de forma colectiva, Google puede procesar el texto y proporcionar la repetición de la aparición de palabras basada en datos estadísticos. Con la herramienta de búsqueda Google Ngram Viewer, puede buscar a través de estos enormes datos estadísticos de manera rápida y efectiva. Al comparar la popularidad relativa de las palabras, puede establecer cómo cambia el idioma y la cultura a lo largo del tiempo. Ngram puede hacer mucho más que simplemente informar la frecuencia de las palabras en el enorme cuerpo de texto de Google.
Búsquedas básicas (1-gramos)
1. Escribe tu palabra clave Cuadro de búsqueda de Ngram.
2. Si desea buscar todas las mayúsculas de una palabra, marque la casilla "sin distinción entre mayúsculas y minúsculas". En esta búsqueda, "pizza" y "pizza" aparecerán en los resultados.
3. Configure los parámetros de búsqueda en la parte inferior del cuadro de búsqueda. Esto incluye el intervalo de fechas y el grupo de idiomas.
La fecha determina las restricciones en el eje Y del gráfico. Dependiendo de la combinación que elija, las fechas máximas y mínimas variarán ampliamente.
El valor de suavizado elimina ondas y caídas inusuales de sus datos. Los valores de suavizado más bajos son más precisos, mientras que los valores más altos revelan solo tendencias más profundas.
Elección del cuerpo
Corpus es el cuerpo de texto que Ngram Viewer estudiará. El "inglés" predeterminado es aceptable para la navegación informal, pero puede ser muy académico.
“Ficción en inglés” reflejará el lenguaje común más de cerca. El corpus estándar en "inglés" puede ser pesado en no ficción, con muchas palabras técnicas. Google proporciona breves explicaciones de lo que contiene cada grupo.
Búsqueda avanzada (de 2 a 5 gramos)
Al agregar palabras de búsqueda adicionales ("gramos", en el lenguaje de los motores de búsqueda), puede crear comparaciones complejas a lo largo del tiempo. Puede refinar su búsqueda usando comandos de palabras clave como las funciones avanzadas en la Búsqueda de Google.
Separe los términos de búsqueda secuencial con una coma.
Ngram Viewer mostrará la frecuencia relativa de sus términos de búsqueda en un solo gráfico. Pase el cursor sobre las líneas del gráfico para ver puntos de datos precisos.
búsqueda con comodines
Utilice el asterisco ("*") en sus términos de búsqueda como comodín. Por ejemplo, "Licenciatura en *" arrojará resultados para varias licenciaturas.
descarga de búsqueda
Para encontrar todas las formas y reflexiones un término, agregue el comando de script "_INF". Esto busca cada inversión de la palabra adjunta, como las diversas formas de "to be" en el idioma inglés.
partes de la oración
Si una palabra incluye muchas partes del discurso, puede agregar los operadores de texto para ser más específicos. Las partes de palabras correctas en una base de datos de Google incluyen todo lo siguiente:
- _ADJ_: adjetivo (rápido, grande, inteligente)
- _ADV_: adverbio (rápidamente, más tarde, siempre)
- _PRON_: pronombre (ellos, él, nosotros)
- _DET_: definir algo (un, un, el)
- _ADP_: (preposiciones y posposiciones)
- _NUM_: número (primero, segundo y quinto)
- _CONJ_: conjugación (y, no, pero)
- _PRT_: partícula, una clase rara, rara vez se usa para otras funciones de palabras
Cada uno de estos gramos se puede combinar en declaraciones. Por ejemplo, “_ADJ_ boy” que devolverá el adjetivo cónyuge + las palabras “boy”.
Para especificar una parte específica del discurso para un término de búsqueda, agréguelo al final: que significa "water_VERB", sin el guión bajo al final.
Para incluir cada parte del discurso de una palabra dada, use el operador comodín después del guión bajo, como se muestra a continuación.
Uso de variables funcionales
Las variables funcionales le permiten buscar el método de función o la posición de las palabras.
- _RAÍZ_ Un marcador de posición para la raíz para el análisis de oraciones, este suele ser el sujeto principal o la palabra modificada por el verbo.
- indicar _COMIENZO_ al comienzo de la oración ("_START_President" devuelve solo oraciones que comienzan con "el presidente").
- indicar _FIN_ al final de la oración (“_ADP_ _END_” devuelve oraciones que terminan en preposiciones).
Cubrir
Al combinar términos de búsqueda con operadores aritméticos, puede realizar un análisis matemático simple con valores para frecuencia de rango:
- + Agrega múltiples expresiones en un término de búsqueda
- – La expresión de la derecha se resta de la expresión de la izquierda, lo que proporciona una forma rápida de comparar el uso relativo de un término de búsqueda.
- Divide la expresión de la izquierda por la expresión de la derecha
- * Composición de expresiones para comparar ngramas de frecuencia muy variada. Asegúrese de encerrar el ngrama completo entre paréntesis para evitar no analizar el asterisco como un comodín.
- : busca el ngrama de la izquierda dentro del cuerpo de la derecha
dependencias
Finalmente, puede establecer dependencias con "=>" para buscar en las relaciones de idioma. “auto => rápido” arrojará resultados en los que “rápido” dependa gramaticalmente de la palabra “auto” o la modifique. Esto se puede mezclar libremente con cualquiera de las búsquedas avanzadas.
Conclusión
Cuando trabaja con Ngram, su búsqueda puede volverse compleja rápidamente. Algunos técnicas de búsqueda Estos juegan bien entre sí, mientras que otros son incompatibles. La mejor manera de ver si algo funciona es probarlo. Por ejemplo, _INF es muy flexible, mientras que _VERB es exigente. Aprenderá rápidamente sobre las peculiaridades a medida que profundice en el kit de herramientas Ngram Viewer.