Как более эффективно искать Ngram с помощью Google Ngram Viewer

Google ведет многоязычную базу данных опубликованных языков. Коллективно исследуя книги, Google может обрабатывать текст и предоставлять на основе статистических данных повторение появления слов. С помощью поискового инструмента Google Ngram Viewer вы можете быстро и эффективно искать в огромных статистических данных. Сравнивая относительную популярность слов, вы можете установить, как смени язык и культура с течением времени. Ngram может делать гораздо больше, чем просто сообщать частоту слов в огромном тексте Google.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

Основные поисковые запросы (1 грамм)

1. Введите ключевое слово в Поле поиска Ngram.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

2. Если вы хотите искать слова с заглавной буквы, установите флажок «без учета регистра». В этом поиске в результатах будут возвращены «пицца» и «пицца».

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

3. Задайте параметры поиска внизу поля поиска. Сюда входят диапазон дат и языковая группа.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

Дата определяет ограничения по оси Y на графике. В зависимости от того, какую комбинацию вы выберете, максимальная и минимальная даты будут сильно различаться.

Значение сглаживания удаляет необычные волны и провалы в ваших данных. Более низкие значения сглаживания более точны, а более высокие значения показывают только более глубокие тенденции.

Выбор корпуса

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

Корпус - это основной текст, который Ngram Viewer будет изучать. "Английский" по умолчанию приемлем для обычного просмотра, но может быть очень академичным.

«Английская художественная литература» будет более точно отражать общий язык. Стандартный «английский» корпус может быть тяжелым из научно-популярной литературы с большим количеством технических слов. Google дает краткие объяснения того, что входит в каждую группу.

Расширенный поиск (от 2 до 5 граммов)

Добавляя дополнительные поисковые слова («граммы», на языке поисковых систем), вы можете создавать сложные сравнения с течением времени. Вы можете уточнить свой поиск, используя команды ключевых слов, такие как расширенные функции в поиске Google.

Разделяйте последовательные поисковые запросы запятой.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

Ngram Viewer отобразит относительную частоту ваших поисковых запросов на одном графике. Наведите указатель мыши на линии графика, чтобы увидеть точные данные.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

поиск по шаблону

Используйте звездочку («*») в условиях поиска в качестве подстановочного знака. Например, «Бакалавр *» вернет результаты для нескольких степеней бакалавра.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

поисковый разряд

Чтобы найти все формы и размышления термин, добавьте команду сценария «_INF». Это ищет каждую инверсию присоединенного слова, например, различные формы «быть» в английском языке.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

части речи

Если слово включает в себя много частей речи, вы можете добавить текстовые операторы для уточнения. Правильные части слова в базе данных Google включают в себя все следующее:

  • _ADJ_: прилагательное (быстрый, большой, умный)
  • _ADV_: наречие (быстро, позже, всегда)
  • _ПРОН_: местоимение (они, он, мы)
  • _DET_: определение чего-то (a, an, the)
  • _АДП_: (предлоги и послелоги)
  • _NUM_: число (первое, второе и пятое)
  • _CONJ_: спряжение (и, нет, но)
  • _ПРТ_: Particle, редкий класс, редко используется для других словарных функций

Каждую из этих граммов можно объединить в утверждения. Например, «_ADJ_ мальчик», которое вернет прилагательное супруг + слова «мальчик».

Чтобы указать конкретную часть речи для одного поискового запроса, добавьте его в конец: что означает «water_VERB», без нижнего подчеркивания.

Чтобы включить каждую часть речи для данного слова, используйте оператор подстановки после подчеркивания, как показано ниже.

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

Использование функциональных переменных

Функциональные переменные позволяют искать метод функции или позицию слов.

  • _КОРЕНЬ_ Заполнитель для корня для синтаксического анализа предложения, обычно это основной подлежащий или слово, измененное глаголом.
  • указывать _НАЧНИТЕ_ в начало предложения («_START_President» возвращает только предложения, начинающиеся с «президент»).
  • указывать _КОНЕЦ_ до конца предложения («_ADP_ _END_» возвращает предложения, заканчивающиеся предлогами).

Оверлей

Комбинируя условия поиска с арифметическими операторами, вы можете выполнить простой математический анализ со значениями для диапазона частот:

Как более эффективно искать Ngram с помощью Google Ngram Viewer - Статьи

  1. Добавляет несколько выражений в один поисковый запрос
  2.  Выражение справа вычитается из выражения слева, обеспечивая быстрый способ сравнения относительного использования поискового запроса.
  3. Разделите выражение слева на выражение справа
  4. * Составление выражений для сравнения графиков с разной частотой. Обязательно заключайте всю ngram в круглые скобки, чтобы не анализировать звездочку как подстановочный знак.
  5. : ищет ngram слева внутри тела справа

зависимости

Наконец, вы можете установить зависимости с помощью «=>» для поиска языковых отношений. «Car => fast» даст результат, в котором «fast» грамматически зависит от слова «car» или изменяет его. Его можно свободно смешивать с любым расширенным поиском.

Заключение

При работе с Ngram ваш поиск может быстро усложниться. некоторые методы поиска Они хорошо сочетаются друг с другом, а другие несовместимы. Лучший способ проверить, работает ли что-то - просто попробовать. Например, _INF очень гибкий, а _VERB придирчивый. Вы быстро узнаете о причудах, когда углубитесь в инструментарий Ngram Viewer.

Перейти к верхней кнопке