Чтобы доказать свои заявления, ученые современный метод сравнения больших объемов данных. Такая современная методика сравнения больших объемов данных поможет в изучении ДНК и других объектов, представляющих собой последовательность символов.
Сервис Google Ngram содержит информацию, которая помогла ученым анализировать книги из базы Google Books. Так, исследователи проанализировали произведения на английском языке, которые были опубликованы в 1850-х, 1900-х и 1950-х годах прошлого века.
Модифицированная математическая функция – расстояние Йенсена—Шенона, которая используется математиками для анализа сходства и различий наборов символов, помогла ученым, которые в качестве заявленных символов, использовали слова. Так, исследование показало, что слова, которые часто используются, во всех текстах содержатся примерно в одинаковом количестве.
Как сообщает издание «ToDay News Ufa» со ссылкой на ученых, данное исследование справедливо не только для английского языка, но также и для русского и испанского.