5.000.000 сканировавшихся Google книг были обработаны таким образом, чтобы можно было отследить употребление определенных слов в книгах в разное время. Это позволяет строить достаточно точные графики "частотности" слов относительно исторических событий. Вот 15-минутная лекция на эту тему (русские субтитры):
Самое интересное, что все эти данные доступны любому желающему здесь (можно также скачать обработанную базу слов).
- Для того, чтобы сравнить несколько упоминаний, вводите их через запятую.
- Скрипт регистрозависимый ("Иванов" и "иванов" это разные слова).
- В базе имеются данные о книгах на русском языке.
Некоторые интересные диаграммы:
- "Популярность" Брэд Питта, Дженнифер Энистон и Анджелины Джоли в книгах и прессе с 1985 по 2008 год.
- "Популярность" Гитлера, Сталина и Черчиля с 1920 по 2008 годы.
- Кто круче - папы или мамы?
