Ученые приспособили поисковый сервис
До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти
Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.
Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.
Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам.
Ссылки по теме
-
-
-
-
-
-
Сайты по теме
-
Анонсы новостей ![]() |
Критические периоды развития у человека и вундеркинды Делаются определённые обобщения, коррелирующие с моделью представлений об организации механизмов психики МВАП: Критические периоды развития у человека и вундеркинды. 13-12-2020г. |
Обобщение материалов исследований сетчатки глаза Сетчатка: Обобщение материалов исследований сетчатки глаза. 07-11-2020г. |
Проблемы академической науки Безынициативность в отсутствие личного интереса, план по валу статей, все большая коммерческая составляющая и многое другое: Проблемы академической науки. 11-10-2020г. |
Ориентировочный рефлекс Обобщение фактических данных исследований по функции и механизмам ориентировочного рефлекса – границы между рефлексами и сознанием: Ориентировочный рефлекс. 20-09-2020г. |
Колонки новой коры Обобщение фактических данных исследований по кортикальным колонкам новой коры: Колонки новой коры. 29-08-2020г. |
Ячеистая структура нейросети Обобщения серии экспериментов с разными типами схем соединений элементов нейросимулятора в виде ячеистых структур: Ячеистая структура нейросети. 02-08-2020г. |
Анонс предметной области: «Схемотехника адаптивных нейросетей» Эта программная статья анонсирует формирование среды коллективного исследования на сайте Форнит : Анонс предметной области: «Схемотехника адаптивных нейросетей». 19-07-2020г. |
Конструктор нейросхем Для тех, кто желает развить навыки схемотехнического мышления в игровом режиме и лучше понять работу природных нейросетей: Конструктор нейросхем. 04-07-2020г. |
Деменция Деменция как норма индивидуальной адаптивности: Деменция. 19-06-2020г. |
Книга «Что такое Я - схемотехнический подход» Содержание книги основывается на постулате, что природная нейросеть мозга является схемотехнической структурой - в точности, как это можно сказать про схемотехнику электронного прибора - при всей огромной разнице в способах реализации. Книга «Что такое Я - схемотехнический подход». 11-06-2020г. |
|