andresol: (Default)
[personal profile] andresol
Время от времени ко мне приходит желание поиграться с яндексовским Пульсом блогосферы. Можно увидеть, насколько было популярно то или иное слово или фраза за последнее время. Например, отметить появление в активном словаре слова «пичалька» в 2010 году. Интереснее всего, конечно, находить и анализировать регулярные паттерны и всплески.

Ниже приведен график для слов «пасха» и «рождество» (насколько я понимаю, Яндекс подсчитывает все формы слова).

На протяжении последних десяти лет мы видим четкие зеленые столбики «пасхи» весной и синие столбики «рождества» зимой. Однако в этом временном разрешении картина не полная. Стоит нам уменьшить окно поиска, как обнаруживается тонкая структура спектра.

Пики «рождество» оказываются двойными: главному пику в январе предшествует дополнительный пичок в декабре с константой расщепления в две недели. Это, в общем-то, неудивительно. Удивительно, что для «пасхи» такого расщепления не наблюдается.

Может быть, дело в том, что Рождество – выходной день (как у нас, так и у них), а потому более заметен простому, секулярному блогеру? Да нет, высота пиков показывает, что о «пасхе» пишут несильно меньше, чем о «рождестве».

Связано ли это с тем, что католическое Рождество глубже проникает в русскую культуру и ментальность, чем католическая Пасха? Ладно, пора уже дать правильный ответ для тех, кто до сих пор не догадался.

Католическая и православная Пасхи совпадали в 2010 и 2011 годах. Насколько я понимаю, такое совпадение два года подряд – явление относительно редкое. Так уж случайно получилось, что именно за эти два последние года Яндекс строит детализированную статистику.

Правильна та гипотеза, которая может не только объяснить наблюдаемые явления, но и предсказать будущее. Я предсказываю, что в 2012 году в Пульсе блогосферы «пасха» тоже будет двойным пиком с расщеплением в одну неделю. В масштабах года это будет не двойной пик, а пик с предшествующим ему плечом.

Date: 2011-09-30 10:06 pm (UTC)
From: [identity profile] denmes.livejournal.com
"Константа расщепления" :))

Нет, это наложившиеся синглеты :) или дублет и синглет :))

Date: 2011-09-30 10:19 pm (UTC)
From: [identity profile] andresol.livejournal.com
Это дублет, но с интенивностью линий не 1:1, а 1:2. Не знаю, возможно ли наблюдать такой сигнал в спектре ЯМР. Они обязаны быть симметричными. Хотя есть же "эффект крыши" в системе AB.

Date: 2011-10-01 05:31 pm (UTC)
From: [identity profile] ph-below-7.livejournal.com
Примесь)

Date: 2011-10-01 06:02 am (UTC)
From: [identity profile] vicche.livejournal.com
вот где непаханное поле исследований для лингвиста/журналиста с физическим образованием !

Date: 2011-10-01 06:08 am (UTC)
From: [identity profile] andresol.livejournal.com
В Science была статья (нормальная научная) по анализу подобных графиков, составленных по базе Google Books. Самой интересной частью было изучение цензуры. Например, выпадание определенных имен из немецких книг в 1933-1945.

Date: 2011-10-01 06:14 am (UTC)
From: [identity profile] vicche.livejournal.com
значит поле уже распахивают )
(deleted comment)

Date: 2011-10-01 06:09 pm (UTC)
From: [identity profile] andresol.livejournal.com
Нет, я впервые о таких графиках написал. Но поиск "грипп" за прошедший год показывает два пика: в конце января и середине марта. В более долгой перспективе можно увидеть, когда блогосферу накрывала истерия насчет свиного и птичьего гриппов. Потому правильнее использовать такую статистику для социальных исследований. Насколько быстро распространяются новости, и насколько быстро они забываются. Иначе можно ошибочно заключить, что тогда была эпидемия гриппа в России, раз о ней так много написано на русском языке.

Date: 2011-10-01 08:58 am (UTC)
From: [identity profile] whiskymaker.blogspot.com (from livejournal.com)
На графике "Пора валить" vs "вернуться в Россию" видна сильная дивергенция за последние годы)

Date: 2011-10-01 06:16 pm (UTC)
From: [identity profile] andresol.livejournal.com
Доля "пора валить" остается почти неизменной, а "вернуться в Россию" растет. Мне кажется, что россияне просто стали больше путешествовать, а потому чаще выезжать и возвращаться. А вот "пора валить" - определенный склад ума, и процент подобных блогеров примерно постоянен.

Date: 2011-10-01 09:55 am (UTC)
From: [identity profile] kubischkin.livejournal.com
Это мне кажется, или на первом графике видна незначительная устойчивая тенденция к росту выраженная как бы в скошенной базовой линии? К тому же интересно, с чем связаны локальные максимумы, скажем, для того же Рождества в 2004 и 2009-м.

Я не думаю, что расщепление для "Пасхи" будет таким значитеьным. Всё же католическая Пасха - это праздник католиков, а католическое Рождество - раскрученный бренд. Но для Пасхи вообще это удобнее, так как год от года меняется рабочая частота спектрометра разнос между Пасхами, скажем в 2016-м разница будет аж 5 недель и там уж точно будет видно отдельный пик перед католической Пасхой если такой есть.

Date: 2011-10-01 06:23 pm (UTC)
From: [identity profile] andresol.livejournal.com
Да, мне тоже кажется, что базовая линия "рождества" растет. То есть почему-то люди стали больше писать о рождестве летом, чем они делали раньше. Жить веселее стало: все о праздниках думают. В магазинах новогодние елки тоже наряжают все раньше: кто-то уже в ноябре.

Локальные максимумы всегда вызывают интерес: чем они вызваны. Фильм какой-нибудь вышел со словом "Рождество" в названии?

Скорее всего, в 2016 году я забуду, что вообще писал этот пост. Но если роясь в архиве наткнусь на него, то будет любопытно проверить, подтвердилась ли гипотеза.

January 2026

S M T W T F S
    1 23
456 78910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 12th, 2026 09:37 am
Powered by Dreamwidth Studios