Демографическая статистика Балашки

Как известно — любимое занятие вебмастеров и прочих владельцев сайтов — это пускание слюней на статистику посещаемости :) Я, естественно, не исключение. Во время очередного такого сеанса аутотренинга и повышения самооценки обратил внимание на любопытный факт — средний посетитель Балашки — старше среднего посетителя Балашовера и на Балашке больше доля прекрасной половины человечества. Подробности под катом.

Вот структура посещаемости Балашки — пол.
балашка пол

Тот же отчет, но по Балашоверу
балашовер пол

А вот возрастная структура посетителей Балашки
балашка возраст

Та же статистика по Балашоверу
балашовер возраст

Все данные взяты за месяц с 18 сентября по 18 октября.
  • 0
  • 18 октября 2010, 21:55
  • az

Комментарии (14)

RSS свернуть / развернуть
+
0
Про пол — все понятно. А возраст? Почти никто не указывает возраст. Откуда догадался? А куда относятся те на Балашке, кто якобы «заблудился». Это, вообще, кто такие?
avatar

aliska

  • 19 октября 2010, 08:24
+
0
У очень многих ечть почта на яндексе. Очень многие зарегены в мой.круг например — яндексовская соц сеть, у яндекса долгое время были партнерские отношения с майлру — наверняка и с ними делятся такими безликими но данными. Итого Если у вас есть почта на яндексе или майле или аккаунт в моемкруге — то яндекс точно узнает сколько вам лет. Яндекс — потому что счетчик посещаемости здесь — Яндекс.Метрика. По остальным — это вычисляется с помощью статистических моделей. То есть это статистика не внутренняя балашки — а статистика яндекса.

Заблудившиеся и активные — эти показатели отражают активность пользователей за последнюю неделю. Как-то так.
avatar

az

  • 19 октября 2010, 08:29
+
0
Не зарегина в моем круге, и нет почты на яндексе, т.е. мой возраст — тайна. :) Таким образом, получается, что если не у всех есть почта и не все зарегины, значит цифры отображают «погоду на Луне». Или я ошибаюсь?
avatar

aliska

  • 19 октября 2010, 08:42
+
0
Нет почты на яндексе, майлру, не зарегены в моемкруге?
И не пользуешься яндексом?

Если данных нет — то возраст вычисляется на основании поведенческого анализа — с помощью вероятностных моделей.

Поэтому эта модель по возрасту отражает не точные данные — а вероятностные. У кого-то возраст известен точно, у кого-то высчитан по формуле. Даже построенная по таким людям статистика будет очень близко к истине отражать возрастной расклад всей выборки.
avatar

az

  • 19 октября 2010, 08:47
+
0
Аз, скинь формулу, а? :) Пожалуйста! Плохо училась. Теорию вероятности не преподавали. А так интересно.
avatar

aliska

  • 19 октября 2010, 08:58
+
0
Формулы яндекса составляют комерческую тайну и за знание их отдали бы многие миллионы нерусских денег.

Но подозреаю что там что-то из таких областей статистики, как уравнения регрессии, кластерный анализ и классификация. И вариации этих классических методов. Либо может быть там механизм искуственных нейронных сетей.

Анализируется набор признаков, отражающих поведение конкретного индивидума в поиске или на сайтах, где установлены счетчики или реклама яндекс директ (типа той что на балашовере над формой комментариев) у тех пользователей где известен точный возраст и пол. И дальше на основании набора каких-то масочных поведенческих особенностей — вычисляется кто есть кто.
avatar

az

  • 19 октября 2010, 09:06
+
0
Убил. Штирлиц.
avatar

aliska

  • 19 октября 2010, 09:09
+
0
Почему штирлиц?
Каждому из этих методов на профильных специальностях вузов посвящены семестровые курсы лекций. Их правда там дафига. Яндекс может помочь я думаю :)
avatar

az

  • 19 октября 2010, 09:22
+
0
Как он может помочь, если это стоит миллионы. Чудеса. Но в целом и общем все понятно.
avatar

aliska

  • 19 октября 2010, 15:37
+
0
Ну методы которые там внутри у яндекса — их никто не расскажет. А примерные методы, классические, производными из которых скорее всего будут и яндексовые алогритмы — они известны и преподаются в институтах. Не секрет вобщем.
avatar

az

  • 19 октября 2010, 16:13
+
0
Анализируется набор признаков, отражающих поведение конкретного индивидума в поиске или на сайтах, где установлены счетчики или реклама яндекс директ
Если проанализировать камменты в статьях на Балашовере, то средний возраст людей — 10-15 лет
avatar

around

  • 19 октября 2010, 11:35
+
0
Вот кстати майлру использует эти данные в массах и объявляет об этом с высоких трибун www.searchengines.ru/news/archives/009381.html
avatar

az

  • 20 октября 2010, 08:52
+
0
az, демогр. статистика Балашки на начало ноября планируется? уж очень интересно! :)
avatar

Eva

  • 29 октября 2010, 20:37
+
0
Будет конечно полная статистика за первый полный месяц работы балашки. В воскресенье вечером думаю сваяю :)
avatar

az

  • 29 октября 2010, 22:26

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.