Есть вопросы? info@skydigital.pro
Есть вопросы? info@skydigital.pro
В нашей модели электоральных предпочтений мы сильно упрощаем реальную картину и разделяем людей только на две группы по их политическим взглядам - "условные либералы" и "условные консерваторы".
«Либералы» - это люди, для которых на первом месте стоит личная свобода. Как следствие эти люди поддерживают идею невмешательства, или минимального вмешательства государства в их жизнь и экономику в целом.
Кратко их можно охарактеризовать словами «свобода», «перемены», «движение».
«Консерваторы» - это люди, приверженные традиционным ценностям, стабильности, противники радикальных реформ. Согласно их убеждениям, государство является гарантом этой стабильности.
Кратко - «традиции», «стабильность», «порядок» («скрепы»)
Если кто-то считает "либералы" ругательным словом, можно использовать термин "прогрессисты" или "модернизаторы", а консерваторов называть "традиционалистами", "государственниками" или "архаиками".
Предвосхищая многочисленные вопросы: мы не стали глубже детализировать группы по их политическим взглядам.
Модель не различает «ностальгирующих по СССР», «новых коммунистов», «националистов», «христианских демократов» и «левых зеленых». В текущей политической ситуации это не принципиально. Все перечисленные взгляды, так или иначе, относятся к условным «либералам» или «консерваторам».
политических взглядов пользователей
на которых была обучена наша математическая модель
которые модель учитывает при принятии решения
Математическая модель для определения электоральных предпочтений была построена на основе машинного обучения. Модель принимает решение после изучения интересов человека в его профайле в соц. сети ВКонтакте.
Для обучения модели была создана выборка из одного миллиона пользователей ВКонтакте.
Обращаем особое внимание, что при обучении модель «не знала» подписан ли пользователь на знаковые паблики, которые однозначно определяют приверженность к той или иной политической группе. Эти параметры не использовались, как входные данные.
Т.е. модель обучалась определять политические убеждения по совокупным неявным признакам.
Даже если человек открыто не заявляет о своих политических взглядах, или даже сам не догадывается о них, наша модель может их определить с большой степенью вероятности.
Для проверки модели на «переобучение» был использован стандартный метод кросс-валидации (метод перекрестной проверки). Обучающая выборка была случайным образом разделена на 10 непересекающихся подмножеств. На девяти модель обучалась, десятая - контрольная.
На контрольной сравнивалось расчетное значение с исходным.
Для оценки точности предсказания нашей модели мы взяли, обычно применяемый для оценки качества бинарной классификации, параметр AUC (area under the receiver-operating characteristic curve coefficient).
Для визуализации качества модели представлены графики ROC кривой и график плотности позитивных/негативных предсказаний в зависимости от значения порога отсечения («Сutoff»). Последний график позволяет оценить, насколько модель хорошо различает классы.
Видим, что графики практически хрестоматийно идеальны.
Левый график (ROC) сильно выгнут, а у правого графика максимумы позитивных (1 - красного цвета) и негативных (0 - зеленого цвета) решений максимально разнесены по оси Х.
Оба графика подтверждают высокое качество модели.
В итоге, при кросс-валидации, модель показала точность предсказания (AUC) 95%
(Реальная точность 0.9504812)
Интересно было наблюдать, как модель принимает правильное решение на основе небольшого количества совершенно неочевидных интересов человека, не имеющих никакого отношения к политике. Например, подписчики пабликов про путешествия имеют бОльшую склонность к либеральным взглядам.
Наша модель может анализировать интересы не только одного человека. Она специально разрабатывалась для одновременного исследования большого количества людей. С помощью нашей модели можно проводить социальное моделирование для разных отдельных субъектов РФ, а также для страны в целом.
Ни это ли было всегдашней несбыточной мечтой всех маркетологов?
Теперь это стало реальностью.
Мы рассчитали «индекс политической активности» для репрезентативной выборки избирателей из ряда городов Российской Федерации.
На основании расчета получили модель соотношения лояльных и оппозиционно настроенных людей.
Это, в том числе, позволяет прогнозировать результаты будущих выборов.
Метод объективен и не предвзят. Выборка составляет десятки (для крупных городов сотни) тысяч человек. Это несравнимо с социологическими опросами.
"Индекс политических взглядов" можно рассчитать для любой выборки id ВКонтакте, для города, для региона, либо для всей страны.
Напишите нам, если вы хотите получить результаты расчета.
Мы можем адаптировать модель под любые запросы:
Как и в случае с «индексом либеральности» мы можем обучить отдельную математическую модель анализировать и определять психотип человека в разных вариантах и комбинациях.
Это позволит максимально персонализировать передаваемую ему информацию, что в свою очередь приведет к максимально возможной конверсии.
Например: