Иван Климов о секции «Онлайн-активизм и социальные движения в оффлайне» на симпозиуме "Пути России"

31.03.2014

На симпозиуме «Пути России» мы делали секцию «Оосиинлайн-активизм и социальные движения в оффлайне». Ниже – мои заметки, не претендующие на полноту описания события. Скорее это сумбурное обозначение задач на ближайшее будущее. Одновременно на сайте http://newmediacenter.ru/ мы выкладываем презентации выступавших колллег.

Как всегда - не все получилось так, как задумывалось, и некоторые очень ожидаемые сюжеты и исследования не были представлены. Тем не менее некоторые выводы из очень познавательных выступлений я сделал, и очень хочется их обсудить. Поскольку мы нарабатываем опыт эмпирических исследований, и это самый важный результат.

Мы видим, что число исследований и публикаций по тематике Интернета и социальных движений растет (спасибо Полине Колозариди). Я думаю, это не случайно. И дело не только в том, что социальные движения – модная тема после всех арабских и постоветских историй с революциями. Просто сама рамка «возникающих сообществ» оказывается парадигматически и модельно-понятийно близкой исследованиям социальных сетей (SNA), содержательным задачам для алгоритмов BigData и полезна для более прикладных задач в области новых медиа. А возникающие сообщества и формирование их «сообщественных» практик в онлайне как раз удобнее всего изучать на примере гражданских мобилизаций, различимых нашим исследовательским оком в онлайне только потому, что они уже легитимировали себя в оффлайне. С низовыми инициативами – сложнее, тут придется решать вопрос, а не фейк ли это, какое отношение это имеет «реальности», и не медийная ли это мобилизация, которая возникает, разворачивается и умирает исключительно на сетевых просторах. В общем, возникает запрос на методологию, преодолевающую герметичность computerscience и онлайн-методов, задействующую исследовательские возможности как онлайн, так и оффлайн подходов. Не случайно многие вопросы были из серии: а отличается ли онлайн-лидерство от феномена лидерства, известного нам по длинной традиции исследований? И если да, то чем?

Острая методологическая недостаточность

Собственно, это первый пункт резюме по секции. Стало ясно, что очень многого пока нет. Нет:

- общего языка исследователей: очень часть априорные понятия и термины предопределяют наши исследовательские выводы. Точнее – умозаключения. Если мы методами SNA исследуем «сообщества» - вершины и связи между ними по признаку «общей (одинаковой) связи» - то мы в итоге и говорим о «существовании» «сообществ». В лучшем случае оговариваемся, что это «онлайн-сообщества» или «онлайн-лидеры»;

- нет общего понимания реперных точек в методологии, которые стоит обсуждать прежде, чем обращаться к содержанию работы и выводам. Получается, что решения по дизайну исследования принимаются, исходя из логики возможного (возможностей данных, возможностей алгоритмов), а не из логики методологической необходимости и получения валидного вывода. Важно понимать, что в Интернет-исследованиях непривычно многое зависит от уже имеющихся ограничений как алгоритмических, аппаратных, так и от особенностей дата-сетов;

- нет понимания – что делать с полученными результатами, зачем они? Даже если результат исследования оказывается осмысленным и удовлетворительным «изнутри» какой-либо отдельной дисциплины (computerscience, медиалогии, политологии, социологии и т.д.), то с позиций других дисциплин обнаруживаются угрозы для его валидности и осмысленности. То есть, многомерного и междисциплинарного понимания феноменов не складывается.

Приращения в теории пока неочевидны (я имею в виду теории, связанные с социальными движениями). С ответом на вопрос «что происходит» мы, исследователи, опаздываем – сейчас только разбираем кейсы 11-12, хорошо если 13 годов. Единственный раз ценность всей работы по моделированию графов сформулировал в кулуарах коллега: знание помогает определить «бриджи» (вершины, через которые изолированные сообщества, сети коммуникаций сообщаются друг с другом, от «bridge»). То есть определить тех, кого надо «закрыть» в онлайне и оффлайне для того, чтобы нарушить координацию, распространение информации и сбить мобилизацию.

Светлана Бодрунова совершенно точно замечает - никто из нас не ставит вопрос, как оценивать развитие социальных движений в сети (как и развитие медиа) с точки зрения «больших» междисциплинарных теорий, типа теории модернизации, демократической теории и т.п. (правда, намек на такой подход есть в презентации И. Соболевой). Лично для меня примером такой работы в области теории является выступление Донателлы дела Порты прошлой осенью на «ВДНХ» - конференции Европейского Университета в СПб. Однако и она все-таки не затрагивала более важных для нас проблем - как оцениваются сетевые феномены с точки зрения этих «больших теорий». Ведь о чевидно, что примеры уличных протестов и революций социологически амбивалентны: с одной стороны, они показывают рост политической вовлеченности (например, Л. Тевено), с другой – неэффективность институциональных механизмов политической репрезентации. то есть, - мысль Светланы Бодруновой – при планировании исследования полезно (неплохо было бы) задаваться вопросом – какой вклад в обсуждение одних и тех же феноменов в рамках «больших» теории мы могли бы сделать со своей «дисциплинарной» стороны.

Устоит ли осьминог на одной ноге?

Становится понятно, что исследовать что-либо по одной из сетей – э.... ну, буду использовать слово «опасно». Очень тонкое и выверенное по реализованным процедурам исследование Светланы Бодруновой об отображении событий в Бирюлево в Твиттере сталкивается с некоторыми проблемами:

- опыт анализа по другим датасетам: на начальном этапе наибольшая доля дискурса про Бирюлево продуцировалась на местных форумах молодых мамаш (работа тоже не вполне корректна, но уже в другой ее части);

// Комментарий С.Б.: софта нет. Наши исследования – очень софт-ориентированные. а значит – платформенно-ограниченные. Поэтому мы изначально очень редко можем отследить данные на разных платформах. Что с этим делать – никто не придумал. Ну, разве что мы стараемся задавать такие исследовательские вопросы, ответы на которые можно экстраполировать за пределы платформы;

- опыт сетевой антропологии (тематический серфинг) и обычных интервью-бесед: на втором этапе тема перекочевала на фанатские (спартаковские) форумы через кого-то из бирюлевских фанатов.

Как раз это и должно было продемонстрировать исследование Л. Полищука, М. Петровой и Р. Ениколопова на датасете протестных сообществ в различных сетях и активности протестов (частота-численность) в реале. Их вывод: диверсификация социальных сетей снижает интенсивность и численность акций протеста.

Ни с чем не сравнимое удовольствие

На секции было много вопросов из серии: в чем схожесть и специфика онлайн-феноменов в сравнении с их оффлайновыми синонимами (активизм, лидерство, солидарность и т.д.)? Можно ли проследить рецепцию онлайн-феноменов в оффлайне? Например, очень интересна работа Анны Саниной про инструменты формирования иронии на примере сообщества «Поцтриот» - существующего примерно лет 8, пережившего московские уличные хэппенинги 2011-12 гг. Но в дизайне исследования не предусмотрен вопрос о выяснении социальных эффектов того креатива, который производит сообщество. Являются ли выявленные механизмы специфичными для онлайн-иронии, или же в них обнаруживаются универсальные приемы смеховой реинтерпретации реальности? Как можно отследить именно трансляцию, передачу мемов из этой «артели» в иные сообщества и практики? Тот же самый аргумент адресую и нашему исследованию с Татьяной Индиной: какими аргументами мы можем обосновать схожесть и отличия оффлайн- и онлайн-лидерства, кроме прозвучавшего «я так вижу» (с вежливой оговоркой, что это, мол, гипотеза, наше пока еще ничем не подтвержденное впечатление от беглого анализа данных).

Ирина Ксенофонтова (вместе с Ириной Тартаковской и Александриной Ваньке) предприняли попытку нащупать механизмы протестной мобилизации «изнутри» активности онлайн-сообществ. Однако, на мой взгляд, исследовательская задача реализовалась скорее дискурсивно. Вот пара выводов: «онлайн- и оффлайн-активность... органично и непротиворечиво перетекают друг в друга»; «интернет-коммуникация является “несущим стержнем” современного протеста...». Положа руку на сердце, материалы исследования лишь отчасти позволяют увидеть как именно «перетекают» онлайн-офлайн активность (постинг фотографий с митинга), и никак не свидетельствуют об «органичности и непротиворечивости» такого перетекания. Собственно, авторы в своих выводах как раз и говорят о необходимости дополнить уже реализованный подход иными, оффлайновыми методами.

Вывод для нашего цеха очевиден: важная перспектива в развитии интернет-исследований – развитие OOPS-методологии (аббривиатуру мы придумали с Ольга Кравцова, она расшифровывается как Online-OfflinePhenomenaStudies). В должно лежать понимание, что уже на начальном этапе в дизайн исследования нужно закладывать этот дуализм как методологический принцип и руководствоваться им при постановке исследовательской проблемы, выборе методов, планировании образа результата.

OOPSIdiditagain

Какими могут быть приемы OOPS-подхода? Не претендую на полноту, перечислю только то, что пришло в голову, когда слушал выступления коллег.

Во-первых, смотреть, какие признаки поведения в оффлайне мы можем обнаруживать в онлайне. Например, как это сделал Carlos Diuk, Facebook Data Science; он показал, как в соцсетях меняется ориентированное друг на друга поведение мужчины и женщины, после того как они образовали пару в реале (https://www.facebook.com/notes/facebook-data-science/the-formation-of-love/10152064609253859). Еще вариант – использовать возможности геолокации с учетом имеющихся ограничений. Например, как это было использовано Бенджаменом Линдом, собиравшего твиты с геометками сперва в течение проходивших акций протеста, а затем – через неделю после.

Во-вторых, проводить исследования одних и тех же кейсов на базе различных датасетов по социальным сетям (поскольку алгоритмы работы с ними в разных организациях имеют существенные различия), плюс к этому – дополнять их данными иной природы (например, метеорологическими, что может быть полезно для исследования протестов).

Понятно, что сейчас мы накапливаем опыт работы с большими данными, со стратегиями SNA, сентимент-анализа, анализа семантики, смотрим, какого рода выводы мы можем делать на основе этих методов. Радует, что коллеги приближаются к следующему шагу – одновременное использовать и новые, и традиционные методы. Хороший пример – исследование наблюдателей на московских выборах, представленное Сергем Давыдовым, Ольгой Логуновой, Екатериной Лыткиной и Павлом Лебедевым. Эта работа навела меня на мысль, что одна из проблем, которую предстоит решить в рамках OOPS – как при исследовании одного кейса или феномена преодолевать дискретность, недостаточную согласованность используемых методов. Причина дискретности – в очень уж разной природе данных, получаемых, например, при анализе постов в соцсетях и из интервью. Например, да, мы вытаскиваем мотивацию наблюдателей из интервью. Что это нам дает для стратегии SNA? Можем ли мы при интерпретации результатов SNA опереться на список мотивов, полученных с помощью интервью? Или – более прагматичный вопрос: из интервью мы выяснили медиапредпочтения наблюдателей – можем ли мы сравнить это с данными SNA или данными иной природы? Тут стоит ПОДУМАТЬ о методиках, которые можно применять шире, чем для одного датасета, применимых к разным типам исходных данных.

Вывод такой: если мы ставим определенную задачу и подбираем метод ее решения (а тем более, если используем набор методов), важно проговаривать эпистемические ограничения, которые возникают в следствие а) специфики методов, б) особенностей сбора первичных данных. Особенно это важно для процедур сбора данных по социальным сетям, онлайн-опросов, опросов по панели и т.д. Вместе это все как раз и нужно, чтобы понимать возможности именно что комплексного использования методов и подходов для решения единой исследовательской задачи. Это звучит тривиально, но если мы будем трезво оценивать дескриптивные способности данных, то будем точнее планировать дизайн исследования, не будем мыслить категориями репрезентативности в тех исследованиях, где ее в принципе невозможно обеспечить.

У меня есть мнение, но я в нем не уверен

Еще одна область задач для развития – валидизация процедур и выводов как обязательный элемент дизайна исследования. Такое вот тонкое, немного снобистское наблюдение-трюизм. Так в чем же проблема? Тут я вижу три области задач.

Первое. Мы имеем дело с новыми социальными феноменами, для которых еще не выработано операционального языка. Ну, во всяком случае, нет конвенционального языка, есть понятия, основанные на ощущении «интуитивной уместности» их использования. «Френды» - это не друзья, и даже не всегда сообщество. «Пост» имеет лишь некоторое отношение к «мнению» и «позиции»; у него обнаруживается множество коммуникативных задач и свойств, а сами пишущие различаются по уровню компетенций управлять ими. Но речь все-таки о другом пласте профессионального языка. И если уж мы используем какие-то теоретические идентификаторы, то надо сомневаться в их адекватности. Например, одно из исследований мы начали с сомнения, что наблюдатели — социальное движение. Дальше напрашивалось, что нужно построить концепцию СД и проверить применимость ее к кейсу наблюдателей. Примерно та же критическая логика напрашивалась, когда я слушал некоторые из выступлений. Ну, про роль исследователей социальных протестов в легитимации понятия «креативный класс» применительно к «оппозиции» говорилось уже много раз. Коротко – если вначале презентации идет ссылка на Флориду, то можно с уверенностью предполагать, что в выводах будет показано существование «креативного класса».

Но для других случаев это уже не является столь очевидным. Например, если мы изучаем роль сетей в «политической мобилизации», то можем ли мы быть уверенными, что мы умеем отделить ее от разновидностей «неполитической» мобилизации и что в данном конкретном случае мы изучаем именно ее? На чем строится наша уверенность, что это «политическая» мобилизация – только на том, что мы изучаем активность «протестных групп»?

Аналогичную проблему мы горячо обсуждали с Татьяной Индиной – применительно к понятиям «онлайн-активизма» и «онлайн-лидерства». У меня нет твердой уверенности, что мы смогли решить эту проблему методологически аккуратно и операционально корректно. Опасность в том, что само понятие «лидерства» заставляет нас наделять наших онлайн-респондентов качествами «лидеров», подразумеваемых в оффлайне, хотя мы старательно проговариваем дистанцию между онлайном и оффлайном.

В общем, наш теоретический язык, который мы используем, предопределяет наши выводы. Находясь внутри исследования, сложно поймать действие этого ограничения. Надежда только на критику коллег.

Вторая проблема - непредсказуемость содержательных лакун и смещений.

Большие данные и SNA позволяют получать порой уникальную информацию о процессах, однако неполнота и однобокость дизайна исследования может скрывать неожиданные смещения. То же самое относится и большому циклу опросов на митингах (российских, украинских). В условиях, когда репрезентативности добиться невозможно, репрезентация участников реализуется через процедуры систематического отбора. Однако мы не можем быть в полной уверенности в том, что своеобразный уличный опрос в экстремальных условиях не имел неожиданных систематических смещений. Например, если опрос «активистов Навального» показывает, что они были вовлечены в его московский предвыборный проект в режиме «fulltime», то напрашивается задача перепроверить такой контринтуитивный вывод.

Андрей Щербак и Олеся Кольцова анализом блогов в ЖЖ показали, что для 11-12 гг. основным выгодополучателем от политической активности блоггеров стали «оппозиционные» партии, и в большей степени - КПРФ. Они смотрели на соответствие их анализа блогов с данными поллстеров, и экспликация анализа такого соответствия оказывается важнее, чем сам содержательный вывод. Конечно, тут возникают дальнейшие вопросы по вализидации выводов (можно ли сравнивать с общероссийскими данными анализ топ-2000 в ЖЖ), но важен пример установки на валидизацию результатов SNA.

И третье. В целом ряде работ и выступлений была показана необходимость «экспертного кодирования». Галина Градосельская (к сожалению, не смогла выступить, но ее презентацию выкложим со всеми) использовала процедуры «экспертного кодирования» (в ее терминологии) для того, чтобы прояснить: а с какими именно сообществами, выделенными в результате ее методологии «зерновой кластеризации», она имеет дело? Насколько я понимаю, была реализована процедура, аналогичная кодированию открытых вопросов, когда сперва исследователь проводит «сетевую антропологию» выделенных онлайн-сообществ и систематизирует увиденное в кодификаторе. Затем с группой кодировщиков-«экспертов» проговаривается логика идентификации того или иного признака применительно к всему набору сообществ, а следом происходит кодировка материала: присвоение кодов конкретным объектам – онлайн-сообществам. После этого данные SNA получают больший содержательный «объем».

Похожий подход реализован в исследовании Светланы Бодруновой и ее коллег по теме Бирюлево в твиттере. Сперва проводилось предварительное чтение с отбором хэштегов. Затем: закачка твитов для создания словаря; автоматическое создание словаря с очисткой и лемматизацией; экспертное чтение словаря и создание двух «экспертных» словарей с разной степенью присутствия общей лексики. Дальше - собственно кроулинг на основе словарей. Вторая – независимая линия – это кодирование датасета твитов по 26 параметрам в мета-данных, не связаных с анализом словаря. Этот разрыв в дизайне исследования может быть преодолен, если использовать выделенные лексико-семантические ряды для автоматического (или полуавтоматического) кодирования твитов. И этот методический кейс будет показателен: что можно делать автоматическими методами, а где и насколько можно вмешиваться «экспертным» образом.

То есть, создавался «автоматический частотный словарь» текстов твитов, а затем проводились его очистка и лемматизация. Это, видимо, может быть подготовительным этапом – создание кодификатора, на основании которого затем можно производить кодировку твитов. С моей точки зрения, описанный набор действий опять же отсылает к методическим требованиям процедуры кодирования открытых вопросов с необходимостью триангуляции, обсуждения правил группировки, иерархической организации кодов, правил присвоения кодов и т.д.

Итак, напрашивается резюме - SNA не может быть полностью автоматическим; в ряде важных этапов реализации той или иной процедуры аналитик вмешивается в действие алгоритма, исходя из каких-то своих соображений. Соответственно, вывод первый: важно эксплицировать логику принятия решений, показывать, где и какое было произведено вмешательство человека в действие алгоритмов анализа. И второе: актуальной становится задача по содержательной идентификации результатов автоматической кластеризации, комбинаций, списков и т.п. А это, так или иначе, предполагает «экспертное кодирование», содержащее в себе 4 действия: знакомство с массивом данных, выделение компонентов, значимых для исследования, организация кодификатора, кодировка – приписывание кодов массиву, в ходе которого кодификатор может изменяться. И только затем - обработка.

«Вместо “заключения”»

Итак, требуется заключение. Общее впечатление от выступлений и обсуждения – оптимистическое. Во-первых, есть сообщество высоко мотивированных исследователей и оно динамично развивается. Во-вторых, очевидна потребность в экспликации уже полученного опыта и скучного разговора о процедурах, методических и методологических проблемах. В-третьих, необходимость валидации исследовательских процедур и выводов, получаемых на основании SNA, приводит к необходимости развивать OOPS-подход, в рамках которого должны сопоставляться датасеты с различной природой данных. В-четвертых, такого рода исследования требуют не просто коллективной работы, но и работы междисциплинарных команд и кооперации организаций (готовьтесь к появлению публикаций с десятком фамилий в авторах!). Ну и, конечно, это вопрос оперативности. Невозможно обсуждать эффекты социальных сетей, отыгранные три года назад.

Всем – хорошей охоты!


Иван Климов



Пн Вт Ср Чт Пт Сб Вс
28 29 30 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1