Читать книгу Социальная физика. Как Большие данные помогают следить за нами и отбирают у нас частную жизнь - Алекс Пентленд - Страница 7

Выражение признательности
Глава первая
От идеи к действию
Социальная физика как всеохватывающая социальная наука

Оглавление

Большинство существующих общественных наук базируется либо на лабораторных исследованиях, либо на демографических данных – то есть средних величинах и стереотипах. Эти подходы не учитывают сложности реальной жизни, где одновременно вступают в силу все странности нашей психики. Они также упускают из виду тот крайне важный факт, что детали, имеющие отношение к людям, с которыми мы взаимодействуем, и к тому, как происходит это взаимодействие, играют не менее важную роль, чем рыночные силы и классовые системы. Социальные явления на самом деле складываются из миллионов маленьких транзакций между отдельными индивидами: люди обмениваются не только товарами и деньгами, но также информацией, замыслами и даже слухами. В этих индивидуальных транзакциях просматриваются шаблоны, вызывающие такие явления, как финансовый крах или «арабская весна». Нам необходимо понять эти микроалгоритмы, поскольку их нельзя просто свести к средним коэффициентам, поддерживающим классическое понимание общественного устройства. Большие данные дают нам возможность рассматривать общество во всей его сложности, посредством миллионов ниточек, протягивающихся от человека к человеку в процессе социального взаимодействия.

Если бы у нас было всевидящее око, мы, возможно, могли бы прийти к истинному пониманию того, как устроено общество, и предпринять шаги к решению наших проблем. К сожалению, как видно на рис. 1, практически все данные, добытые в рамках традиционных общественных наук (под номером 1), уместились рядом с координатой (0,0). Это означает, что эти наборы данных представляют собой информацию, полученную меньше чем от сотни людей и всего лишь в течение нескольких часов. Исследования под номером 2 и 3 – одни из самых крупных общественно-научных исследований на данный момент[13]. За последние десять лет социологи, работающие в области вычислений, узнали, как можно задействовать большие данные, и начали использовать пакеты информации, полученные, например, от операторов сотовой связи и компаний, занимающихся социальными сетями. Типичные примеры таких исследований представлены под номером 4. Увы, даже эти большие наборы данных скудны, так как они измеряют лишь по несколько переменных за раз. Таким образом, они дают очень ограниченное представление о человеческой природе.


Рис. 1. Квалитативный обзор наблюдений и экспериментов в области общественных наук. Горизонтальная ось показывает продолжительность сбора данных, вертикальная ось – объем и качество полученной информации. Показаны следующие комплексы данных: (1) Большинство научных экспериментов в области общественных наук; (2) Midwest Field Station (Barker 1968); (3) Framingham Heart Study (Dawber 1980); (4) Данные, полученные от телефонных операторов (Gonzalez et al. 2008; Eagle et al. 2010; Hidalgo and Rodriquez-Sickert 2008); (5) Исследования Reality Mining («добыча реальности») (Eagle and Pentland 2006); (6) Социальное развитие (Madan et al. 2012); (7) Друзья и родственники (Aharony et al. 2011); (8) данные электронных бейджей (Pentland 2012b); (9) «Данные в целях развития» (D4D, http://www.d4d.orange.com/home); (10) общее направление развития.


Социальная физика стремится получить как можно более глубокие и всеохватные количественные описания. Исследования под номерами 5, 6 и 7 проводились моей собственной исследовательской группой, которая использовала смартфоны для сбора информации; они использовали «социометры», или «умные» электронные бейджи с именами, для сбора данных для исследования номер 8 (подробности см. в Приложении 1: Добыча реальности); а для исследования под номером 9 – набор «данных в целях развития» (D 4D), охватывающих всю территорию Кот-д’Ивуар.

Достаточно поверхностно изучить рис. 1, чтобы увидеть, что наборы данных, полученные из социальной физики, многократно и по всем параметрам превосходят те, которыми оперируют другие социальные науки. Они цифровые, объемные и содержат колоссальное количество объективной, непрерывной и компактной информации, которая позволяет нам строить количественные, прогнозируемые модели поведения людей в сложных повседневных ситуациях.

Важно отметить, что точка, помеченная номером 10, обозначает направление, в котором движется мир. Уже по прошествии каких-нибудь нескольких лет мы, возможно, будем располагать невероятно богатыми данными о поведении практически всего человечества – и причем постоянно. Эти данные уже существуют в мобильных сетях, базах данных кредитных карт и других источниках, но в настоящее время только технические специалисты имеют к ним доступ. Однако по мере того, как они будут становиться все более доступными для научных исследований, новая наука социальной физики получит следующий толчок. Хочется надеяться, что, как только мы разработаем более точную визуализацию моделей человеческой жизни, мы сможем лучше понимать наше современное общество и управлять им, используя инструменты, лучшим образом приспособленные к сложно взаимосвязанной сети, объединяющей людей и технологии.


В поддержку этой книги я разместил в интернете несколько самых крупных в мире и подробнейших наборов данных, полученных из живых лабораторий. Эти новейшие источники цифровой информации позволяют нам с точностью измерить алгоритмы взаимодействий между людьми – или же между людьми и торговыми компаниями – и составить схемы и диаграммы на основе повторяющихся ситуаций, с которыми люди сталкиваются в процессе жизни. В эти наборы данных живых лабораторий входят:

Друзья и родственники: Собранные в течение около полутора лет данные о небольшом сообществе молодых семей, с большим диапазоном социометрических переменных, включая место расположения, расстояния, коммуникации, покупки, использование социальных медиа, мобильных приложений, и сон[14]. Мы измеряли по тридцать поведенческих переменных каждые шесть минут[15]. Материалы этого исследования содержат 1,5 миллиона часов количественного наблюдения за социальным опытом людей.

Социальное развитие: Собранные за девять месяцев данные об общежитии университета, с информацией о месте расположения, расстояниях и коммуникационными данными, обновляемыми каждые пять минут вместе с переменными, связанными со здоровьем, политикой и социометрией[16]. Это исследование включает в себя 500 тыс. часов количественного наблюдения.

Добыча реальности: Собранные за девять месяцев данные о выпускниках, работающих в двух лабораториях при университете, с местом расположения, расстояниями и использованием телефона, обновляемые каждые пять минут вместе с несколькими другими социометрическими переменными[17]. Это исследование покрывает более 330 тыс. часов взаимодействия между людьми.

Данные электронных визиток: Данные о служащих офиса, собранные за один месяц, с местом расположения, коммуникациями и информацией о жестикуляции, измеряемые каждые шестнадцать миллисекунд, наряду с точными измерениями рабочего процесса и процесса выполнения задач[18].

Анонимные данные, визуальные модели, код, документация и материалы доступны по ссылке: http://reality-commons.media.mit.edu. Эти наборы данных были получены с соблюдением федерального закона США об исследованиях с участием человека[19].


Эти живые лаборатории, в частности, дают детальный срез жизни американцев, но что насчет жизни людей в развивающихся странах, где проживает большая часть населения планеты? Первого мая 2013 года я представил публике «Данные в целях развития» – возможно, первый в мире полноценный общедоступный фонд больших данных: он содержит информацию о перемещениях и телефонных звонках, а также данные об экономике, цензуре, политике, продовольствии, инфраструктуре и малоимущих, охватывающие всю область африканской страны Кот-д’Ивуар. Эти данные теперь доступны по адресу: http://www.d4d.orange.com/home.

Эти обобщенные анонимные данные были предоставлены оператором мобильной связи Orange, при содействии Левенского университета (Бельгия) и моей исследовательской группы в МТИ, а также при участии университета Буаке (Кот-д’Ивуар), проекта ООН «Глобальный пульс», Всемирного экономического форума и GSMA – международной ассоциации мобильных операторов. В последней главе этой книги мы увидим, как этот информационный фонд используется уже сейчас для улучшения государственного управления и коммунальных услуг в Кот-д’Ивуаре.

13

Barker 1968; Dawber 1980.

14

Десятки стандартных психологических, социологических и медицинских опросов регулярно проводились в этих живых лабораториях – как правило, через интернет. Кроме того, были и более короткие, более частые опросы, проводившиеся при помощи смартфонов.

15

Aharony et al. 2011.

16

Madan et al. 2012.

17

Eagle and Pentland 2006.

18

Pentland 2012b.

19

Защиту участников обеспечивали: информированное согласие, возможность отказаться в любое время и гарантированно безопасное использование всех персональных данных, а также плата за участие.

Социальная физика. Как Большие данные помогают следить за нами и отбирают у нас частную жизнь

Подняться наверх