Читать книгу BIG DATA. Вся технология в одной книге - Андреас Вайгенд - Страница 4
Введение
Революция социальных данных
Как можно заставить информацию приносить пользу людям?
ОглавлениеВсякая революция начиналась с мысли одного человека; а когда та же мысль овладевала другими людьми, она становилась главенствующей для своего времени[11].
Ральф Уолдо Эмерсон
В 6.45 утра меня будит сигнал будильника в моем мобильном телефоне. Я бодро перемещаюсь вместе с телефоном на кухню, чтобы начать день с просмотра электронной почты и ленты уведомлений в Facebook. GPS-приемник реагирует на мои перемещения на несколько метров на север и на восток, которые записываются в память телефона. Я наливаю себе кофе и начинаю вести себя более активно. При этом акселерометр телефона отслеживает, насколько быстро я двигаюсь, а барометр фиксирует мой подъем вверх по лестнице. Поскольку на моем телефоне установлены приложения Google, все эти данные попадают в базы этой поисковой системы.
Позавтракав, я отправляюсь на работу в Стэнфордский университет. Энергосбытовая компания установила в моем доме «умный» счетчик, который фиксирует снижение потребления электричества по мере того, как я выключаю свет и отключаю зарядные устройства моих гаджетов. Когда я открываю двери гаража, счетчик отмечает расход электричества, характерный именно для этого события. Поэтому к моменту, когда я выезжаю на улицу, у моей энергосбытовой компании достаточно информации для того, чтобы понять, что я не дома. А когда сигнал телефона переходит к другой вышке сотовой радиосвязи, это понимает и мой мобильный оператор.
Камера, установленная на углу, сфотографирует номерной знак моего автомобиля в случае, если я проеду на красный. Но сегодня я веду себя паинькой, поэтому появления в почте квитанции со штрафом не предвидится. Тем не менее по пути мой номерной знак попадет под камеры наблюдения еще не раз. Некоторые из этих камер принадлежат районным властям, другие – частным компаниям, анализирующим данные для выявления закономерностей в перемещениях. Результаты их анализа – продукт, который покупают полицейские управления, девелоперы и прочие заинтересованные лица.
Приехав в Стэнфорд, я оплачиваю парковку с помощью приложения EasyPark в моем телефоне. Деньги автоматически списываются с моего счета, а факультет и банк теперь знают, что я приехал в университет ровно в 9.03 утра. Когда телефон перестает перемещаться вместе с машиной, Google решает, что это место парковки, и записывает координаты, на случай, если я вдруг забуду, где оставил машину. А еще пора свериться с приложением страховой компании Metromile, которое считывает данные о моей поездке с бортового компьютера автомобиля. Оно мгновенно сообщает, что расход бензина сегодня был ниже (один галлон на девятнадцать миль) и поездка обошлась мне в 2 доллара 5 центов.
После занятий я планирую повстречаться с одним новым знакомым из Сан-Франциско. Виртуально мы уже встречались, комментируя в Facebook пост одного общего приятеля, и у нас обнаружилась общность точек зрения на затронутую тему. Оказалось, что у нас больше тридцати общих знакомых в Facebook – более чем достаточная причина для личного знакомства.
Google Maps прогнозирует, что я окажусь на месте к 19.12, и, как обычно, этот прогноз оказывается точным плюс-минус пара минут. Оказывается, что квартира моего нового знакомого расположена прямо над магазинчиком, который торгует табачными изделиями и разнообразными принадлежностями для употребления марихуаны. GPS-приемнику моего телефона разница между магазином и квартирой, расположенной выше, непонятна, и с точки зрения Google и моего провайдера мой день увенчался посещением хэдшопа. Я понимаю это по рекламе, которую показывает мне Google, когда просматриваю прогноз погоды на завтра перед отходом ко сну.
Революция в использовании социальных данных идет полным ходом.
Дашь на дашь
Схожие социальные данные ежедневно создают более чем миллиард людей. Социальные данные – это информация о вас, например о ваших перемещениях, поведении и интересах, а также об отношениях, связывающих вас с другими людьми, местами, товарами и даже идеологиями[12]. Некоторые из этих данных предаются огласке сознательно и добровольно, например, когда вы авторизовались в Google Maps и вводите свой маршрут; другие – не столь осознанно, а в качестве неотъемлемой составляющей пользования интернетом и мобильными устройствами. Понятно, что в некоторых случаях предоставление информации является необходимым условием получения услуги: Google не сможет проложить лучший маршрут, если вы не сообщите системе, где находитесь и куда хотите попасть. В других случаях вы сами рады поделиться информацией – например, когда лайкаете пост знакомого в Facebook или даете одобрительный отзыв о работе коллеги в LinkedIn просто потому, что хотите оказать им поддержку.
Социальные данные могут отличаться исключительной точностью, например указывать ваше местонахождение с точностью до метра, но часто бывают отрывочными и недостаточно полными. Например, пока я не зарегистрируюсь в приложении, которое считывает показания моего «умного» электросчетчика (допустим, по дороге в аэропорт, чтобы убедиться, что я действительно выключил весь свет в доме), энергосбытовая компания знает, что меня нет дома, но не более того. Этот касающийся меня показатель с равным успехом может оказаться и полезным, и бесполезным. Так, во время моего визита к знакомому в Сан-Франциско широта и долгота моего местонахождения были отражены точно, а предположения о том, что я делал тем вечером, оказались совершенно неверными. При всем своем правдоподобии вывод Google оказался всего лишь поверхностной интерпретацией. Отрывочные данные обычно оказываются недостаточными, сопряженными с риском ошибки, а иногда и умышленно сфальсифицированными[13].
В целом же объем социальных данных (пассивных и активных, обязательных и произвольных, точных и приблизительных) растет в геометрической прогрессии: он удваивается каждые восемнадцать месяцев. Через пять лет объем социальных данных возрастет примерно десятикратно, или на порядок, а через десять лет он увеличится примерно в 100 раз. Другими словами, сейчас за один день фиксируется столько же данных, сколько в течение всего 2000 года. А при сохранении существующих темпов роста в 2020 году мы будем создавать такой же объем данных менее чем за час.
Очень важно понимать, что «социальные данные» – отнюдь не просто очередное модное наукообразное словосочетание применительно к социальным медиа. Многие платформы социальных сетей создавались в целях широкого охвата массовой аудитории. Социальные данные становятся все более демократичными и доступными: информацией о себе, своей компании, своих успехах и своей точке зрения можно добровольно делиться в Twitter или в Facebook. Но люди оставляют намного большее количество глубоких цифровых следов на куда более обширной территории. Ваши поиски в Google, ваши покупки в Amazon, ваши звонки по скайпу, каждомоментное местонахождение вашего телефона – все эти и многие другие источники позволяют создать уникальный портрет вашей личности.
Далее, социальные данные – это не только вы сами. Характер ваших коммуникаций с родными, знакомыми и коллегами представляет собой информацию о прочности ваших связей с ними. Вы пополняете картину социальных данных и в ходе разовых контактов с совершенно незнакомыми людьми – так происходит, например, когда вы вводите тэги в Инстаграме или оставляете отзыв на какой-то товар. Создавая аккаунт на сайте аренды жилья Airbnb, вы подтверждаете свою личность не только официальными паспортными данными, но и профайлом в Facebook. Фиксация социальных данных предусмотрена и в домах с «умными» кондиционерами, и в автомобилях с навигационными системами, а также на рабочих местах с программными средствами коллективного пользования. Эти данные начинают аккумулироваться в учебных аудиториях и кабинетах врачей. По мере того как мобильные телефоны обрастают все большим количеством датчиков и приложений, отслеживающих ваше поведение дома, в магазине и на работе, становится все менее возможным контролировать распространение информации не только о своем обычном образе жизни, но и о своих сокровенных желаниях. Специалисты по обработке и анализу данных превращаются в детективов и художников, способных создавать все более и более точные образы личности на основе оставленных цифровых следов.
Эти цифровые следы исследуются и обрабатываются для того, чтобы получать представление о наших предпочтениях, выявлять тренды и делать прогнозы, в том числе и о возможных покупках. В качестве главного научного консультанта Amazon я вместе с Джеффом Безосом разрабатывал информационную стратегию компании, основанную на анализе интересов потребителя. Наши эксперименты были призваны установить, что в большей степени влияет на удовлетворенность покупателя продуктом – отзывы других потребителей или отзывы в прессе. Мы также хотели выяснить, что работает эффективнее – рекомендации на основе традиционных демографических характеристик или на основе истории просмотров каждого потенциального покупателя. В результате мы убедились, что эффективнее всего стимулирует продажи метод непосредственной коммуникации. Созданные нами для Amazon инструменты персонализации радикально изменили подходы людей к решению о покупке товара и стали стандартом электронной коммерции.
ДОСТУП К ЛИЧНОЙ
ИНФОРМАЦИИ ЧЕЛОВЕКА —
РЕАЛЬНАЯ УГРОЗА
ЕГО БЕЗОПАСНОСТИ
После ухода из Amazon я вел учебный курс «Революция в использовании социальных данных», который прослушали тысячи студентов – от старшекурсников и аспирантов Стэнфорда и Калифорнийского университета в Беркли до слушателей китайских бизнес-школ Фуданьского университета в Шанхае и Университета Синьхуа в Пекине.
Кроме этого я продолжаю руководить созданной мной в 2011 году Лабораторией социальных данных (Social Data Lab) – коллективом авторитетных специалистов в области обработки и анализа информации. На протяжении десятилетия работы с заказчиками, в числе которых крупнейшие корпорации (Alibaba, AT&T, Walmart и United Healthcare), авиакомпании, представители финансового сектора и сайты знакомств, я неизменно выступаю за предоставление права участия потребителей и пользователей, то есть обычных людей, в решении вопросов использования данных.
Проработать весь доступный в наши дни объем данных по какому-то вопросу, для того чтобы принять, как говорили раньше, «решение на основе полной информации», не под силу ни одному человеку. Но кто будет иметь возможность пользоваться инструментарием для обработки информации, пусть и в целях решения наших проблем? Будут ли сделанные на основе анализа данных выводы и прогнозы доступны любому желающему или они останутся в распоряжении немногочисленных могущественных организаций? Какую цену придется заплатить каждому из нас за бонусы от доступности своих социальных данных?
Я считаю, что значение социальных данных следует рассматривать не только в разрезе их доступности, но и в контексте результативности их использования, улучшения качества принимаемых нами решений. Некоторые решения принимаются нами ежедневно и неоднократно, а некоторые – один раз в жизни. Однако это не значит, что у созданных нами сегодня социальных данных короткий срок годности. Наши сегодняшние действия могут обусловить решение, которое нам предстоит сделать через несколько десятилетий. Лишь очень немногие умеют тщательно фиксировать все свои действия и анализировать их влияние на свою жизнь в краткосрочной или долгосрочной перспективе. Анализ социальных данных может позволить лучше оценить возможности и вероятности, притом что окончательное решение должно оставаться за вами.
Единственное, на что совершенно точно не способны эти технологии, – решить, какое будущее мы хотим для себя и как отдельно взятые личности, и как общество в целом. Законы, защищающие человека от дискриминации на работе или в сфере здравоохранения, могут прекратить действовать уже завтра, а в некоторых странах они отсутствуют и сейчас. Представьте себе, что вы решили поделиться своим беспокойством по поводу высокого уровня холестерина с каким-нибудь медицинским приложением или сайтом, чтобы получить консультацию о режиме питания и физических нагрузках. Могут ли ваши опасения по поводу своего здоровья быть каким-то образом использованы против вас? Что, если законодательство позволит установить для вас лично максимально высокие цены на медицинское обслуживание, поскольку вы не перестали питаться полуфабрикатами и продолжаете валяться на диване и после того, как получили четкие рекомендации относительно образа жизни, который следует соблюдать при вашем состоянии здоровья? А если некий менеджер кадровой службы получит информацию о вас из интернета и решит, что ваш стиль жизни не подходит компании, и поэтому он не будет рассматривать вашу кандидатуру на имеющуюся вакансию? Это вполне реальные риски.
Если бы вы являлись единственным источником формирования и распространения данных о себе, то имели бы возможность пресечь появление информации, которую считаете нежелательной. Это было бы возможно, хотя и крайне хлопотно. Однако мир, в котором мы живем, устроен иначе. У вас нет возможности контролировать большую часть информации о себе. Это становится все более очевидным по мере того, как бизнес и власти все чаще прибегают к использованию социальных данных под предлогом повышения своей эффективности и действенности.
В связи с такой доступностью социальных данных вопрос о том, как обращаться с ними наилучшим образом, касается каждого. Технологии быстро развиваются, а компании, которые собирают и анализируют наши данные, занимаются аккумулированием и кодированием информации, а не разработкой правил ее использования. Многие принципиальные вопросы рассматриваются применительно к какой-то конкретной ситуации, если рассматриваются вообще. Нельзя оставлять на усмотрение информационно-технологических компаний решения относительно принципов, глубоко затрагивающих наше будущее.
Можно согласиться с тем, что все эти данные собирают, сводят, агрегируют и анализируют для того, чтобы мы имели возможность лучше понимать плюсы и минусы предлагаемого нам выбора. Мнение человека – основополагающий элемент при оценке альтернатив, которые предполагает любое важное решение. Информация не должна руководить нами. Она должна расширять спектр наших возможностей.
Правила для эры постприватности
Понимание возрастающего значения информации в жизни человека стимулировало ряд инициатив, направленных на защиту интересов граждан. В 1970-х годах в США и Европе были разработаны примерно одинаковые принципы добросовестного использования информации. Частным лицам было предоставлено право знать, кто собирает о них сведения и как эти данные используются. Кроме того, граждане могли корректировать неточные данные о себе[14]. Для современных информационных потоков и средств аналитики эти защитные меры парадоксальным образом и избыточно жестки, и совершенно недостаточны одновременно.
Избыточная жесткость выражается в возможности отследить и сохранить любые данные о вас. Компания Amazon наверняка сможет доступно объяснить, как она использует полученную о вас информацию. Наверное, она даже сможет сделать это так, чтобы вы использовали это знание для принятия более обоснованных решений. Но ознакомление со всеми этими данными займет уйму времени. Многие ли захотят тратить время на прочесывание всего информационного массива? Действительно ли вам нужно понимать, каким образом в Amazon оценивают каждый параметр, или будет вполне достаточно итогового результата?[15]
В то же время эти защитные меры совершенно недостаточны, поскольку, даже если вы в состоянии контролировать каждый бит информации о себе, созданной и предоставленной лично вами, полной картины своих обращающихся личных данных вы не получите. Дело в том, что в эту картину попадает и та информация о вас, которую создают другие люди, например ваши родственники, друзья, коллеги и работодатели. Бизнесы, которые вы посещаете как онлайн, так и физически, тоже создают (а иногда и распространяют) данные о вас. То же относится и ко всем остальным, с кем вы взаимодействуете, – от разнообразных государственных и частных организаций до прохожих на улице. Кто поручится за достоверность этих данных? Поскольку в наши дни информация поступает из столь многочисленных источников, вопрос отнюдь не исчерпывается правом корректировать свои личные данные. Кроме того, даже достоверная информация может быть использована вам во вред.
На фоне масштабных количественных и качественных сдвигов в области создания, передачи и обработки информации становится совершенно очевидным, что права знать и права корректировать недостаточно. До настоящего времени попытки привести существующие правила в соответствие с требованиями времени были направлены почти исключительно на поддержание возможности индивидуального контроля над данными и сохранения тайны личной жизни[16]. К сожалению, такой подход порожден опытом прошлого века технологий. Стандарты контроля и конфиденциальности уже заставляют людей вступать в неравные отношения с информационно-технологическими компаниями. Если вы хотите повысить качество принятия решений с помощью информации, вам, скорее всего, придется согласиться с тем, что ваши данные будут собирать на условиях, которые вам продиктуют. И как только вы их примете, процесс сбора личных данных будет считаться соответствующим требованию законодательства о «контроле» вне зависимости от того, предоставляет ли вам компания – сборщик информации какие-либо варианты выбора и предохраняет ли от возможных нежелательных последствий для сохранения тайны личной жизни. Если вы хотите сохранить конфиденциальность своих личных данных, вам не следует давать согласия на их сбор и обработку. Правда, в результате вы лишитесь доступа к соответствующим информационным ресурсам и сервисам, а ценность ваших личных данных снизится. Вот и радуйтесь своему праву личного контроля.
Сегодня нам нужны стандарты, позволяющие оценить риски и пользу распространения и использования данных, а также позволяющие привлекать компании к ответственности. Два десятилетия сотрудничества с компаниями информационно-технологической отрасли привели меня к твердой убежденности в том, что соблюдение принципов прозрачности и свободы выбора – самое перспективное направление защиты от злоупотреблений в области обработки личных данных, позволяющее в то же время максимизировать выгоды от их использования.
Под прозрачностью понимается право людей знать, что происходит с их данными: что они собой представляют, куда они направляются и как способствуют получению результата пользователем. Наблюдает ли компания за вами из-за непрозрачной стороны зеркала или предоставляет окно, через которое можно видеть, что она делает с вашими данными, и, таким образом, иметь возможность судить, насколько ее интересы соответствуют вашим (и соответствуют ли вообще)[17]? Сколько личной информации нужно предоставить, чтобы получить нужный продукт или услугу? Исторически между частными лицами и организациями существовал серьезный информационный перекос в пользу организаций. Организации обладают не только большими возможностями для сбора информации о человеке, они могут также интерпретировать его данные, сравнивать с данными других. Баланс между тем, что вы предоставляете и что получаете взамен, должен быть совершенно прозрачен.
Оцените прозрачность в процессе покупок на Amazon по сравнению с традиционными отношениями между покупателем и розничной торговлей. Станет ли продавец в обычном магазине напоминать вам о том, что вы уже покупали этот товар, рискуя тем самым потерять в продажах? Если вы собираетесь купить на Amazon книгу, которую уже покупали на сайте, вас вежливо спросят: «Вы уверены? Вы уже покупали этот товар 17 декабря 2013 года». Если вы купили один трек из музыкального альбома, а теперь хотите купить весь альбом, Amazon «завершит покупку», то есть автоматически снизит цену на сумму, уплаченную за купленный трек. Компания отслеживает истории покупок и использует их для того, чтобы минимизировать поводы для огорчения своих покупателей. Схожим образом поступают и авиакомпании, когда информируют вас о том, что ваши накопленные мили скоро «сгорят», вместо того чтобы позволить этому случиться.
К сожалению, сегодня прозрачность – далеко не норма. Вспомните более чем типичный пример звонка в какой-нибудь центр обслуживания клиентов. Сразу же после соединения вы обязательно услышите предупреждение «Внимание! В целях контроля качества этот разговор может быть записан». Выбора у вас нет – если вы хотите поговорить с сотрудником компании, придется принять это условие. Допустим. Но почему эта запись будет доступна только компании? Что это за «цели контроля качества», когда только одна сторона имеет доступ к записи разговора? Принцип симметрии данных подразумевает, что и у вас – потребителя, который платит, – должен быть прямой доступ к этой записи.
Каждый раз, услышав, что мой телефонный разговор может записываться, я заявляю сотруднику клиентской службы, что я, пожалуй, тоже запишу этот диалог с целью контроля качества предоставляемых услуг. В большинстве случаев сотрудник вынужденно соглашается. Но случается, что на том конце вешают трубку. Конечно, я могу записать разговор и не спрашивая согласия сотрудника, – хотя, замечу, что кое-где это считается противозаконным. Тогда, если качество сервиса не будет соответствовать обещанному, я смогу обратиться к начальству с доказательствами на руках. Если и это не поможет, я могу выложить запись в сеть в надежде, что она станет вирусной и компании придется срочно исправлять ситуацию. Так произошло с Comcast[18]: один из клиентов пытался отменить подписку и раз за разом натыкался на отказ, до тех пор пока не выложил запись разговоров в Twitter, где она попала в тренды[19].
Закон не должен ограничивать возможности человека играть на равных с компаниями. Чтобы прозрачность стала новой нормой, надо, чтобы общедоступным оказался больший, а не меньший объем информации.
Но одной прозрачности недостаточно, нужна также и свобода выбора[20]. Под ней подразумевается право человека управлять своими данными. Легко ли вам разобраться в том, что представляют собой регламенты работы с личной информацией, которыми данная компания руководствуется «по умолчанию»? Разрешается ли вам изменять свои данные по собственному усмотрению? Можете ли вы получать результаты в удобном для вас виде или же вас ненавязчиво склоняют (или насильно заставляют!) пользоваться определенными опциями, обычно теми, которые больше устраивают компанию? Можно ли поиграть с параметрами и попробовать разные сценарии, чтобы рассмотреть суженный или расширенный диапазон возможностей? Свобода выбора – личное право человека, реализуемое путем управления параметрами и алгоритмами, выявленными информационно-технологическими компаниями. Она предполагает возможность требовать от компаний предоставления информации на ваших условиях.
На фундаментальном уровне свобода действия подразумевает наличие у человека возможности создавать полезные именно ему данные. Amazon в полной мере воплотила идею нецензурируемых отзывов. Компании совершенно все равно, положительные это отзывы или отрицательные, пяти- или однозвездочные, написанные с целью заслужить одобрение окружающих или в рамках воплощения заветной мечты стать литературным критиком. Важно то, что они полезны другим пользователям, которые решают, что им купить. Например, отзывы могут показать, что покупатель жалеет о сделанном выборе даже в случае, когда он не возвращает товар продавцу. Такого рода данные помогают потребителю решить, насколько рекомендуемый товар может соответствовать его ожиданиям. Amazon предоставила потребителю большую свободу выбора.
Маркетологи любят поговорить о таргетировании, сегментации и конверсии. Не знаю, как вы, но лично я не хочу, чтобы меня таргетировали, сегментировали, конвертировали или нарезали тонкими ломтиками. Свободе выбора чужды подобные понятия. Не стоит ожидать, что однажды руководители всех компаний по своей собственной инициативе начнут руководствоваться принципами прозрачности и предоставления пользователю свободы выбора. И нам требуются четко очерченные границы прав, позволяющие сделать прозрачность и свободу выбора основой создания реального, практически полезного инструментария.
Если мы сможем заставить компании, занимающиеся сбором данных, согласиться с набором взвешенных правил и способов работы, это приведет к тому, что я называю «сменой значений» – полному пересмотру сложившейся практики в отношениях между частными лицами и учреждениями. Решение компании Amazon передать потребителям формирование большей части контента, связанного с товарами, – один из примеров такой смены значений, и революция в области социальных данных способна предоставить еще больше подобных возможностей. Одновременно с расширением инструментария, помогающего человеку принимать наиболее подходящие ему решения, падает эффективность традиционной рекламы и манипулирования потребителем. Времена, когда покупки осуществлялись под диктовку компаний, миновали. В скором будущем вы сможете диктовать компании, что она должна произвести для вас. Кое-где это уже возможно.
Смены значений – важный элемент картины мира с точки зрения физики. Часто они обозначают фазовые переходы, когда некая перемена во внешней среде вызывает резкие изменения свойств вещества, например переход воды из жидкого в газообразное состояние при достижении точки кипения. Воздействие, которое возрастающий объем информации оказывает на общество, можно сравнить с воздействием возрастающей температуры нагревания на физическую систему. При определенных условиях, то есть когда информационно-технологические компании предоставят пользователям прозрачные условия и свободу выбора, произойдет смена значений в пользу частного лица, то есть главным бенефициаром во взаимоотношениях человека и компании станет человек, а не компания или ее директор по маркетингу.
Заинтересованными лицами революции в использовании социальных данных являемся мы все. А тот, кто хочет извлечь из социальных данных пользу, должен делиться информацией о самом себе. Точка. Ценность социализации информации часто проявляется в виде расширения возможностей для принятия оптимальных решений в коммерческих переговорах, при покупке товаров и услуг, получении кредитов, в поиске работы, при получении образовательных и медицинских услуг и в общественной жизни в целом. Цена и риски предоставления личных данных должны быть как минимум эквивалентны получаемым взамен благам. Существенна прозрачность того, что узнают о человеке компании и что они делают с этой информацией. То же относится и к возможности частного лица иметь определенный контроль над информационными продуктами и услугами. Без этого судить о том, насколько эквивалентным является происходящий обмен, невозможно.
Баланс сил
Доступ к информации – одно из главных преимуществ. Те, у кого ее больше, почти всегда оказываются в выигрыше, как пресловутый продавец подержанных машин, втюхивающий развалюху несведущему покупателю. С удешевлением и повсеместным распространением средств коммуникации и обработки данных информации стало намного больше, соответственно намного возрос и риск существенных информационных перекосов, поскольку ни одному частному лицу не под силу справиться с обработкой всех имеющихся данных.
Большая часть создаваемой и распространяемой информации касается личной жизни: где мы живем, где работаем, где бываем, кого любим, а кого – нет, с кем проводим время, что едим, насколько регулярно занимаемся спортом, какие лекарства принимаем, какими бытовыми приборами пользуемся, что затрагивает наши чувства. Для компаний, собирающих и анализирующих данные, наша жизнь прозрачна. Иногда эти компании занимаются незаконной перепродажей информации, но чаще держат ее у себя для применения исключительно по собственному усмотрению. Необходимы более детальные правила использования личных данных, не допускающие возможности их изменения или обмена ими в какой-либо форме без разрешения их носителя. И те, кто создает данные, и те, кто их собирает и анализирует, должны обладать равной прозрачностью друг для друга и свободой выбора.
Для этого нам потребуется серьезно пересмотреть свое отношение к личным данным и самим себе. В первой главе я расскажу о некоторых способах, которые применяют информационно-технологические компании для анализа личных данных и превращения их в продукты и сервисы. В главе 2 речь пойдет о том, как цифровые следы нашей жизнедеятельности (история поиска, клики, просмотры, нажатия и свайпы) «затаптывают» иллюзии приватности, формируя представление о нашей личности и подавая сборщикам данных важные сигналы вне зависимости от того, хотим мы этого или нет. В главе 3 в центре моего внимания окажутся связи между людьми и то, как в цифровую эпоху социальные сети меняют представления о доверии. В главе 4 рассмотрим, насколько четкую картинку наших перемещений, настроений и уровня внимания позволяет получить анализ данных, полученных из объединенных сетей самых разнообразных датчиков (не только видеокамер).
Исходя из этого анализа, я формулирую шесть видов прав, соблюдение которых считаю необходимым условием того, чтобы в будущем данные о людях служили именно им самим. Право на доступ к данным и право на проверку компаний, собирающих и обрабатывающих данные, относятся к вопросу повышения прозрачности. Право на исправление данных, право на удаление данных, право на экспериментирование с данными и право на перенос данных в другие компании относятся к сфере повышения степени контроля человека над своими личными данными и обеспечения свободы его выбора. Распространение этих прав на личные данные и их использование будет иметь значительные последствия для всех нас. В заключительной главе, посвященной воплощению этих прав в реальность, мы рассмотрим, как это скажется на покупках, платежах, инвестициях, работе, учебе и управлении общественными ресурсами.
Мы находимся на переломной стадии оформления отношений между людьми, передающими свои данные, и компаниями, создающими на их основе продукты и услуги. Это не просто изменения в правилах игры – сама игра стала качественно иной. Ее новые правила требуют пересмотра отношений между покупателями и продавцами, инвесторами и банками, работниками и работодателями, пациентами и врачами, учениками и учителями, гражданами и государством. Пора осознать, что в действительности означает использование данных, какие выгоды можно из этого извлекать и как контролировать последствия этого процесса, и занять по этим вопросам твердую позицию. Тогда мы сможем понять, насколько наши собственные интересы совпадают с интересами компаний, собирающих информацию о нас. Как и в подавляющем большинстве случаев, все изменения идут не от новых технологий и машин. Революция происходит в результате корректировки ожиданий и социальных норм в эпоху распространения новых технических средств.
Данные на людей могут стать данными для людей, если мы примем вызов и окажемся на высоте в решении этой задачи. Добро пожаловать в революцию.
11
Emerson, Ralph Waldo, The Prose Works of Ralph Waldo Emerson, vol. 1, rev. ed. (Boston: James R. Osgood, 1875), p. 220.
12
Я преподавал курс под названием «Революция социальных данных» в Стэнфордском университете (с 2008 года) и в Калифорнийском университете в Беркли (с 2011 года), но концептуальным представлением «социальные данные» стал заниматься еще задолго до этого. На самых ранних порах к социальным данным относили всего лишь обнародованную человеком информацию, вроде отзывов в Amazon и постов в социальных сетях.
13
Тем, кого интересуют подробности об отрывочных данных, рекомендую посмотреть видеозапись панельной дискуссии с моим участием на конференции DataEdge, которую проводил факультет информации Калифорнийского университета в Беркли в 2013 году. Она доступна на http://www.catchtalk.tv/events/dataedge/videos/sketchy-data-panel-discussion-dataedge-2013.
14
Огромная разница между подходами к защите данных между США и Европой состоит, в том числе, и в правоприменении. В США регулирующие органы для защиты граждан от рисков незаконного использования личных данных создаются отдельно для каждой отрасли, тогда как в Европе существуют единые законодательные нормы. См. издание Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values, (Совместный доклад рабочей группы по большим данным и защите неприкосновенности личной жизни и Совет по развитию науки и техники), May 2014, pp. 17–18, https:// www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf.
15
Для понимания алгоритма обычно бывает нужно увидеть, как он работает с реальными данными, в идеале – вашими собственными в сочетании с данными других людей (что дает больше возможностей для сравнения). В соответствии с действующим законодательством большинство компаний не имеют права предоставить вам информацию о других людях без их согласия. Это ограничивает возможности расшифровки алгоритмов вашей жизни.
16
См., в частности, законопроект «О правах потребителя в области неприкосновенности частной жизни», внесенный Белым домом в феврале 2012 года, о котором говорится на стр.19–20 издания Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values See.
17
Спасибо Эстер Дайсон, предложившей эту метафору с зеркалом и окном.
18
Comcast – американская компания, крупнейший в мире оператор кабельных и эфирных телесетей. – Прим. пер.
19
Если вы упустили это в СМИ, то можете послушать душераздирающую запись звонка на SoundCloud: Block, Ryan, “Comcastic Service Disconnection (Recording Starts 10 Mins into Call)”, SoundCloud, July 14, 2014, https://soundcloud.com/ryan-block-10 /comcastic-service.
20
Мой друг Док Серлс, соавтор The Cluetrain Manifesto и автор The Intention Economy, давно ратует за право выбора в взаимодействии потребителей и компаний, и я благодарен ему за предложение использовать этот термин для обозначения всей полноты аспектов личного волеизъявления, воплощенных в этом праве.