Читать книгу Социальная справедливость и город - Дэвид Харви - Страница 9
Часть I
Либеральные формулировки
Глава 1
Социальные процессы и пространственная форма
(1) Концептуальные проблемы городского планирования
Некоторые методологические проблемы в зоне взаимодействия дисциплин
3. Статистический анализ
ОглавлениеПроблемы индивидуации и смешения ведут к проблемам в статистическом анализе. Их достаточно легко объяснить, но сложно разрешить. В идеале нам нужен метаязык, на котором мы могли бы обсуждать статистическую значимость одновременно в социологическом и пространственном смысле. В отсутствие этого мы должны прибегать к тестам, сконструированным на двух разных языках, и как-то комбинировать их в применяемой структуре статистического анализа. Тесты, пригодные для проверки гипотез относительно внепространственного социального процесса, разработаны достаточно хорошо. Используя эти гипотезы, мы можем сформировать определенные ожидания и затем попробовать показать, что нет большой разницы между этими ожиданиями и данными наблюдения. Отсутствие каких-либо значимых различий обычно означает, что гипотеза подтверждается, хотя это действительно только при определенных допущениях о том, как получаются результаты наблюдения (например, элиминирование всех неучтенных переменных (confounding variables)[4]), и о том, как формулируется сама гипотеза и т. д. Тесты, подходящие для изучения моделей пространственного распределения, разработаны не так глубоко. Мы можем сформулировать определенные ожидания в отношении пространственных феноменов и затем сравнить эти ожидания с наблюдаемыми пространственными распределениями. Есть тесты для проверки пространственного представления табличных данных (Cliff and Ord, 1972). Однако сравнение двух поверхностей представляется не таким простым, и нам сложно выразить словами расхождение наших ожиданий относительно определенной поверхности с данными ее наблюдения. Аналогично, у нас нет настоящего понимания смысла статистически значимой разницы в анализе распределения точечных объектов (point pattern arrangement)[5]. Поэтому в целом у нас нет общепринятого определения статистической значимости в пространственном анализе и, следовательно, у нас есть серьезные проблемы в тестировании гипотез о пространственных распределениях. Кажется, единственный способ сформулировать понятие значимости – это делать предположения относительно природы пространственного распределения. Поскольку мы часто озабочены тем, чтобы выявить, а не тем, чтобы предположить пространственное распределение, этот подход не всегда помогает. Но похоже, это единственный вариант для нас в настоящее время. По этой причине критиковать нынешние методы обращения с пространственными данными ничего не стоит (Granger, 1969).
Комбинирование социальных и пространственных процедур в одной концептуальной рамке статистического исследования все же имеет шанс на успех. Рассмотрим следующий пример, в котором мы попробуем предсказать распространенность некоторых социальных характеристик в пространстве – скажем, численность цветного населения в ряде переписных участков города. В рамках этой гипотезы мы можем сформировать предположения относительно численности небелого населения на каждом участке, представленной ячейкой в таблице данных. Чтобы проверить эту гипотезу, нам нужно показать, что она правильно указывает количество людей на каждом участке. Мы можем проверить это, сравнивая распределение ячеек по частотным характеристикам, как они представлены в гипотезе и как они выглядят в реальности. Мы можем выяснить, есть ли значимая разница на пятипроцентном уровне или ее нет. Но нам надо также показать, что модель предсказывает правильное пространственное распределение предсказаний по участкам. Мы можем использовать цветовой тест смежности (k-color contiguity test), чтобы показать пространственное распределение, предполагаемое в гипотезе, и пространственное распределение в реальности. Если эти тесты совершенно независимы друг от друга, мы можем увеличить эти два уровня значимости по правилу мультипликации (умножения) и сказать, что общий тест показывает уровень значимости[6] 0,25 %. Но очевидно, что тесты не независимы друг от друга. По сути, объединение двух тестов таким образом может вовлечь нас (и часто так и бывает) в конфликт со статистической логикой. Тесты социальных процессов основываются на независимости каждой единицы данных, а пространственная статистика явным образом озабочена измерением степени пространственной зависимости в данных. Поэтому мы автоматически привносим в измерение социальных процессов проблему автокорреляции, и это означает, что мы нарушаем основания тестирования, если только как-то не контролируем этот процесс (фильтруя данные и т. д.). Подобная проблема возникает почти на каждом участке работы в зоне взаимодействия дисциплин. Она далека от решения и часто вообще не замечается. Мне всегда казалось странным, что, например, многовариантные методы районирования полагаются на измерения корреляции, которые, если они считаются значимыми, требуют независимости данных наблюдения, когда целью всей процедуры является группировка единиц по регионам, имеющим сходные (и поэтому пространственно автокоррелированные) характеристики. Метод и цель в этом случае кажутся логически не согласованными или, в лучшем случае, дают такую группировку регионов, которую по большому счету можно считать бессмысленной. Похоже, это формирует непреодолимый барьер для использования факторного анализа в схемах районирования. Проблема автокорреляции, однако, хорошо освещена в эконометрической литературе в отношении временного измерения (временных рядов), и мы можем использовать эту область знания как источник вдохновения (и определенных техник). Но, как указал Грэнджер (Granger, 1969), между временным измерением, которое обладает, к большому удобству, направленностью и необратимостью, и пространственным изменением, которое обладает не этими ценными характеристиками, а сложной нестационарностью и странными разрывами, огромная разница. Эти проблемы привели Грэнджера к сомнениям относительно того, что техники, используемые в эконометрике для работы с временными рядами, могут применяться к пространственным данным, за исключением некоторого класса задач. Проблема пространственной автокорреляции кажется слишком сложной, чтобы найти ей приемлемое решение, а вся базовая структура статистического исследования в междисциплинарной зоне зависит от нее.
Наши инструменты для разрешения проблемы сочетания социологических и географических подходов к городским вопросам нуждаются, можно сказать, в заточке. Поэтому мы должны принять как данность сложности составления условных прогнозов и проверки теории. Это может нагонять депрессивные настроения, но мы не можем разрешить эти трудности, только делая вид, что их нет. На самом деле точное определение проблемы является самым важным, если мы намерены приступить к заточке инструментов для проведения работ по строительству моста между этими подходами. В то же время важно осознавать возможные источники ошибок в пространственном прогнозировании и в конструировании теории. Самообман в отношении этих ошибок не пойдет на пользу ни социальному ученому, ни географу, ни планировщику, сталкивающимся с принятием сложного политического решения. Каждому из них необходимо быть хорошо натренированным в распознавании методологических ограничений, возникающих при работе на стыке дисциплин.
4
Неучтенные переменные – переменные, связанные с исследуемым фактором и определенным образом влияющие на результат. Например, известно, что мужчины чаще, чем женщины, болеют ИБС. Однако это может быть связано не с исследуемым фактором (пол), а с тем, что мужчины чаще курят, больше подвергаются стрессам. Влияние неучтенных переменных может приводить к возникновению ложных корреляций и систематических ошибок. – Прим. ред.
5
Речь идет об одном из методов анализа пространственного распределения объектов – анализе распределения точечных объектов (PPA: Point Pattern Analysis). Этот метод часто применяется для исследования распределения численности и плотности населения на конкретных территориях. – Прим. ред.
6
Уровень значимости – это такое (достаточно малое) значение вероятности события, при котором событие уже можно считать неслучайным. В данном примере: 0,05×0,05=0,0025≡0,25 %. – Прим. ред.