Читать книгу Медицинские информационные системы: многомерный анализ медицинских и экологических данных - Группа авторов - Страница 21

Глава 3
Системно-статистический подход к исследованию биоритмов и ритмов внешней среды
3.4. Критериальные функции и функционалы биосистем. Множественные корреляции

Оглавление

Среди множества оптимизационных методов встречается довольно ограниченное число методик, способных давать индивидуальные статистические функциональные оценки системы (функционального множества биологических системных параметров). Одна из методик, примененная нами, позволила получить корреляционные системные оценки. Биологический смысл таких моделей основан на представлениях, сформулированных Ю. Н. Шаниным с соавторами (1978) о максимуме корреляционных связей в норме и различной степени их разбалансировки в патологии.

Для всей выборки биосистемы строится корреляционная матрица, которая подвергается специальному преобразованию с использованием процедуры ветвей и границ с выбором оптимального подмножества признаков и оценкой для каждого пациента критериальной функции (КФ) (Narenda P. M., Fukunaga K., 1977). Метод основан на оценке некоторой монотонной функции – КФ от какого-либо биологического множества (A), такой, что если существуют два подмножества Ai и Aj, причем Ai содержится в Aj, тогда: C(Ai) < C(Aj) или C(Ai) = C(Aj) – что и означает свойство монотонности. Алгоритм построен на вычислении максимальной КФ на основе определенной квадратической формы и на поиске наибольшего набора из n переменных, максимизирующего КФ для всего подмножества, содержащего m признаков. КФ вычисляется через квадратическую форму: C(Am) = (XmT)Sm–1(Xm), где Am – набор m переменных, Xm – вектор переменных (набор биопараметров – функциональная система конкретного индивида) и Sm – симметричная положительно определенная корреляционная матрица размера mxm; символ XmT означает операцию транспонирования вектора, Sm–1 – операцию вычисления обратной матрицы. Такой класс КФ называют расстояниями Махаланобиса и критериями Фишера.

Эти статистические оценки полностью покрывают (характеризуют) всю исследуемую функциональную систему по определению M. S. Ridout (1988) и являются индивидуальными системными показателями. Они отражают системную организацию и указывают на различную степень закоррелированности (управляемости), гибкости ее реагирования и адаптивности. Таким образом, можно оценить место в динамике системы каждого пациента в течение многолетнего периода исследований. Такие показатели также можно включать в набор зависимых параметров при вычислениях множественных корреляций (МК) в качестве самостоятельных параметров. Динамика функционала биопараметров, описываемого ниже, или КФ, вычисленные на основе «внутренних» корреляций элементов биосистемы, может обнаружить определенную синхронность смещения всей системы регуляции с воздействующими факторами, переход ее на новый уровень функционирования. Это указывает на возможность существенных межсистемных регуляторных сдвигов, что может привести к системному дисбалансу ФС организма от воздействия ионосферы, ГМП, КЛ, СА, приливообразующего потенциала.

Другим системным статистическим методом описания ФС биосистем может служить определенная суммарная оценка – функционал. Он способен описать совокупность признаков нескольких биологических объектов (определенной статистической выборки) в некоторый момент времени. Алгоритм его вычисления изложен ниже.

Кратко суть его заключается в следующем. Производится поиск разбиения множества объектов (лейкограммы, биохимических параметров, системы ферментов, ионов сыворотки крови) на непересекающиеся классы – наборы функциональной подсистемы биологических параметров (например, лейкограммы: лейкоцитов, базофилов, моноцитов и так далее), дающего локальный максимум функционалу – сумме «внутренних» корреляционных связей за вычетом некоторого порогового значения (Миркин Б. Г., 1974; Куперштох В. Л. с соавт., 1976).

Производится поиск разбиения R = (R1, R2, …, RM) множества объектов (лейкограммы, биохимических параметров, системы ферментов, ионов сыворотки крови) на непересекающиеся классы – наборы функциональной подсистемы биологических параметров (например, лейкограммы: лейкоцитов, базофилов, моноцитов и так далее) R1, R2, …, RM (M = 1 или M > 1), дающего локальный максимум функционалу F – сумме «внутренних» корреляционных связей за вычетом некоторого порогового значения корреляций, характеризующего их существенность:


где a – порог существенности связей (при aij > a связь существенна между объектами i и j, при aij < a – связь несущественна), aij – показатель связи между i-м и j-м объектами (aij = aji, aii – не исследуются и не рассматриваются), выражение i, jRS означает принадлежность элемента aij к множеству RS (Миркин Б. Г., 1974; Куперштох В. Л. с соавт., 1976).

Таким образом, два приведенных здесь способа моделирования способны адекватно описать биологические системы, поскольку содержат основные ее признаки: множество элементов, характеризующихся в данном случае корреляционными связями друг с другом и дополнительным свойством – функцией или функционалом, не совпадающими или не характеризующимися ни одним из свойств отдельного элемента системы (Губанов В. А. с соавт., 1988). Поэтому они являются системными. Кроме того, они способны одновременно быть индикаторами функционального состояния биосистемы, так как КФ и функционал способны описать результат взаимодействия внешней среды и исходных корреляционных свойств субъектов через совокупность признаков, динамику их функций и качеств, которые прямо или косвенно характеризуют исследуемую деятельность – адаптацию (Фролов М. В., 1987).

Кроме двух вышеприведенных статистических методов исследования широко применяюся физиологически обоснованные следующие системные и межсистемные методы: множественные корреляции (BMDP-77. …, 1977; BMDP User's …, 1987), спектральные, авторегрессионные оценки (Дженкинс Г., Ваттс Д., 1971; 1972; Бокс Дж., Дженкинс Г., 1974; Buchman J., Schulten K., 1986), таксономии и классификации (Жирмунская Е. А., Лосев В. С., 1984), раскраски графа динамических процессов (Зыков А. А., 1969; Гладких Б. А. с соавт., 1971; Хаткевич Л. А., 1981), а также построения логических статистических решающих правил (Загоруйко Н. Г. с соавт., 1985). Основным методом изучения статистических связей c КЛ, СА, ИП был метод множественных корреляций (МК) (Aфифи А., Эйзен С., 1982; Боровиков В. П., Боровиков И. П., 1997).

Множественные корреляции (МК) вычисляются для моделей множественной линейной регрессии, что позволяет строить прогнозы при наличии достаточных уровней их значимости одного набора данных (например, совокупности медицинских параметров: лейкограммы, биохимических, ионов крови) по другому набору – геофизических. Если Y – один из медицинских системных параметров (например, количество эозинофилов лейкограммы), тогда X1, X2, …, Xn – набор системы ионосферных (независимых) показателей (например, частоты ионосфeрных слоев f0ES, f0F2 и другие). Квадрат МК – доля дисперсии признака Y, «объясненной» регрессионной зависимостью на наборе признаков (x1, x2, …, xp). МК положительны по определению. При МК = 1 признак описывается линейной комбинацией независимых признаков (Aфифи А., Эйзен С., 1982). МК являются максимумом значения простого коэффициента корреляции между исследуемым множеством и переменной, то есть являются в этом смысле оптимизационной оценкой.

Медицинские информационные системы: многомерный анализ медицинских и экологических данных

Подняться наверх