Применение корреляции спирмена и пирсона. Корреляции в дипломных работах по психологии

Студента-психолога (социолога, менеджера, управленца и др.) нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах.

В математике для описания связей между переменными величинами используют понятие функции F, которая ставит в соответствие каждому определенному значению независимой переменной X определенное значение зависимой переменной Y. Полученная зависимость обозначается как Y=F(X).

При этом виды корреляционных связей между измеренными признаками могут быть различны: так, корреляция бывает линейной и нелинейной, положительной и отрицательной. Она линейна - если с увеличением или уменьшением одной переменной X,вторая переменная Y в среднем либо также растет, либо убывает. Она нелинейна, если при увеличении одной величины характер изменения второй не линеен, а описывается другими законами.

Корреляция будет положительной, если с увеличением переменной X переменная Y в среднем также увеличивается, а если с увеличением X переменная Y имеет в среднем тенденцию к уменьшению, то говорят о наличии отрицательной корреляции. Возможна ситуация, когда между переменными невозможно установить какую-либо зависимость. В этом случае говорят об отсутствии корреляционной связи.

Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Ранговый коэффициент линейной корреляции Спирмена подсчитывается по формуле:

где n - количество ранжируемых признаков (показателей, испытуемых);
D - разность между рангами по двум переменным для каждого испытуемого;
D2 - сумма квадратов разностей рангов.

Критические значения коэффициента корреляции рангов Спирмена представлены ниже:

Величина коэффициента линейной корреляции Спирмена лежит в интервале +1 и -1. Коэффициент линейной корреляции Спирмена может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной X будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут располагаться в порядке убывания, то в этом случае корреляция между переменными Х и Y будет равна точно -1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Если знак коэффициента линейной корреляции - плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания - произволен. Это может быть как переменная X, так и переменная Y. Однако если считается, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот.

Рассмотрим пример корреляции Спирмена.

Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.

Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в таблице:

Подставляем полученные данные в вышеприведенную формулу, и производим расчет. Получаем:

Для нахождения уровня значимости обращаемся к таблице «Критические значения коэффициента корреляции рангов Спирмена,» в которой приведены критические значения для коэффициентов ранговой корреляции.

Строим соответствующую «ось значимости»:

Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью - иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Н0) гипотезу о сходстве и принять альтернативную (Н1) о наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.

Корреляция спирмена. Корреляционный анализ по методу спирмена. Ранги спирмена. Коэффициент корреляции Спирмена. Ранговая корреляция Спирмена

При наличии двух рядов значений, подвергающихся ранжированию, рационально рассчитывать ранговую корреляцию Спирмена.

Такие ряды могут представляться:

  • парой признаков, определяемых в одной и той же группе исследуемых объектов;
  • парой индивидуальных соподчиненных признаков, определяемых у 2 исследуемых объектов по одинаковому набору признаков;
  • парой групповых соподчиненных признаков;
  • индивидуальной и групповой соподчиненностью признаков.

Метод предполагает проведение ранжирования показателей в отдельности для каждого из признаков.

Наименьшее значение имеет наименьший ранг.

Этот метод относится к непараметрическому статистическому методу, предназначенному для установления существования связи изучаемых явлений:

  • определение фактической степени параллелизма между двумя рядами количественных данных;
  • оценка тесноты выявленной связи, выражаемой количественно.

Корреляционный анализ

Статистический метод, предназначенный для выявления существования зависимости между 2 и более случайными величинами (переменными), а также ее силы, получил название корреляционного анализа.

Получил свое название от correlatio (лат.) – соотношение.

При его использовании возможны варианты развития событий:

  • наличие корреляции (положительная либо отрицательная);
  • отсутствие корреляции (нулевая).

В случае установления зависимости между переменными речь идет об их коррелировании. Иными словами, можно сказать, что при изменении значения Х, обязательно будет наблюдаться пропорциональное изменение значения У.

В качестве инструментов используются различные меры связи (коэффициенты).

На их выбор оказывает влияние:

  • способ измерения случайных чисел;
  • характер связи между случайными числами.

Существование корреляционной связи может отображаться графически (графики) и с помощью коэффициента (числовое отображение).

Корреляционная связь характеризуется такими признаками:

  • сила связи (при коэффициенте корреляции от ±0,7 до ±1 – сильная; от ±0,3 до ±0,699 – средняя; от 0 до ±0,299 – слабая);
  • направление связи (прямая или обратная).

Цели корреляционного анализа

Корреляционный анализ не позволяет установить причинную зависимость между исследуемыми переменными.

Он проводится с целью:

  • установления зависимости между переменными;
  • получения определенной информации о переменной на основе другой переменной;
  • определения тесноты (связи) этой зависимости;
  • определение направления установленной связи.

Методы корреляционного анализа


Данный анализ может выполняться с использованием:

  • метода квадратов или Пирсона;
  • рангового метода или Спирмена.

Метод Пирсона применим для расчетов требующих точного определения силы, существующей между переменными. Изучаемые с его помощью признаки должны выражаться только количественно.

Для применения метода Спирмена или ранговой корреляции нет жестких требований в выражении признаков – оно может быть, как количественным, так и атрибутивным. Благодаря этому методу получается информация не о точном установлении силы связи, а имеющая ориентировочный характер.

В рядах переменных могут содержаться открытые варианты. Например, когда стаж работы выражается такими значениями, как до 1 года, более 5 лет и т.д.

Коэффициент корреляции

Статистическая величина характеризующая характер изменения двух переменных получила название коэффициента корреляции либо парного коэффициента корреляции. В количественном выражении он колеблется в пределах от -1 до +1.

Наиболее распространены коэффициенты:

  • Пирсона – применим для переменных принадлежащих к интервально шкале;
  • Спирмена – для переменных порядковой шкалы.

Ограничения использования коэффициента корреляции

Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:

  • в распоряжении имеется достаточное количество значений переменной (25-100 пар наблюдений);
  • между изучаемыми переменными установлено, например, квадратичное соотношение, а не линейное;
  • в каждом случае данные содержат больше одного наблюдения;
  • наличие аномальных значений (выбросов) переменных;
  • исследуемые данные состоят из четко выделяемых подгрупп наблюдений;
  • наличие корреляционной связи не позволяет установить какая из переменных может рассматриваться в качестве причины, а какая – в качестве следствия.

Проверка значимости корреляции

Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.

Наиболее распространенным методом определения значимости корреляции является определение критерия Стьюдента.

Его значение сравнивается с табличным, количество степенней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.

При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).

Ранги Спирмена

Коэффициент ранговой корреляции Спирмена позволяет статистически установить наличие связи между явлениями. Его расчет предполагает установление для каждого признака порядкового номера – ранга. Ранг может быть возрастающим либо убывающим.

Количество признаков, подвергаемых ранжированию, может быть любым. Это достаточно трудоемкий процесс, ограничивающий их количество. Затруднения начинаются при достижении 20 признаков.

Для расчета коэффициента Спирмена пользуются формулой:

в которой:

n – отображает количество ранжируемых признаков;

d – не что иное как разность между рангами по двум переменным;

а ∑(d2) – сумма квадратов разностей рангов.

Применение корреляционного анализа в психологии

Статистическое сопровождение психологических исследований позволяет сделать их более объективными и высоко репрезентативными. Статистическая обработка данных полученных в ходе психологических экспериментов способствует извлечению максимума полезной информации.

Наиболее широкое применение в обработке их результатов получил корреляционный анализ.

Уместным является проведение корреляционного анализа результатов, полученных при проведении исследований:

  • тревожности (по тестам R. Temml, M. Dorca, V. Amen);
  • семейных взаимоотношений («Анализ семейных взаимоотношений» (АСВ) опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • уровня интернальности-экстернальности (опросник Е.Ф. Бажина, Е.А. Голынкиной и А.М. Эткинда);
  • уровня эмоционального выгорания у педагогов (опросник В.В. Бойко);
  • связи элементов вербального интеллекта учащихся при разно профильном обучении (методика К.М. Гуревича и др.);
  • связи уровня эмпатии (методика В.В. Бойко) и удовлетворенностью браком (опросник В.В. Столина, Т.Л. Романовой, Г.П. Бутенко);
  • связи между социометрическим статусом подростков (тест Jacob L. Moreno) и особенностями стиля семейного воспитания (опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • структуры жизненных целей подростков, воспитанных в полных и неполных семьях (опросник Edward L. Deci, Richard M. Ryan Ryan).

Краткая инструкция к проведению корреляционного анализа по критерию Спирмена

Проведение корреляционного анализа с использованием метода Спирмена выполняется по следующему алгоритму:

  • парные сопоставимые признаки располагаются в 2 ряда, один из которых обозначается с помощью Х, а другой У;
  • значения ряда Х располагаются в порядке возрастания либо убывания;
  • последовательность расположения значений ряда У определяется их соответствием значений ряда Х;
  • для каждого значения в ряду Х определить ранг — присвоить порядковый номер от минимального значения к максимальному;
  • для каждого из значений в ряду У также определить ранг (от минимального к максимальному);
  • вычислить разницу (D) между рангами Х и У, прибегнув к формуле D=Х-У;
  • полученные значения разницы возводятся в квадрат;
  • выполнить суммирование квадратов разниц рангов;
  • выполнить расчеты по формуле:

Пример корреляции Спирмена

Необходимо установить наличие корреляционной связи между рабочим стажем и показателем травматизма при наличии следующих данных:

Наиболее подходящим методом анализа является ранговый метод, т.к. один из признаков представлен в виде открытых вариантов: рабочий стаж до 1 года и рабочий стаж 7 и более лет.

Решение задачи начинается с ранжирования данных, которые сводятся в рабочую таблицу и могут быть выполнены вручную, т.к. их объем не велик:

Рабочий стаж Число травм Порядковые номера (ранги) Разность рангов Квадрат разности рангов
d(х-у)
до 1 года 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 и более 6 5 1 +4 16
Σ d2 = 38,5

Появление дробных рангов в колонке связано с тем, что в случае появления вариант одинаковых по величине находится среднее арифметическое значение ранга. В данном примере показатель травматизма 12 встречается дважды и ему присваиваются ранги 2 и 3, находим среднее арифметическое этих рангов (2+3)/2= 2,5 и помещаем это значение в рабочую таблицу для 2 показателей.
Выполнив подстановку полученных значений в рабочую формулу и произведя несложные расчёты получаем коэффициент Спирмена равный -0,92

Отрицательное значение коэффициента свидетельствует о наличии обратной связи между признаками и позволяет утверждать, что небольшой стаж работы сопровождается большим числом травм. Причем, сила связи этих показателей достаточно большая.
Следующим этапом расчётов является определение достоверности полученного коэффициента:
рассчитывается его ошибка и критерий Стьюдента

Коэффициент корреляции Пирсона

Коэффициентr- Пирсона применяется для изучения взаимосвязи двух метрических переменных, измеренных на одной и той же выборке. Существует множество ситуаций, в которых уместно его применение. Влияет ли интеллект на успеваемость на старших курсах университета? Связан ли размер заработной платы работника с его доброжелательностью к коллегам? Влияет ли настроение школьника на успешность решения сложной арифметической задачи? Для ответа на подобные вопросы исследователь должен измерить два интересующих его показателя у каждого члена выборки.

На величину коэффициента корреляции не влияет то, в каких единицах измерения представлены признаки. Следовательно, любые линейные преобразования признаков (умножение на константу, прибавление константы) не меняют значения коэффициента корреляции. Исключением является умножение одного из признаков на отрицательную константу: коэффициент корреляции меняет свой знак на противоположный.

Применение корреляции Спирмена и Пирсона.

Корреляция Пирсона есть мера линейной связи между двумя переменными. Она позволяет определить, насколько пропорциональна изменчивость двух переменных. Если переменные пропорциональны друг другу, то графически связь между ними можно представить в виде прямой линии с положительным (прямая пропорция) или отрицательным (обратная пропорция) наклоном.

На практике связь между двумя переменными, если она есть, является вероятностной и графически выглядит как облако рассеивания эллипсоидной формы. Этот эллипсоид, однако, можно представить (аппроксимировать) в виде прямой линии, или линии регрессии. Линия регрессии - это прямая, построенная методом наименьших квадратов: сумма квадратов расстояний (вычисленных по оси Y) от каждой точки графика рассеивания до прямой является минимальной.

Особое значение для оценки точности предсказания имеет дисперсия оценок зависимой переменной. По сути, дисперсия оценок зависимой переменной Y - это та часть ее полной дисперсии, которая обусловлена влиянием независимой переменной X. Иначе говоря, отношение дисперсии оценок зависимой переменной к ее истинной дисперсии равно квадрату коэффициента корреляции.

Квадрат коэффициента корреляции зависимой и независимой переменных представляет долю дисперсии зависимой переменной, обусловленной влиянием независимой переменной, и называется коэффициентом детерминации. Коэффициент детерминации, таким образом, показывает, в какой степени изменчивость одной переменной обусловлена (детерминирована) влиянием другой переменной.

Коэффициент детерминации обладает важным преимуществом по сравнению с коэффициентом корреляции. Корреляция не является линейной функцией связи между двумя переменными. Поэтому, среднее арифметическое коэффициентов корреляции для нескольких выборок не совпадает с корреляцией, вычисленной сразу для всех испытуемых из этих выборок (т.е. коэффициент корреляции не аддитивен). Напротив, коэффициент детерминации отражает связь линейно и поэтому является аддитивным: допускается его усреднение для нескольких выборок.

Дополнительную информацию о силе связи дает значение коэффициента корреляции в квадрате - коэффициент детерминации: это часть дисперсии одной переменной, которая может быть объяснена влиянием другой переменной. В отличие от коэффициента корреляции коэффициент детерминации линейно возрастает с увеличением силы связи.

Коэффициенты корреляции Спирмена и τ- Кендалла (ранговые корреляции)

Если обе переменные, между которыми изучается связь, представлены в порядковой шкале, или одна из них - в порядковой, а другая - в метрической, то применяются ранговые коэффициенты корреляции: Спирмена или τ- Кенделла. И тот, и другой коэффициент требует для своего применения предварительного ранжирования обеих переменных.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Если члены группы численностью были ранжированы сначала по переменной x, затем - по переменной y, то корреляцию между переменными x и y можно получить, просто вычислив коэффициент Пирсона для двух рядов рангов. При условии отсутствия связей в рангах (т.е. отсутствия повторяющихся рангов) по той и другой переменной, формула для Пирсона может быть существенно упрощена в вычислительном отношении и преобразована в формулу, известную как Спирмена.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.

Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.

Коэффициент ранговой корреляции Спирмена при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений

Альтернативу корреляции Спирмена для рангов представляет корреляция τ- Кендалла. В основе корреляции, предложенной М.Кендаллом, лежит идея о том, что о направлении связи можно судить, попарно сравнивая между собой испытуемых: если у пары испытуемых изменение по x совпадает по направлению с изменением по y, то это свидетельствует о положительной связи, если не совпадает - то об отрицательной связи.

Коэффициенты корреляции были специально разработаны для численного определения силы и направления связи между двумя свойствами, измеренными в числовых шкалах (метрических или ранговых). Как уже упоминалось, максимальной силе связи соответствуют значения корреляции +1 (строгая прямая или прямо пропорциональная связь) и -1 (строгая обратная или обратно пропорциональная связь), отсутствию связи соответствует корреляция, равная нулю. Дополнительную информацию о силе связи дает значение коэффициента детерминации: это часть дисперсии одной переменной, которая может быть объяснена влиянием другой переменной.

9. Параметрические методы сравнения данных


Параметрические методы сравнения применяются в том случае, если ваши переменные были измерены в метрической шкале.

Сравнение дисперсий 2- х выборок по критерию Фишера.


Данный метод позволяет проверить гипотезу о том, что дисперсии 2-х генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Ограничения метода - распределения признака в обеих выборках не должны отличаться от нормального.

Альтернативой сравнения дисперсий является критерий Ливена, для которого нет необходимости в проверке на нормальность распределения. Данный метод может применяться для проверки предположения о равенстве (гомогенности) дисперсий перед проверкой достоверности различия средних по критерию Стьюдента для независимых выборок разной численности.

Ранговая корреляция Спирмена (корреляция рангов). Ранговая корреляция Спирмена - самый простой способ определения степени связи между факторами. Название метода свидетельствует о том, что связь определяют между рангами, то есть рядами полученных количественных значений, ранжированных в порядке убывания или возрастания. Надо иметь в виду, что, во-первых, ранговое корреляцию Не рекомендуется проводить, если связь пар меньше четырех и больше двадцати; во-вторых, ранговая корреляция позволяет определять связь и в другом случае, если значение имеют полуколичественный характер, то есть не имеют числового выражения, отражают четкий порядок следования этих величин; в-третьих, ранговое корреляцию целесообразно применять в тех случаях, когда достаточно получить приблизительные данные. Пример расчета коэффициента ранговой корреляции для определения вопрос: замеряют вопросник X и Y подобные личностные качества испытуемых. С помощью двух вопросников (X и Y), которые требуют альтернативных ответов "да" или "нет", получили первичные результаты - ответы 15 испытуемых (N = 10). Результаты подали в виде суммы утвердительных ответов отдельно для вопросника X и для вопросника В. Эти результаты сведены в табл. 5.19.

Таблица 5.19. Табулирование первичных результатов для расчета коэффициента ранговой корреляции по Спирмену (р) *

Анализ сводной корреляционной матрицы. Метод корреляционных плеяд.

Пример. В табл. 6.18 приведены интерпретации одиннадцати переменных, которые тестируют по методике Векслера. Данные получили на однородной выборке в возрасте от 18 до 25 лет (n = 800).

Перед расслаиванием корреляционную матрицу целесообразно ранжировать. Для этого в исходной матрицы вычисляют средние значения коэффициентов корреляции каждой переменной со всеми остальными.

Затем по табл. 5.20 определяют допустимые уровни расслоение корреляционной матрицы при заданных доверительной вероятности 0,95 и n - количества

Таблица 6.20. Восходящая корреляционная матрица

Переменные 1 2 3 4 бы 0 7 8 0 10 11 M (rij) Ранг
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Обозначения: 1 - общая осведомленность; 2 - понятийнисть; 3 - внимательность; 4 - вдатнисть К обобщения; б - непосредственное запоминание (на цифрах) 6 - уровень освоения родном языке; 7 - скорость овладения сенсомоторном навыками (кодирование символами) 8 - наблюдательность; 9 - комбинаторные способности (к анализу и синтезу) 10 - способность к организации частей в осмысленное целое; 11 - способность к эвристического синтеза; M (rij) - среднее значение коэффициентов корреляции переменной с остальными переменных наблюдений (в нашем случае n = 800): r (0) - значение нулевой "Рассекая" плоскости - минимальная значимая абсолютная величина коэффициента корреляции (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - допустимый шаг расслоения (n = 40, | Δr | = 0,558) в - допустимое количество уровней расслоения (n = 40, s = 1 ; n = 120, s = 2); r (1), r (2), ..., r (9) - абсолютное значение секущей плоскости (n = 40, r (1) = 0,965).

Для n = 800 находим значение гтип и границ ги после чего Расслаивающая ранжированы корреляционную матрицу, выделяя корреляционные плеяды внутри слоев, или отделяем части корреляционной матрицы, вырисовывая объединения корреляционных плеяд для вышележащих слоев (рис. 5.5).

Содержательный анализ полученных плеяд выходит за пределы математической статистики. Надо отметить два формальные показатели, которые помогают при содержательной интерпретации плеяд. Одним существенным показателем служит степень вершины, то есть количество ребер, примыкающих к вершине. Переменная с наибольшим количеством ребер является "ядром" плеяды и ее можно рассматривать как индикатор остальных переменных этой плеяды. Другой существенный показатель - плотность связи. Переменная может иметь меньше связей в одной плеяде, но теснее, и больше связей в другой плеяде, однако менее тесных.

Предсказания и оценки. Уравнение у = b1x + b0 называется общим уравнением прямой. Оно свидетельствует о том, что пары точек (x, y), которые

Рис. 5.5. Корреляционные плеяды, полученные расслоением матрицы

лежат на некоторой прямой, связанные так, что для любого значения х величину в в находящегося с ним в паре, можно найти, умножив х на некоторое число b1 добавив вторых, число b0 к этому произведению.

Коэффициент регрессии позволяет определить степень изменения следственной фактора при изменении причинного фактора на одну единицу. Абсолютные величины характеризуют зависимость между переменными факторами по их абсолютными значениями. Коэффициент регрессии вычисляют по формуле:

Планирование и анализ экспериментов. Планирование и анализ экспериментов - это третья важная отрасль статистических методов, разработанных для нахождения и проверки причинных связей между переменными.

Для исследования многофакторных зависимостей в последнее время все чаще используют методы математического планирования эксперимента.

Возможность одновременного варьирования всеми факторами позволяет: а) уменьшить количество опытов;

б) свести ошибку эксперимента к минимуму;

в) упростить обработку полученных данных;

г) обеспечить наглядность и легкость по сравнению результатов.

Каждый фактор может приобретать некоторую соответствующее количество различных значений, которые называются уровнями и обозначают -1, 0 и 1. Фиксированный набор уровней факторов определяет условия одного из возможных опытов.

Совокупность всех возможных сочетаний вычисляют по формуле:

Полным факторным экспериментом называется эксперимент, в котором реализуются все возможные сочетания уровней факторов. Полные факторные эксперименты могут обладать свойством ортогональности. При ортогональном планировании факторы в эксперименте является некоррелированными, коэффициенты регрессии, которые высчитывают в итоге, определяют независимо друг от друга.

Важным преимуществом метода математического планирования эксперимента является его универсальность, пригодность во многих областях исследований.

Рассмотрим пример сравнения влияния некоторых факторов на формирование уровня психического напряжения в регулировщиков цветных телевизоров.

В основу эксперимента положен ортогональный План 2 три (три фактора изменяются на двух уровнях).

Эксперимент проводили с полным части 2 +3 с трехкратным повторением.

Ортогональное планирование базируется на построении уравнения регрессии. Для трех факторов оно выглядит так:

Обработка результатов в этом примере включает:

а) построение ортогонального плана 2 +3 таблице для расчета;

б) вычисления коэффициентов регрессии;

в) проверку их значимости;

г) интерпретацию полученных данных.

Для коэффициентов регрессии упомянутого уравнения надо было поставить N = 2 3 = 8 вариантов, чтобы иметь возможность оценить значимость коэффициентов, где количество повторений К равнялось 3.

Составлена матрица планирования эксперимента выглядела.

Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений,

которые могут быть проранжированы. Такими рядами значений могут быть:

1) два признака, измеренные в одной и той же группе испытуемых;

2) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;

3) две групповые иерархии признаков,

4) индивидуальная и групповая иерархии признаков.

Вначале показатели ранжируются отдельно по каждому из признаков.

Как правило, меньшему значению признака начисляется меньший ранг.

В первом случае (два признака) ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку.

Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по

одному из признаков, будут иметь по другому признаку также высокие ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными данным испытуемым по обоим признакам. Затем эти показатели d определенным образом преобразуются и вычитаются из 1. Чем

меньше разности между рангами, тем больше будет rs, тем ближе он будет к +1.

Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет

никакого соответствия. Формула составлена так, что в этом случае rs окажется близким к 0.

В случае отрицательной корреляции низким рангам испытуемых по одному признаку

будут соответствовать высокие ранги по другому признаку, и наоборот. Чем больше несовпадение между рангами испытуемых по двум переменным, тем ближе rs к -1.

Во втором случае (два индивидуальных профиля), ранжируются индивидуальные

значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до

20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов).

Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор Е (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор С

(эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по

этому фактору высокий ранг и т.д.

В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.

В случае 4-ом (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого – он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.

Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки n. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах. Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.

Гипотезы.

Возможны два варианта гипотез. Первый относится к случаю 1, второй – к трем остальным случаям.

Первый вариант гипотез

H0: Корреляция между переменными А и Б не отличается от нуля.

H1: Корреляция между переменными А и Б достоверно отличается от нуля.

Второй вариант гипотез

H0: Корреляция между иерархиями А и Б не отличается от нуля.

H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.

Ограничения коэффициента ранговой корреляции

1. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений.

2. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.

Коэффициент ранговой корреляции Спирмена подсчитывается по формуле:

Если в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги Та и Тв:

Та = Σ (а3 – а)/12,

Тв = Σ (в3 – в)/12,

где а – объем каждой группы одинаковых рангов в ранговом ряду А, в – объем каждой

группы одинаковых рангов в ранговом ряду В.

Для подсчета эмпирического значения rs используют формулу:

Расчет коэффициента ранговой корреляции Спирмена rs

1. Определить, какие два признака или две иерархии признаков будут участвовать в

сопоставлении как переменные А и В.

2. Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования (см. П.2.3). Занести ранги в первый столбец таблицы по порядку номеров испытуемых или признаков.

3. Проранжировать значения переменной В, в соответствии с теми же правилами. Занести ранги во второй столбец таблицы по порядку номеров испытуемых или признаков.

5. Возвести каждую разность в квадрат: d2. Эти значения занести в четвертый столбец таблицы.

Та = Σ (а3 – а)/12,

Тв = Σ (в3 – в)/12,

где а – объем каждой группы одинаковых рангов в ранговом ряду А; в – объем каждой группы

одинаковых рангов в ранговом ряду В.

а) при отсутствии одинаковых рангов

rs  1 − 6 ⋅

б) при наличии одинаковых рангов

Σd 2  T  T

r  1 − 6 ⋅ a в,

где Σd2 – сумма квадратов разностей между рангами; Та и Тв – поправки на одинаковые

N – количество испытуемых или признаков, участвовавших в ранжировании.

9. Определить по Таблице (см. Приложение 4.3) критические значения rs для данного N. Если rs, превышает критическое значение или, по крайней мере, равен ему, корреляция достоверно отличается от 0.

Пример 4.1.При определении степени зависимости реакции употребления алкоголя на глазодвигательную реакцию в испытуемой группе были получены данные до употребления алкоголя и после употребления. Зависит ли реакция испытуемого от состояния опьянения?

Результаты эксперимента:

До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. После: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулируем гипотезы:

Н0: корреляция между степенью зависимости реакции до употребления алкоголя и после не отличается от нуля.

Н1: корреляция между степенью зависимости реакции до употребления алкоголя и после достоверно отличается от нуля.

Таблица 4.1. Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей глазодвигательной реакции до эксперимента и после (N=17)

значения

значения

Так как, мы имеем повторяющиеся ранги, то в данном случае будем применять формулу с поправкой на одинаковые ранги:

Та= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Найдем эмпирическое значение коэффициента Спирмена:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

По таблице (приложение 4.3) находим критические значения коэффициента корреляции

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Получаем

rs=0,05∠rкр(0,05)=0,48

Вывод: Н1гипотеза отвергается и принимается Н0. Т.е. корреляция между степенью

зависимости реакции до употребления алкоголя и после не отличается от нуля.

Публикации по теме