Психолога нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых группах. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или с чем больше связан уровень умственного развития учащихся – с их успеваемостью по математике или литературе и т.п.?
Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г.
Первоначальное значение термина «корреляция» – взаимная связь (Oxford Advanced Learner’s Dictionary of Current English, 1982). Когда говорят о корреляции, используют термины «корреляционная связь» и «корреляционная зависимость».
Корреляционная связь – это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого. С другой стороны, корреляционная связь может говорить не о зависимости признаков между собой, а о зависимости этих признаков от другого (других). Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам неизвестно.
Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин.
Говорить в строгом смысле о зависимости мы можем только в тех случаях, когда сами оказываем какое–то контролируемое воздействие на испытуемых или так организуем исследование, что оказывается возможным точно определить интенсивность не зависящих от нас воздействий.
Независимые переменные –воздействия, которые можно качественно определить или даже измерить.
Зависимые переменные –признаки, которые измеряются и могут изменяться под влиянием независимых переменных.
Согласованные изменения независимой и зависимой переменных действительно могут рассматриваться как зависимость.
Корреляционные связи различаются по форме, направлению и степени (силе).
По форме корреляционная связь может быть линейной и криволинейной.
Линейнаясвязь – если с увеличением или уменьшением одной переменной, вторая переменная в среднем либо также растет, либо убывает (рис. 9.1, 9.2). Например, прямолинейной можно назвать связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии.
Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности (рис.9.3).
По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»).
При положительной (прямой) корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака – низкие значения другого (рис. 9.1).
При отрицательной (обратной) корреляции высокие значения одного признака соответствуют более низким значениям другого (рис. 9.2).
Рис.9.1.Линейная положительная связь Рис.9.2. Линейная отрицательная связь
Рис. 9.3. Криволинейная связь Рис. 9.4. Случайная связь
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными.
Используются две системы классификации корреляционных связей по их силе: общая и частная.
Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):
1) сильная, или тесная 2) средняя 3) умеренная 4) слабая 5) очень слабая
при r > 0,70; при 0,50 0,70, а не просто корреляция высокого уровня значимости.
Переменные могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции. В таблице 9.1 представлены соотношения между шкалами [3].
Все эмпирические меры тесноты связи, кроме коэффициента ранговой корреляции, могут быть заменены методами сопоставления и сравнения.
Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся – с их успеваемостью по математике или по литературе и т.п.?
Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционная связь – это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.
Корреляционные связи – это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики. «Оба термина, корреляционная связь и корреляционная зависимость – часто используются как синонимы. Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.
Корреляционная зависимость – это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.
Корреляционные связи различаютсяпо форме, направлению и степени (силе).
По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Максимальное возможное абсолютное значение коэффициента корреляции r=1,00; минимальное r=0,00.
Общая классификация корреляционных связей:
сильная, или тесная при коэффициенте корреляции r>0,70;
Корреляционные связи различаются по форме, направлению и степени (силе).
1. По форме корреляционная связь может быть прямолинейной или криволинейной.
· Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии.
· Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. рис. 1). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.
2. По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»).
3. Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
К методам исследования взаимосвязей относятся:
1) Метод взаимосвязанных параллельных рядов состоит в установлении связей между экономическими явлениями посредством сопоставления показателей двух или нескольких рядов. Для этого признак-фактор ранжируется, т.е. располагается в порядке возрастания или убывания признака и соответственно ему записываются значения результативного признака. Путем сравнения взаимосвязанных рядов выявляется наличие связи и ее направление. Можно сравнивать временные и территориальные ряды.
2) Балансовый метод применяется для анализа связей и пропорций в экономике. Баланс представляет систему показателей, состоящей из равенства ресурсов и их распределения. Схема баланса может быть представлена равенством:
(Остаток начальный + Поступление = Расход + Остаток конечный).
Дисперсионный анализ, предложенный Р. Фишером, является статистическим методом, предназначенным для выявления влияния ряда отдельных факторов на результаты экспериментов.
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные), а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
Сущность дисперсионного анализа заключается в расчленении общей дисперсии изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Сравнивая компоненты дисперсии друг с другом посредством F — критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
Исходным материалом для дисперсионного анализа служат данные исследования трех и более выборок, которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По количеству выявляемых регулируемых факторов дисперсионный анализ может быть однофакторным (при этом изучается влияние одного фактора на результаты эксперимента), двухфакторным (при изучении влияния двух факторов) и многофакторным (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие).
Дисперсионный анализ относится к группе параметрических методов и поэтому его следует применять только тогда, когда доказано, что распределение является нормальным. (Суходольский Г.В., 1972; Шеффе Г., 1980).
7.1.1 Однофакторный дисперсионный анализ для несвязанных выборок
Изучается действие только одной переменной (фактора) на исследуемый признак. Исследователя интересует вопрос, как изменяется определенный признак в разных условиях действия переменной (фактора). Например, как изменяется время решения задачи при разных условиях мотивации испытуемых (низкой, средней, высокой мотивации) или при разных способах предъявления задачи (устно, письменно или в виде текста с графиками и иллюстрациями), в разных условиях работы с задачей (в одиночестве, в комнате с преподавателем, в классе). В первом случае фактором является мотивация, во втором – степень наглядности, в третьем – фактор публичности. [1]
В данном варианте метода влиянию каждой из градаций подвергаются разные выборки испытуемых. Градаций фактора должно быть не менее трех.
Группа 1 низкая скорость
Группа 2 средняя скорость
Группа 3 высокая скорость
Дисперсионный однофакторный анализ позволяет проверить гипотезы:
H 0 : различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы
H 1 : Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.
Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок:
, (1)
где Тс – сумма индивидуальных значений по каждому из условий. Для нашего примера 43, 37, 24 (см. табл. 1);
с – количество условий (градаций) фактора (=3);
n – количество испытуемых в каждой группе (=6);
N – общее количество индивидуальных значений (=18);
— квадрат общей суммы индивидуальных значений (=104 2 =10816)
Отметим разницу между , в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и , где индивидуальные значения сначала суммируются для получения общей суммы, а потом уже эта сумма возводится в квадрат.
По формуле (1) рассчитав фактическую вариативность признака, получаем:
2. подсчитаем SS общ – общую вариативность признака:
(2)
(3)
4. число степеней свободы равно:
=3-1=2 (4)
5. «средний квадрат» или математическое ожидание суммы квадратов, усредненная величина соответствующих сумм квадратов SS равна:
(5)
6. значение статистики критерияF эмпрассчитаем по формуле:
(6)
Для нашего примера имеем: F эмп=15,72/2,11=7,45
7. определим F крит по статистическим таблицам Приложения 3 для df 1= k 1=2 и df 2= k 2=15 табличное значение статистики равно 3,68
8. если F эмп F крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная гипотеза. Для нашего примера F эмп > F крит (7.45>3.68), следовательно п ринимается альтернативная гипотеза.
Вывод: различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (р
7.1.2 Дисперсионный анализ для связанных выборок
Метод дисперсионного анализа для связанных выборок применяется в тех случаях, когда исследуется влияние разных градаций фактора или разных условий на одну и ту же выборку испытуемых. Градаций фактора должно быть не менее трех.
Пример 2. Группа из 5 испытуемых была обследована с помощью трех экспериментальных заданий, направленных на изучение интеллектуальной, настойчивости (Сидоренко Е. В., 1984). Каждому испытуемому индивидуально предъявлялись последовательно три одинаковые анаграммы: четырехбуквенная, пятибуквенная и шестибуквенная. Можно ли считать, что фактор длины анаграммы влияет на длительность попыток ее решения?
Таблица 2. Длительность решения анаграмм (сек)
Условие 1. четырехбуквенная анаграмма
Условие 2. Пятибуквенная анаграмма
Условие 3. шестибуквенная анаграмма
Суммы по испытуемым
Сформулируем гипотезы. Наборов гипотез в данном случае два.
Н0(А): Различия в длительности попыток решения анаграмм разной длины являются не более выраженными, чем различия, обусловленные случайными причинами.
Н1(А): Различия в длительности попыток решения анаграмм разной длины являются более выраженными, чем различия, обусловленные случайными причинами.
Но(Б): Индивидуальные различия между испытуемыми являются не более выраженными, чем различия, обусловленные случайными причинами.
Н1(Б): Индивидуальные различия между испытуемыми являются более выраженными, чем различия, обусловленные случайными причинами.
Последовательность операций в однофакторном дисперсионном анализе для связанных выборок:
,
где Тс – сумма индивидуальных значений по каждому из условий (столбцов). Для нашего примера 51, 1244, 47 (см. табл. 2); с – количество условий (градаций) фактора (=3); n – количество испытуемых в каждой группе (=5); N – общее количество индивидуальных значений (=15); — квадрат общей суммы индивидуальных значений (=1342 2 )
где Ти – сумма индивидуальных значений по каждому испытуемому. Для нашего примера 247, 631, 100, 181, 183 (см. табл. 2); с – количество условий (градаций) фактора (=3); N – общее количество индивидуальных значений (=15);
3. подсчитаем SS общ – общую вариативность признака по формуле (2):
5. число степеней свободы равно (4):
; ; ;
6. «средний квадрат» или математическое ожидание суммы квадратов, усредненная величина соответствующих сумм квадратов SS равна (5):
;
7. значение статистики критерия F эмпрассчитаем по формуле (6 ):
;
8. определим F крит по статистическим таблицам Приложения 3 для df 1= k 1=2 и df 2= k 2=8 табличное значение статистики F крит_факт=4,46, и для df 3= k 3=4 и df 2= k 2=8 F крит_исп=3,84
9. F эмп_факт > F крит_факт (6,872>4,46), следовательно п ринимается альтернативная гипотеза.
10. F эмп_исп F крит_исп (1,054 ринимается нулевая гипотеза.
Вывод: различия в объеме воспроизведения слов в разных условиях являются более выраженными, чем различия, обусловленные случайными причинами (р Индивидуальные различия между испытуемыми являются не более выраженными, чем различия, обусловленные случайными причинами.
7.2 Корреляционный анализ
7.2.1 Понятие корреляционной связи
Исследователя нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, могут ли учащиеся с высоким уровнем тревожности демонстрировать стабильные академические достижения, или связана ли продолжительность работы учителя в школе с размером его заработной платы, или с чем больше связан уровень умственного развития учащихся — с их успеваемостью по математике или по литературе и т.п.?
Такого рода зависимость между переменными величинами называется корреляционной, или корреляцией. Корреляционнаясвязь — это согласованное изменение двух признаков, отражающее тот факт, что изменчивость одного признака находится в соответствии с изменчивостью другого.
Известно, например, что в среднем между ростом людей и их весом наблюдается положительная связь, и такая, что чем больше рост, тем больше вес человека. Однако из этого правила имеются исключения, когда относительно низкие люди имеют избыточный вес, и, наоборот, астеники, при высоком росте имеют малый вес. Причиной подобных исключений является то, что каждый биологический, физиологический или психологический признак определяется воздействием многих факторов: средовых, генетических, социальных, экологических и т.д.
Корреляционные связи — это вероятностные изменения, которые можно изучать только на представительных выборках методами математической статистики. «Оба термина, — пишет Е.В. Сидоренко, — корреляционная связь и корреляционная зависимость — часто используются как синонимы. Зависимость подразумевает влияние, связь — любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого.
Задача корреляционного анализа сводится к установлению направления (положительное или отрицательное) и формы (линейная, нелинейная) связи между варьирующими признаками, измерению ее тесноты, и, наконец, к проверке уровня значимости полученных коэффициентов корреляции.
Корреляционные связи различаются по форме, направлению и степени (силе).
По форме корреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи (см. рис. 1). При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности.
Рис.1. Связь между эффективностью решения задачи
и силой мотивационной тенденции (по J. W. A t k in son, 1974, р 200)
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.
Общая классификация корреляционных связей (по Ивантер Э.В., Коросову А.В., 1992):
очень слабая при r Y могут быть измерены в разных шкалах, именно это определяет выбор соответствующего коэффициента корреляции (см. табл. 3):
Таблица 3. Использование коэффициента корреляции в зависимости от типа переменных