форму связи между признаками у и х

Методические подходы к измерению взаимосвязей

Понятие о статистических связях

Все явления общественной жизни существуют не изолированно, они органично связаны между собой, зависят друг от друга, обусловливают одно другое и находятся в постоянном движении и развитии. Раскрывая взаимосвязи и взаимозависимости между явлениями, можно познать их суть и законы развития.

Причинная зависимость является основной формой закономерных связей, действующих в определенных условиях места и времени. Поэтому, для появления следствия необходимы и причины, и условия, т.е. соответствующие факторы.

Общественные явления или отдельные их признаки, оказывающие влияние на другие явления или свойства и определяющие их изменения, называются факторными, а общественные явления или отдельные их признаки, которые изменяются под влиянием соответствующих факторов, называются результативными.

По характеру зависимости явлений различают функциональные (жестко детерминированные) и статистические (или стохастически детерминированные) связи.

Функциональной называется связь, при которой определенному значению факторного признака всегда соответствует, как правило, одно значение результативного признака. Функциональные связи характеризуются полным соответствием между причиной и следствием. Вследствие этого функциональная зависимость всегда выражается точною математической формулой. При этом не обязательно, чтобы одному результативному признаку строго соответствовал только один факторный признак, как, например, в случае связи между длиной окружности и радиусом описываемой формулой: l = 2πR. Существуют функциональные связи, при которых результативный признак является функцией нескольких факторных признаков. Например, площадь земельного участка будет зависеть от длин его сторон: S = a×b. Функциональные зависимости изучаются точными науками, такими как математика, физика, химия и др. Они очень редко используются для исследования общественных явлений.

Статистическая связь не имеет ограничений и условий, присущих функциональной связи.

Связь является статистической, если с изменением значения факторного признака результативный признак может в определенных пределах принимать любые значения с некоторыми вероятностями, но его среднее значение или иные статистические характеристики (показатели вариации, асимметрии, эксцесса и т. п.) изменяются по определенному закону.

Важнейшим частным случаем статистической связи является корреляционная связь.

Слово «корреляция» (от английского correlation) означает соотношение, соответствие. Оно удачно отражает особенность зависимости, при которой определенному значению одного факторного признака может соответствовать несколько значений результативного признака, на основе которых можно определить среднюю величину результативного признака, соответствующую каждому конкретному значению факторного признака.

Связь, при которой разным значениям факторного признака соответствуют различные средние значения результативного признака, называется корреляционной связью. Именно корреляционные зависимости наиболее часто используются при исследовании общественных явлений.

Суть корреляционной зависимости сводится к тому, что, с изменением значения факторного признака х закономерным образом изменяется среднее значение результативного признака у, в то время как в каждом отдельном случае значение результативного признака у (с различными вероятностями) может принимать множество различных значений.

Корреляционная связь между признаками может возникать разными путями:

– во-первых, как причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, зависимость заработной платой работников от стажа их работы, себестоимости продукции от объемов производства продукции, урожайности зерновых от внесения удобрений и т.п.;

– во-вторых, как связь между двумя следствиями общей причины. Классический пример такого рода корреляционной связи приведен А. Чупровым, крупнейшим российским статистиком ХХ века определившим, что прямая зависимость между убытками от пожара и числом пожарных команд в городе обусловлена общей причиной их величины – размером города;

– в-третьих, как взаимосвязь признаков, каждый из которых и причина, и следствие. Такова, например, корреляция между уровнями производительности труда рабочих и уровнем оплаты одного часа труда (часовой тарифной ставкой).

Характеристика основных разновидностей корреляционных связей представлена в таблице 7.1.

Классификация корреляционных связей

Классификационный признакНазвание корреляцииХарактеристика корреляционной связи
По направлению связиПрямаяС ростом факторного признака растет и результативный признак. Например, с ростом производительности труда растет объем выпущенной продукции при прочих равных условиях
ОбратнаяС увеличением факторного признака результативный признак уменьшается или наоборот. Например, рост производительности труда приводит к снижению себестоимости единицы продукции при прочих равных условиях
В соответствии с аналитическим выражением (по формуле)ПрямолинейнаяРавным изменениям значений факторного признака соответствуют приблизительно равные изменения средних значений результативного признака
КриволинейнаяРавным изменениям значений факторного признака соответствуют неравные изменения средних значений результативного признака
По числу факторных показателей, учитываемых для оценки степени их влияния на результативный показательПарнаяСвязь между двумя показателями, один из которых является факторным, а другой – результативным
МножественнаяСвязь, возникающая от взаимодействия нескольких факторов с результативным показателем. Например, на урожайность зерновых культур влияют качество семян, количество внесенных удобрений, степень механизации сельхозпроизводства и др. В свою очередь, урожайность зерновых культур, количество внесенных удобрений, производительность труда и т.п. влияют на уровень себестоимости 1 ц зерновых культур

Задачи, решаемые при помощи анализа корреляционных связей, приведены на рис. 7.1.

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Так как факторные и результативные признаки могут быть количественными и описательными (атрибутивными), т.е. не имеющими численного выражения, то выделяют параметрические и непараметрические методы измерения связей и соответствующие им параметрические и непараметрические показатели связи.

К параметрическим методам измерения связей относятся, например, методы аналитической группировки и корреляционно-регрессионного анализа, а к непараметрическим методам – методы сравнения параллельных рядов и измерения связи между атрибутивными признаками.

Метод сравнения параллельных рядов

Суть метода сравнения параллельных рядов состоит в том, что полученные в результате группировки и счетной обработки материалы статистического наблюдения располагаются ранжированными по факторному признаку параллельными рядами. Параллельно записываются значения результативного признака. Это дает возможность, сравнивая значения факторных и результативных показателей, проследить их соотношение, выявить наличие связи и ее направление.

Пример параллельных рядов, позволяющих оценить характер зависимости между стоимостью основных производственных фондов предприятия (факторным признаком) и объемом его товарной продукции (результативным признаком), приведен в таблице 7.2.

Данные, характеризующие десять предприятий одной отрасли

ПоказателиНомер предприятия
12345678910
Стоимость основных производственных фондов (х), млрд. руб.5,36,47,98,39,210,112,513,014,615,7
Товарная продукция (у), млрд. руб.5,87,68,79,111,912,313,814,015,217,6

Из данных таблицы 7.2 видно, что с увеличением стоимости основных производственных фондов выпуск продукции увеличивается.

Направление и силу корреляционной связи по данным параллельных рядов рассчитывают при помощи коэффициентов корреляции знаков (коэффициента Фехнера) и корреляции рангов (коэффициента корреляции рангов Спирмена).

Коэффициент Фехнера, предложенный немецким психологом Г.Т. Фехнером еще в XIX в., оценивает силу связи на основе сравнения знаков отклонений значений вариант от их среднего значения по каждому признаку. Совпадение знаков по факторному и результативному признакам означает согласованную вариацию, несовпадение – нарушение согласованности между признаками.

Коэффициент Фехнера (КФ), представляющий собой коэффициент корреляции знаков, рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где ΣС – сумма знаков, которые совпали в обоих рядах; ΣН – сумма не совпавших знаков.

Пример оценки характера связи между показателями параллельного ряда с помощью коэффициента Фехнера

По данным таблицы 7.2 необходимо оценить направление и силу связи между стоимостью основных производственных фондов и товарной продукцией предприятий одной отрасли с помощью коэффициента Фехнера.

По формуле 4.21 средняя стоимость основных производственных фондов предприятий отрасли равна: x = 10,3 млрд. руб.

По формуле 4.21 средний объем товарной продукции на одно предприятие отрасли равно: y = 11,6 млрд. руб.

Знаки отклонений от средней величины по признакам х и у приведены в таблице 7.3. Знак «минус» означает, что значение признака меньше средней величины, знак «плюс» – больше.

Знаки отклонений от средней величины стоимости основных производственных фондов предприятий (х) и их товарного выпуска (у)

Номер предприятия12345678910
Знак отклонения от средней величиныx- x++++
y- y++++++
С или НССССННСССС

Итак, в восьми случаях знаки совпали, в двух – не совпали, т.е. ΣС = 8, ΣН = 2.

По формуле 7.1 коэффициент Фехнера: 0,6, т.е. наблюдается достаточно сильная прямая связь между стоимостью основных производственных фондов предприятий и выпуском их продукции, предназначенной для реализации.

Более точно оценивает силу связи коэффициент корреляции рангов.

Ранги – это порядковые номера единиц совокупности в ранжированном ряду. Коэффициент корреляции рангов учитывает согласованность рангов, соответствующих отдельным единицам совокупности по каждому из двух исследуемых признаков.

Совокупность ранжируется по факторному признаку в порядке возрастания и единицам совокупности присваиваются соответствующие ранги. Параллельно проставляются ранги тех же единиц совокупности, какие они заняли бы в ранжированном ряду по результативному признаку.

Коэффициент корреляции рангов (ρ), предложенный американским ученым К. Спирменом, рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где d 2 – квадрат разницы между величинами рангов в сравниваемых рядах; n – число рангов.

Необходимо иметь в виду, что этот эмпирический показатель менее точен по сравнению с линейным коэффициентом корреляции и эмпирическим корреляционным отношением, а поэтому, когда он принимает крайние значения ±1 или 0, то это не означает, что существует функциональная связь или зависимость абсолютно отсутствует. Во всех других случаях, когда коэффициент ранговой корреляции не принимает крайних значений, он интерпретируется так же, как и коэффициент линейной корреляции и обладает такими же особенностями (п. 8.2, с. 131).

Пример оценки характера связи между показателями параллельного ряда с помощью коэффициента корреляции рангов Спирмена

По данным таблицы 7.4 необходимо определить направление и силу связи между стоимостью основных производственных фондов (ОПФ) и выработкой продукции на одного рабочего по десяти предприятиям отрасли при помощи коэффициента корреляции рангов Спирмена.

Данные, характеризующие десять предприятий одной отрасли

ПоказателиНомер предприятия
12345678910
Стоимость ОПФ (х), тыс. руб.26540278002348032400289103915031250400004137051990
Выработка продукции (у), тыс. руб./чел.320410200240430370180390440450

В таблице 7.5 проранжируем предприятия отрасли по стоимости основных производственных фондов (факторному признаку) в порядке возрастания и присвоим им соответствующие ранги. Параллельно проставим ранги тех же предприятий, какие они заняли бы в ранжированном ряду по выработке продукции на одного рабочего (результативному признаку). Вспомогательные данные для расчета коэффициента корреляции рангов Спирмена также приведены в таблице 7.5.

По формуле 7.2 коэффициент корреляции рангов Спирмена = 0,576, что указывает на заметную прямую связь между стоимостью основных производственных фондов предприятий отрасли и выработкой продукции на одного рабочего.

Существует правило, касающееся повторяющихся вариант, ранг которых определяется как средняя арифметическая соответствующих рангов, например, ранг одинаковых величин, занимающих 4 и 5 место, равен 4,5 («четыре целых пять десятых»). Соответственно одинаковым по порядку четвертому и пятому значениям признака будут присвоены одинаковые ранги 4,5.

В таком случае коэффициент корреляции рангов Спирмена вычисляется по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где А и В рассчитываются соответственно по формулам:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

j – номера связок (совпадений значений) по порядку для признака х;
Аj – число одинаковых рангов в j-й связке по х;
k – номера связок (совпадений значений) по порядку для признака у;
Вk – число одинаковых рангов в k-й связке по у.

Пример оценки характера связи между показателями параллельного ряда с помощью коэффициента корреляции рангов Спирмена в случае совпадения их значений

По данным таблицы 7.6 необходимо определить направление и силу связи между численностью работников 10 предприятий одного региона и величиной их основных производственных фондов (ОПФ).

Данные, характеризующие десять предприятий одного региона

ПоказателиНомер предприятия
12345678910
Среднесписочная численность персонала, чел.90350100035020035028902500850
Среднегодовая стоимость ОПФ, млрд. руб.0,242,985,651,261,201,200,502,1580,505,65

В таблице 7.7 проранжируем предприятия региона по стоимости основных производственных фондов (факторному признаку, так как численность работников предприятия зависит от количества эксплуатируемого на предприятии оборудования и других объектов основных фондов) в порядке возрастания и присвоим им соответствующие ранги. Параллельно проставим ранги тех же предприятий, какие они заняли бы в ранжированном ряду по среднесписочной численности работников (результативному признаку). Вспомогательные данные для расчета коэффициента корреляции рангов Спирмена также приведены в таблице 7.7.

В ранжированном ряду по факторному признаку повторяются варианты, стоящие на 3 и 4 месте и на 8 и 9 месте, следовательно, ранги этих вариант соответственно будут равны 3,5 ((3+4):2) и 8,5 ((8+9):2).

В ранжированном ряду по результативному признаку повторяются варианты, стоящие на 2 и 3 месте и на 5, 6 и 7 месте, следовательно, ранги этих вариант соответственно будут равны 2,5 ((2+3):2) и 6 ((5+6+7):3).

По формуле 7.4: A = 1.

По формуле 7.5: B = 2,5.

По формуле 7.3 коэффициент корреляции рангов Спирмена равен: 0,852.

Полученное значение коэффициента корреляции рангов Спирмена свидетельствует о тесной прямой зависимости между величиной основных производственных фондов и численностью работников предприятия.

Метод аналитической группировки. Таблицы взаимной сопряженности

Наличие зависимости между показателями, характеризующими статистическую совокупность, можно выявить с помощью аналитической группировки. Напомним, что статистические группировки, при помощи которых выявляют взаимосвязи между признаками общественных явлений, называются аналитическими.

Метод аналитических группировок как способ выявления корреляционной зависимости между показателями относится к числу наиболее важных методов исследования взаимосвязей.

Результаты группировки единиц совокупности оформляются в виде таблицы, в которой приводится комбинационное распределение единиц совокупности по двум признакам. Такие таблицы называют таблицами взаимной сопряженности. Примером таблицы взаимной сопряженности можно рассматривать таблицу 5.11, в которой приведена группировка сельскохозяйственных предприятий с разной урожайностью зерновых культур по организационно-правовой форме.

Если в таблице оба признака, по которым дано распределение единиц совокупности, количественные, то такая таблица взаимной сопряженности называется корреляционной.

Корреляционная таблица строится по типу «шахматной», т.е. в подлежащем таблицы выделяются группы по факторному признаку х, в сказуемом – по результативному у или наоборот, а в клетках таблицы на пересечении х и у показано число случаев совпадения каждого значения х с соответствующим значением у.

Для выявления зависимости между непрерывными количественными признаками в сформированных группах по факторному и результативному признакам в качестве х и у принимаются середины соответствующих интервалов.

Макет корреляционной таблицы показан с помощью таблицы 7.8.

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Корреляционная связь существует, если по мере увеличения значения х групповые средние значений у ( y j) тоже увеличиваются (или уменьшаются) от группы к группе. Таким образом, сравнивая изменения средних значений результативного признака с изменением средних значений факторного признака, выявляют характер связи между ними.

О наличии и направлении связи можно судить и по «внешнему виду» таблицы, т.е. по расположению в ней частот.

Так, если числа (частоты) расположены (разбросаны) в клетках таблицы беспорядочно, то это чаще всего свидетельствует либо об отсутствии связи между группировочными признаками, либо об их незначительной зависимости. Если же частоты сконцентрированы ближе к одной из диагоналей и центру таблицы, образуя своего рода эллипс, то это почти всегда свидетельствует о наличии зависимости между х и у, близкой к линейной. Диагональ из верхнего левого угла в нижний правый свидетельствует о прямой линейной зависимости между показателями х и у, а из нижнего левого угла в верхний правый – об обратной.

Наглядно проиллюстрировать наличие и форму зависимости между показателями х и у по данным корреляционной таблицы можно и графически.

При построении эмпирической линии регрессии по данным корреляционной таблицы на графике по оси абсцисс отражают значения факторного признака (или середины соответствующих интервалов) х, а по оси ординат – групповые средние результативного показателя, т.е. y j. Для большей наглядности на графике по исходным данным можно построить «корреляционное поле», а затем на его фоне – эмпирическую линию регрессии.

Корреляционное поле представляет, по существу, ту же корреляционную таблицу, в клетках которой вместо чисел проставлено соответствующее число точек. Корреляционное поле отражает не только общую зависимость между х и у, но и концентрацию индивидуальных точек вокруг линии регрессии показателя y j.

На рис. 7.2 показаны варианты распределения корреляционного поля.

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Если точки расположены хаотично по всему полю, то это свидетельствует об отсутствии зависимости между двумя признаками (рис. 7.2, а); если они сконцентрированы около оси, идущей от нижнего левого угла к верхнему правому (рис. 7.2, б), – это прямая зависимость между исследуемыми признаками; если точки будут сконцентрированы около оси, пролегающей от верхнего левого угла к нижнему правому (рис. 7.2, в) – имеет место обратная зависимость.

Пример корреляционной таблицы, в которой приведено распределение работников предприятия по уровню квалификации, характеризующегося их тарифным разрядом, и уровню месячной заработной платы, показан с помощью данных таблицы 7.9.

Распределение работников предприятия по уровню квалификации и уровню заработной платы

Разряд работников (xi)Месячная заработная плата, руб. (yj)Итого (fx = fj)Среднемесячный заработок по группам, руб. ( y j)
6000- 80008000- 1000010000- 1200012000- 1400014000- 1600016000- 1800018000- 20000
700090001100013000150001700019000
I381128667
II261432510440
III142053012930
IV16942014600
V11531017000
VI12318330
Итого (fy = fi)51520301510510012700

По данным таблицы 7.9 наблюдается наличие прямой корреляционной связи между квалификацией работников и их заработной платой.

Графически зависимость между квалификацией и заработком работников предприятия по данным таблицы 7.9 показана на рис. 7.3.

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Аналитические группировки характеризуют только общие черты исследуемой связи между признаками, ее тенденцию, однако не дают количественной оценки силы связи. На основе аналитических группировок и корреляционных таблиц задача оценки тесноты связи между двумя коррелируемыми показателями решается при помощи расчета эмпирического корреляционного отношения, методика расчета которого рассмотрена в п. 5.4 (с. 83).

Уточним формулу 5.20 с учетом обозначений значений признаков, введенных в данной теме.

Эмпирическое корреляционное отношение рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где σ 2 м гр. и σ 2 y – соответственно, межгрупповая и общая дисперсии результативного признака.

Межгрупповая дисперсия результативного признака рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где n – число групп по факторному признаку х;
y j – среднее значение результативного признака по группам;
y – общее среднее значение результативного признака;
fj = fx – частота в i-й группе х.

Общая дисперсия результативного признака рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где m – число групп по результативному признаку у;
yi – индивидуальные значения результативного признака (середины интервалов);
fi = fy – частота в j-й группе у.

Пример расчета эмпирического корреляционного отношения

По данным таблицы 7.9 следует оценить тесноту связи между квалификацией работников предприятием и оплатой их труда.

По формуле 7.7 межгрупповая дисперсия заработной платы работников предприятия равна: 6768.

По формуле 7.8 общая дисперсия заработной платы работников предприятия равна: 8910.

По формуле 7.6 эмпирическое корреляционное отношение равно: 0,87, что свидетельствует о тесной связи между уровнем квалификации работников предприятия и их заработной платой (см. табл. 5.10).

Следует отметить, что η > 0 не является доказательством наличия корреляционной связи между признаками. Отличное от нуля корреляционное отношение может появиться при неправильном распределении исследуемой совокупности на группы.

Эмпирическое корреляционное отношение должно иметь высокий уровень надежности.

Для оценки надежности корреляционных характеристик (т.е. истинности причин отклонений групповых средних от общей средней) используют критерии Фишера (F-критерий) или Стьюдента (t-критерий), разработанные математической статистикой.

Критерий Фишера (FФ) определяется по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где σ 2 м гр. – межгрупповая дисперсия;
σ 2 ост – остаточная (средняя из внутригрупповых) дисперсия;
k1, k2 – степени свободы для межгрупповой и средней из внутригрупповых дисперсий.

Р. Фишер, английский статистик, установил распределение отношений дисперсий и разработал соответствующие математические таблицы (фрагмент такой таблицы приведен в таблице 7.10). В них приводится F-критерий теоретический (Fт) при двух вероятностях 0,95 и 0,99. Если Fф > Fт, то с принятой степенью вероятности можно утверждать о наличии влияния исследуемого фактора на результативный признак. Если же Fф ≤ Fт, можно утверждать, что разница между дисперсиями обусловлена влиянием случайных факторов.

Критические значения F-критерия (уровень значимости α = 0,05)

k2k1
12345681020
1161,4199,5215,7224,6230,2234238,9242248
218,511919,1619,2519,319,3319,3719,3919,44
310,139,559,289,129,018,948,848,788,66
47,716,946,596,396,266,166,045,965,8
56,615,795,415,195,054,954,824,744,56
65,995,144,764,534,394,284,154,063,87
75,594,744,354,123,973,873,733,633,44
85,324,464,073,843,693,583,443,343,15
95,124,263,863,633,483,373,233,132,93
104,964,13,713,483,333,223,072,972,77
114,823,983,593,633,23,092,952,862,65
124,753,884,493,263,1132,852,762,54
144,63,743,343,112,962,852,72,62,39
164,493,633,243,012,852,742,592,492,28
184,413,553,162,932,772,662,512,412,19
204,353,493,12,872,712,62,452,352,12
304,173,322,922,692,532,422,272,161,93
404,083,232,842,612,452,342,182,121,84
6043,152,762,522,372,252,12,041,75
1203,923,072,682,452,292,172,021,91,65

Распределение отношений дисперсий в таблицах Фишера для поиска Fт зависит от степеней свободы k1 и k2. В аналитической группировке они рассчитываются по формулам:

где n – число групп по факторному признаку;
N – число единиц исследуемой совокупности.

К аналогичному выводу можно прийти при оценке надежности корреляционного отношения по критерию Стьюдента, который определяется по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где μη – средняя ошибка корреляционного отношения, рассчитываемая по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Если критерий Стьюдента tη ≥ 3, показатель корреляционного отношения считают вероятным (т.е. связь между исследуемыми явлениями доказана). Если tη 2 м гр. = 6768), по формуле 7.8 – общая дисперсия (σ 2 y = 8910).

На основании правила сложения дисперсий (формула 5.18) найдем остаточную (среднюю их внутригрупповых) дисперсию: σ 2 ост = 8910 – 6768 = 2142.

Анализируемая совокупность включала 100 рабочих, для которых исследовалось наличие связи между их заработком и уровнем квалификации, отсюда N = 100. По уровню квалификации (тарифному разряду) было сформировано 6 групп, т. е. n = 6.

По формуле 7.10 рассчитаем значение степени свободы для межгрупповой дисперсии: k1 = 6 – 1 = 5.

По формуле 7.11 рассчитаем значение степени свободы для средней из внутригрупповых дисперсий: k2 = 100 – 6 = 94.

По формуле 7.9 значение критерия Фишера равно: 59,4.

С вероятностью 0,95 (при k1 = 5 и k2 = 94) F-критерий теоретический равен: Fт ≈ 2,29 (см. табл. 7.10). Так как Fф > Fт, то, с принятой степенью вероятности, можно утверждать о влиянии уровня квалификации работников предприятия на размер их заработной платы, т.е. о наличии связи между рассматриваемыми признаками работников предприятия.

По формуле 7.13 средняя ошибка корреляционного отношения равна: 0,024.

По формуле 7.12 значение критерия Стьюдента равно 36,25. Так как критерий Стьюдента tη ≥ 3, то связь между исследуемыми показателями (признаками) доказана.

Полученные значения критерия Фишера и критерия Стьюдента позволяют считать значение эмпирического корреляционного отношения 0,87 надежным для оценки тесноты связи между уровнем квалификации и заработком работников предприятия по данным таблицы 7.9.

Показатели тесноты связи между двумя атрибутивными признаками

Построение таблиц, в которых дается комбинационное распределение единиц совокупности по двум признакам применимо и к атрибутивным признакам. Взаимосвязи между атрибутивными признаками, их влияние на другие показатели, в том числе и количественные, особенно часто приходится изучать при проведении различных социологических исследований.

Простейшей формой таблицы взаимной сопряженности двух атрибутивных признаков является таблица «четырех полей» (четырехклеточная). В ней по каждому признаку выделяются только две группы, чаще всего по альтернативному принципу («да»-«нет», «хорошо»-«плохо» и т.д.).

Для измерения тесноты связи между двумя атрибутивными признаками, имеющими альтернативное выражение, используется коэффициент ассоциации, рассчитываемый с помощью таблицы взаимной сопряженности, которая состоит из четырех клеток, обозначенных латинскими буквами a, b, c, d. Каждая клетка таблицы соответствует определенной альтернативе того или иного признака, как это показано в таблице 7.11.

Таблица взаимной сопряженности двух атрибутивных признаков

ПризнакАне АΣВ
Вabа + b
не Вcdc + d
ΣАa + cb + da + b + c + d

Коэффициент ассоциации (Касс) определяется по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Его существенный недостаток состоит в том, что если в одной из четырех клеток отсутствует частота (т.е. равна 0), коэффициент ассоциации всегда будет равен по модулю 1, и тем самым будет преувеличена мера действительной связи. Чтобы этого избежать, предложен другой показатель – коэффициент контингенции.

Коэффициент контингенции (Кконт) рассчитывается по формуле

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Коэффициент контингенции всегда меньше коэффициента ассоциации.

Связь считается достаточно значительной и подтвержденной, если |Касс| > 0,5 или |Кконт| >0,3.

Для исследования корреляции атрибутивных альтернативных признаков предложен также коэффициент колигации.

Коэффициент колигации (Ккол) рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Коэффициент колигации, как и коэффициент контингенции, оценивает связь между признаками более сдержанно, чем коэффициент ассоциации, причем всегда: Касс > Ккол > Кконт.

Пример расчета показателей тесноты связи между атрибутивными признаками

По результатам опроса студентов второго курса экономических специальностей, целью которого было выявление связи между курением студентов и курением родителей в их семьях, приведенным в таблице 7.12, необходимо оценить связь между курением родителей и их детей.

Данные, характеризующие число курящих и некурящих студентов в курящих и некурящих семьях, чел.

Семьи, в которыхСтуденты, которыеИтого
не куряткурят
родители не курят167
родители курят819
Итого9716

Полученные значения коэффициентов ассоциации, контингенции и колигации свидетельствуют о наличии тесной связи между курением детей и их родителей. Правда, результаты опроса показали, что дети поступали с точностью «до наоборот»: в курящих семьях дети не курили и наоборот.

В том случае, когда оба взаимосвязанных признака разделены более чем на две группы, для измерения тесноты связи используются показатели взаимного сочетания (сопряжения), предложенные К. Пирсоном и А. Чупровым.

Коэффициент взаимной сопряженности Пирсона (КП) рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и хгде φ 2 – показатель средней квадратической сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки, рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

Коэффициент взаимной сопряженности Чупрова (КЧ) рассчитывается по формуле:

форму связи между признаками у и х. Смотреть фото форму связи между признаками у и х. Смотреть картинку форму связи между признаками у и х. Картинка про форму связи между признаками у и х. Фото форму связи между признаками у и х

где n1 и n2 – соответственно, количество групп в графах и количество групп в строках.

Результат оценки тесноты связи, полученный на основании коэффициента взаимной сопряженности Чупрова, более точен, поскольку он учитывает количество групп по каждому из исследуемых признаков. Его выгодно использовать и при большем разделении единиц совокупности на группы по взаимосвязанным признакам. Коэффициент взаимной сопряженности Пирсона используется в основном в случае квадратной таблицы, тогда как Чупрова – пригоден для измерения связи и в прямоугольных таблицах.

Считается, что уже при значении коэффициентов взаимной сопряженности 0,3 можно говорить о тесной связи между вариацией исследуемых признаков.

Пример расчета коэффициента взаимной сопряженности Чупрова

С помощью коэффициента взаимной сопряженности Чупрова необходимо определить тесноту связи между урожайностью зерновых культур сельскохозяйственных предприятий региона и их организационно-правовой формой по данным таблицы 5.11. Напомним, что рассчитанное в п. 5.4 по данным таблицы 5.11 эмпирическое корреляционное отношение (η = 0,66) характеризует связь между урожайностью зерновых культур сельскохозяйственных предприятий региона и их организационно-правовой формой как достаточно тесную.

Преобразуем таблицу 5.11 в более удобную для расчета коэффициента взаимной сопряженности Чупрова форму (таблица 7.13).

Распределение сельскохозяйственных предприятий региона по их организационноправовой форме и уровню урожайности зерновых культур

Группы предприятийпо урожайности зерновых культур (ц/га)ИтогоСредняя урожайность по группе, ц/га
по организационно-правовой форме хозяйствования15,8- 18,9718,97- 22,1422,14- 25,3125,31- 28,4828,48- 31,6531,65- 34,82
17,420,623,726,930,133,2
Государственные предприятия231622,14
Общества с ограниченной ответственностью148311723,54
Фермерские хозяйства331729,16
Итого34117413024,57

По формуле 7.18 показатель средней квадратической сопряженности равен: φ 2 = 0,693.

По формуле 7.19 коэффициент взаимной сопряженности Чупрова равен: КЧ = 0,263. Так как это значение приближается к 0,3, то можно говорить о наличии достаточно тесной связи между урожайностью зерновых культур и организационно-правовой формой сельскохозяйственных предприятий, что подтверждает ранее сделанные выводы.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *