<<
>>

ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ

Итак, результаты экспериментальных исследований могут быть описаны с помощью определенных статистических показателей. Какие именно показатели могут быть применены в каждом отдельном случае, зависит от типа использованных измерительных шкал.

Прежде чем будут описаны конкретные способы вычислений некоторых статистических показателей, необходимо определить значение ряда используемых при этом понятий.

В первую очередь надо пояснить понятие распределения результатов. Можно себе представить, что большому числу испытуемых было предложено решить некоторое число, например 20, задач. Результаты оценивались в

категориях «решил/ не решил» задачи. Если задачи окажутся трудными для испытуемых, то лишь немногие из них правильно решат все 20 задач, притом что некоторые не решат ни одной задачи. Кроме того, можно ожидать, что большинство испытуемых какое-то количество задач решат правильно и какое-то количество — ошибочно. Первый шаг обработки первичных результатов состоит в подсчете того, сколько испытуемых правильно решили 1 задачу, сколько испытуемых — 2 задачи и т. д. И наконец, сколько лиц правильно решили все 20 задач. Величина, характеризующая количество людей, правильно решивших то или иное число задач, называется частотой ([).

Совокупность полученных частот образует распределение первичных результатов, в нашем случае — распределение числа лиц правильно решивших то или иное количество задач.

При графическом представлении результатов (рис. 1.1.1) и при достаточно большом количестве измерений, т. е. большой выборке (см. ниже), кривая распределения чаще всего имеет характерный колоколообразный вид. Такое распределение первичных результатов получило название нормального, или Гауссова, распределения. Нормальное распределение от других возможных распределений отличается рядом простых свойств. Прежде всего оно однозначно определяется всего лишь двумя параметрами, а именно: средней арифметической величиной (М) и среднеквадратичным отклонением (ст) или дисперсией (И).

Мода (Мо) и медиана (Ме) этого распределения совпадают со значением средней арифметической величины. Кроме того, форма нормального распределения симметрична относительно центра, т. е. местоположения М, Мо и Ме.

Иногда нормальное распределение подвергают операции нормирования, полагая среднеарифметическую величину равной нулю, а среднеквадратичное отклонение равным ±1. Наряду с нормальным распределением результатов эксперимента часто встречаются асимметричные распределения и бимодальные (см. также рис. 1.1.1).

Другое понятие, требующее пояснения, — это понятие выборки. Под выборкой понимается все множество значений изучаемой переменной величины, зарегистрированное в эксперименте. Объем выборки измерений принято обозначать символом N. Поясним сказанное примером. Допустим, что измерение скорости простой сенсомоторной реакции было осуществлено у 10 человек и реакцию каждого из них учитывали только по одному разу. Тогда N=10. Но если раздражитель был предъявлен испытуемым многократно, то объем выборки будет больше: например, при 15 предъявлениях N= 150.

Обработка результатов любого исследования начинается с представления их в удобной для обозрения форме.

Представление результатов распределения дискретных признаков. Для начала рассмотрим один из примеров исследования; допустим, что был проведен опрос 1000 подростков одного возраста (500 юношей и 500 девушек) с целью определения предпочитаемого жанра читаемой ими литературы. Для этого каждому опрашиваемому было предложено выбрать один- единственный жанр из предъявляемого списка десяти жанров. Результаты опроса можно подсчитать и затем табулировать, т. е. представить в виде таблицы (табл. 1.1.1). При этом частоту выбора каждого из жанров (() можно указать как раздельно для юношей и девушек, так и суммарно для тех и других, т. е. для всей выборки испытуемых. В последней строке таблицы необходимо указать сумму частот, что позволяет контролировать правильность подсчета. Результаты данного исследования, т.

е. частоту выбора, часто представляют в виде процентов.

Но необходимо помнить, что перевод частот в проценты не может быть признан целесообразным, если объем выборки невелик. Кроме того, надо помнить, что не рекомендуется приводить в таблице только процентные величины, т. е. необходимо ука- зыватьтакже первичные дан

ные (в данном случае частоту /), на основе которых были рассчитаны проценты или хотя бы суммарные величины изучаемого признака. Для нашего примера величины частот выбора, пересчитанные в проценты, отражены в табл. 1.1.2.

Таблица 1.1.2

Частота выбора (1), выраженная в процентах

Жанр

произведения

Юноши

Девушки

Вся

выборка

абс.

%

абс.

%

абс.

%

А

104

20,8

59

11,8

163

16,3

Б

37

7,4

50

10,0

87

8,7

В

87

17,4

179

35,8

266

26,6

г

19

3,8

27

5,4

46

4,6

Д

41

8,2

3

0,6

44

4,4

Е

8

1,6

29

5,8

37

3,7

Ж

20

4,0

11

2,2

31

3,1

3

145

29,0

82

16,4

227

22,7

И

12

2,4

16

3,2

28

2,8

К

27

5,4

44

8,8

71

7,1

?/:

500

100,0

500

100,0

1000

100,0

Рис.

1.1.2. Столбиковая диаграмма первичных результатов исследования выборки испытуемых (см. табл. 1.1.1). д—к — разные жанры предпочитаемой литературы; состав выборки: 1 — юноши,

2 — девушки, 3 — общее число испытуемых.

Наряду с табулированием часто используется прием графического изображения первичных результатов. При наличии результатов измерения, имеющих вид дискретного распределения (например, результаты опроса или тестирования с помощью ряда личностных методик), наиболее подходящим способом их графического отображения является столбиковая диаграмма (рис. 1.1.2). По оси абсцисс такого графика располагают дискретные значения независимой переменной (в нашем примере это предпочитаемые жанры литературного произведения, обозначаемые буквами алфавита), а по оси ординат — частоту случаев (у нас — частота выбора /) или процент случаев. Столбиковые диаграммы можно использовать для отображения исключительно величин шкал наименований.

Представление результатов распределения непрерывных признаков. Для порядковых и интервальных величин, а также для величин шкалы отношений, т. е. величин непрерывных, принцип табулирования остается таким же, как при составлении таблицдля номинативных дискретных величин. Но при графическом отображении и в случае группировки первичных результатов в классы или разряды обнаруживаются существенные различия. Для начала в качестве примера приведем результаты исследования, иллюстрирующие характер непрерывности изучаемой переменной.

В опыте, в котором участвовали 96 испытуемых, определялся цвет последовательного — как говорят физиологи — образа восприятия насыщенного красного цвета. С этой целью каждый испытуемый в течение одной минуты рассматривал окрашенный в красный цвет образец, а затем переносил взгляд на белый экран. Рядом с ним находится цветовой круг, на котором испытуемый должен выбратьтот цвет, который соответствует цвету возникшего у него последовательного образа. При этом испытуемый не называет цвет, а лишь его номер в цветовом круге.

Цветовой круг нормирован таким образом, что соседние цвета в нем отличаются друг от друга на одинаково замечаемую величину. Следовательно, цветовой круг можно расценивать как интервальную шкалу.

Наряду с этим цветовой круг характеризуется и еще одним свойством.В частности, можно себе представить, что между двумя соседними цветами, например между зеле- новато-голубым и голубовато-зеленым, имеется еще

множество не замечаемых человеческим глазом цветовых переходов. В этом именно смысле цветовой круг представляет собой пример непрерывной переменной. Фактичес- же всегда испытуемые выделяют конечное число цветовых оттенков и поэтому свой выбор останавливают на конкретном номере (или названии) цвета. В рассматриваемом эксперименте испытуемые определяли свой последовательный образ в диапазоне от № 16 — зеленовато-голубой цвет до № 23 — желтовато-зеленый.

Полученные результаты возможно табулировать, что и было сделано в табл. 1.1.3. Как видно, в построении табл. 1.1.1 и 1.1.3 нет принципиального различия. Но различие характера первичных данных, отображенных в обеих таблицах, все же есть, и оно обнаруживается при их графическом изображении (см. рис. 1.1.2 и 1.1.3). В самом деле, рис. 1.1.3 представляет собой уже не столбиковую, а ступенчатую диаграмму, называемую гистограммой. Следует обратить внимание на то, что все участки (столби-

Рис. 1.1.4. Полигон частотного распределения первичных результатов исследования цвета последовательных образов (см. табл. 1.1.3 и рис. 1.1.3).

Таблица 1.1.4

Группировка первичных результатов психологического исследования

Классы

группи

ровки

Г раницы классов

Точные

границы

классов

Центры

классов

(*.)

Первичные

распреде

ления

Частота встречаемости (0

10

55-59

54,5-59,5

57

1

1

9

50-54

49,5-54,5

52

1

1

8

45-49

44,5-49,5

47

111

3

7

40-44

39,5-44,5

42

1111

4

6

35-39

34,5-39,5

37

111111

6

5

30-34

29,5-34,5

32

1111111

7

4

25-29

24,5-29,5

27

111111111111

12

3

20-24

19,5-24,5

22

111111

6

2

15-19

14,5-19,5

17

11111111

8

1

10-14

9,5-14,5

12

11

2

Zf=50

ки) ступенчатой диаграммы расположены вплотную друг к другу (числовые значения переменной X на оси абсцисс гистограммы пишут напротив центральной оси каждого участка).

От гистограммы легко перейти к построению частотного полигона распределения, а от последнего — к кривой распределения. Частотный полигон строят, соединяя прямыми отрезками верхние точки центральных осей всех участков ступенчатой диаграммы (рис. 1.1.4). Если же вершины участков соединить с помощью линий, то получится кривая распределения первичных результатов (рис. 1.1.5). Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.

Группировка первичных результатов. Довольно часто при построении гистограмм на основе первичных данных несколько значений переменной X могут оказаться нулевыми. Для избежания таких перерывов в гистограмме рекомендуется произвести группировку первичных результатов. Под группировкой понимается объединение нескольких значений переменной X в один общий разряд. Существуют точные формулы определения числа разрядов, или классов группировки, и их диапазона, т. е. ширины класса. Однако группировка возможна только при достаточно большом числе экспериментальных данных или наблюдений. В большинстве случаев исходят из следующего эмпирического правила: при числе данных, значительно превышающем 25, целесообразно их группировать не менее чем в 10 и не более чем в 20 классов. При этом в качестве величин, характеризующих ширину класса группировки, используют следующие величины: 1; 2; 3; 5; 10; 20.

Для разъяснения процедуры группировки обратимся к числовому примеру. Допустим, что приведенные ниже числа образуют так называемый массив данных, т. е. характеризуют все правильные ответы испытуемых на не-

25

33

35

37

55

27

40

33

39

28;

34

29

44

36

22

51

29

21

28

29;

33

42

15

36

41

20

25

38

47

32;

15

27

27

33

46

10

16

34

18

14;

46

21

19

26

19

17

24

21

27

16.

Для группировки в этом массиве данных прежде всего необходимо найти в нем максимальное (55) и минимальное (10) числа и на основе их разности определить размах распределения (55-10=45). Вполне очевидно, что для получения не менее чем 10 классов группировки, ширина класса в нашем примере должна быть не меньше 5. Далее необходимо установить границы классов группировки, причем таким образом, чтобы и максимальное (55) и минимальное (10) числа из массива данных попали в нижний и верхний классы. Для этого построим табл. 1.1.4.

Рассмотрим более подробно каждую из граф табл. 1.1.4. В 1-й графе указывают число классов группировки. Классу, содержащему минимальные величины массива первичных данных, присваивают номер 1, последующим — последующие порядковые номера до п классов. Во 2-й графе указывают, каким образом определены классы группировки. А именно: на основе числа 5 как характеристики ширины класса было образовано 10 классов группировки (10-й класс: 59, 58, 57, 56, 55; 9-й класс: 54, 53, 52, 51, 50 и т. д.).

Мы помним, что в данном случае рассматриваем не дискретно, а непрерывно распределенные величины, и поэтому целесообразно ликвидировать возникшую разрывность между ними. В качестве первого шага на этом пути необходимо определить точные границы классов группировки (3-я графа). Исходя из того что величины в интервале между более высоким и более низким классами группировки распределены равномерно, каждая из точных границ классов может быть определена значением средней арифметической величины между верхней границей более низкого класса и нижней границей более высокого класса. В качестве второго шага с целью ликвидации разрывности данных следует рассчитать центральные значения классов X.. Они соответствуют средней арифметической величине между нижней и верхней границами классов и указаны в 4-й графе таблицы. Сравнивая верхнюю границу предшествующего класса группировки с нижней границей последующего класса, можно видеть, что дискретность в ряду исчезла и, следовательно, ряд величин стал непрерывным.

Таким образом, первые графы таблицы служат основанием для группировки первичных результатов. В дальнейшем будет видно, что они совершенно необходимы также для расчета ряда статистических показателей. Характер распределения первичных результатов показан в 5-й графе, а частота встречаемости (/) — в 6-й.

Таблица 1.1.5

Расчет накопленных частот и процентной суммы накопленных частот

Классы

группи

ровки

Точные

границы

классов

Частоты данных (!)

Накопленные

частоты

«сит)

Процентная сумма накопленных частот (%)

10

54,5-59,5

1

50

1,00x100=100

9

49,5-54,5

1

49

0,98x100=98

8

44,5-49,5

3

48

0,96x100=96

7

39,5-44,5

4

45

0,90x100=90

6

34,5-39,5

6

41

0,82x100=82

5

29,5-34,5

7

35

0,70x100=70

4

24,5-29,5

12

28

0,56x100=56

3

19,5-24,5

6

16

0,32x100=32

2

14,5-19,5

8

' 10

0,20x100=20

1

9,5-14,5

2

2

0,04x100=4

В некоторых случаях результаты исследования полезно представить графически, в виде кривой так называемых накопленных частот ({сат), а также в виде процентной суммы этих частот. Чтобы показать, как это делают, обратимся снова к данным табл. 1.1.4 и воспроизведем из нее графы 3-ю и 6-ю в табл. 1.1.5. Из таблицы видно, что величины накопленных частот (4-я графа) получают путем последовательного суммирования (снизу вверх) исходного распределения частот (3-я графа). Процентную сумму накопленных частот получают, разделив значение каждой накопленной частоты на общее число данных (в нашем примере оно было равно 50) и умножив частное на 100. Необходимо при этом помнить, что процентная сумма накопленных частот в каждом классе группировки относится к верхней границе данного класса. Это означает, что ниже, например, гра

ницы 5-го класса находится 35, или 70%, случаев всех наблюдений. Гистограмму и ход кривой накопленных частот, а также суммы накопленных частот можно представить графически (рис. 1.1.6).

На основе описанного только что метода представления первичных результатов — табличного и графического — может быть произведен расчет статистических показателей. Цель этих расчетов в том, чтобы с помощью простых показателей дать математическую оценку результатов эксперимента или наблюдения. Наиболее часто используемыми статистическими показателями распределения являются меры центральной тенденции и меры рассеивания.

Меры центральной тенденции. Среди множества мер центральной тенденции для обработки результатов психологических исследований чаще всего используют среднюю арифметическую величину (М) и медиану (Ме).

В случае небольшого числа первичных результатов и отсутствия предварительной их группировки значение средней арифметической получают путем последовательного суммирования исходных величин (X) с последующим делением этой суммы на общее количество исходных данных (Ы):

м-**.

N

Если массив первичных данных был подвергнут предварительной группировке, то для вычисления средней арифметической величины проделывают следующие операции. Для каждого класса группировки определяют произведение частоты класса ({) на центр группировки класса (X), а затем суммируют эти произведения и полученную величину делят на общее количество исходных данных /V:

М =

N

Так, для примера, приведенного в табл. 1.1.4, мы имеем: 57+52+141+

1480

+ 168+222+224+324+132+136+24=1480 и - =29,60, т. е. М=29,60.

ои

Второй мерой центральной тенденции, особенно для порядковых величин, является медиана. Медиана — это точка на измерительной шкале, выше которой находится точно половина наблюдений и ниже которой — также точно половина наблюдений. В этом определении важно подчеркнуть, что медиана — это точка на шкале, а не отдельное измерение или наблюдение. На примере данных табл. 1.1.4 продемонстрируем этапы вычисления медианы на основе сгруппированных данных.

  1. Находим половину наблюдений в массиве данных т. е. N/2. В нашем примере: 50:2=25,0.
  2. Суммируем частоты, начиная с минимального класса группировки, до

класса, содержащего половину необходимых наблюдений т. е. медиану.

Для нашего примера, в котором N=50, половиной наблюдений будет 25.

Итак, поданным табл. 1.1.4 это: 2+8+6+12=28. Отсюда очевидно, что

медиана предположительно расположена в 4-м классе группировки, точные границы которого 24,5 и 29,5.

  1. Определяем, сколько же наблюдений из класса, содержащего медиану, необходимо для того, чтобы найти ее. Поскольку сумма накопленных частот из предыдущих трех классов равна 16 (см. табл. 1.1.5), то ясно, что из медианного класса необходимо еще 9 наблюдений, а именно 25-16=9.
  2. Вычисляем ту долю интервала на шкале, которая позволит определить точное положение медианы. Если в медианном классе имеем 12 наблюдений и наблюдения в пределах класса распределены равномерно, то при ширине класса, равной 5 единицам, получаем: 9/ 12x5=3,75.
  3. Прибавляем полученный результат к нижней точной границе класса группировки, содержащего медиану: 24,5+3,75=28,25. Это и есть ее значение: Ме=28,25.

Существует аналитическая формула для интерполяции медианы:

\u~Fb

Ме =1+-?—              /,

‘р

где / — нижняя точная граница класса группировки содержащего медиану:

  • сумма частот классов[3] ниже /; / — сумма частот класса, содержащего медиану; N — число наблюдении или измерений; г — ширина класса группировки.

Как видно из нашего примера, когда распределение первичных результатов наблюдений или измерений отличается от нормального, то величины средней арифметической и медианы не совпадают: 29,60*28,25.

Меры изменчивости. В качестве мер изменчивости результатов, характеризующих степень рассеивания отдельных величин вокруг средней арифметической, используются разные меры в зависимости от примененных шкал измерения. Для характеристики рассеивания величин интервальных шкал и шкал отношений пользуются значением среднеквадратичного отклонения (ст). Для величин порядковых шкал используют значения полуквар- ТИЛЬНЫХ отклонений ((?! И (З3).

При несгруппированных данных произведем расчет так называемого стандартного отклонения, обозначаемого 5. Понятие стандартного отклонения (Б) на практике чаще всего используется как синоним среднего квадратичного отклонения (ст). Расчет делается следующим образом:

  1. Рассчитаем среднюю арифметическую величину (М).
  2. Находим отклонение (х) каждого результата измерения (X) от средней арифметической величины: х=Х-М.
  3. Возводим найденное значение отклонения каждого результата от среднего в квадрат: х2.
  4. Суммируем значения квадратов отклонений всех результатов: Ех2.
  5. Делим сумму квадратов отклонений на общее число наблюдений (Ю и получаем величину, называемую дисперсией (О):
  6. Извлекаем корень квадратный из дисперсии и получаем величину, называемую стандартным отклонением (Б), или среднеквадратичное отклонение (ст):
  1. = -Л), или а = л/0.
  2. Таблица 1.1.6

    Расчет дисперсии (О) и стандартного отклонения (5) (при №=10)


X

X

2

X

13

0,2

0,04

17

-3,8

14,44

15

-1,8

3,24

11

2,2

4,84

13

0,2

0,04

11

2,2

4,84

17

-3,8

14,44

13

0,2

0,04

11

2,2

4,84

11

2,2

4,84

?х’= 51,60

Таким образом: 0 = —^—= 5,16 и

  1. = Д[б = 2,27.

Приведем все описанные расчеты для конкретного примера и определим дисперсию и стандартное отклонение для выборки, состоящей из результатов 10 измерений: 13; 17; 15; 11; 13; 11; 17; 13; 11; 11. Для начала рассчитаем среднюю арифметическую величину: она оказывается равна 13,2. Для облегчения дальнейших расчетов составляем табл. 1.1.6. В 1-й графе таблицы записываем первичные данные (X), во 2-й — отклонения их значений от средней арифметической (х) и в 3-й — квадраты отклонений (х2).

При сгруппированных данных формула расчета дисперсии приобретает следующий вид:

ЩХ.-УИ)2

N

где / — частота каждого из классов группировки; X —- центр каждого из классов группировки; М — средняя арифметическая величина, а N — число измерений.

Различают два полуквартильных отклонения — для левой и правой сторон распределения экспериментальных данных. Каждое из полуквартильных отклонений представляет собой величину, соответствующую половине области распределения центральных 50% данных на шкале измерений. Очевидно, что любое распределение экспериментальных данных может быть разделено на четыре равные части, каждая из которых охватывает 25% наблюдений. Если отсчитывать наблюдения, начиная от минимальной величины на измерительной шкале, то точка отделяющая первые 25% наблюдений от остальных, определит границу первого квартиля. Та же самая процедура счета, производимая от максимальной величины, отделяет последний, т. е. четвертый, квартиль; сама же точка на шкале обозначается как (?3. Наконец медиана, согласно ее определению, позволяет идентифицировать второй и третий квартили: точка их разделения на шкале и соответствует медиане. Она получила обозначение С?2. Половина же интервала на измерительной шкале, заключенного между точками и (З3, и есть полуквартильные отклонения. Только в случае нормального, т. е. симметричного, распределения данных точка (?2 совпадает с местоположением медианы. Следовательно, с помощью полуквартильных отклонений можно определять рассеивание экспериментальных данных вокруг медианы.

Обратимся снова к табл. 1.1.4 и расчету мер центральной тенденции. Ранее для приведенных там данных мы рассчитали, что Ме = 28,25, и таким образом определили точку ф2. Теперь нам предстоит найти точки (?, и (?3. В случае нормального, т. е. строго симметричного, распределения данных точки (Э,и lt;?3 можно рассматривать в качестве медиан: ф, — для левого интервала (от начала шкалы измерений до точки (?2), а (?3— для правого интервала (от конца шкалы до той же точки (?2). Поэтому дальнейшие процедуры расчетов значений ф, и С?3 будут аналогичны той, которую мы рассматривали при вычислении медианы. То есть мы имели право воспользоваться приведенной выше аналитической формулой для интерполяции медианы, а именно

¦l-N-Fh ¦

Ме = 1+2—              (.

  1. Прежде всего укажем, что значение (' — ширины класса группировки — нам известно, из задания: (=5 (как для левого интервала, так и для правого).
  2. Что касается N — числа измерений, то согласно определению медианы вообще, а в нашем случае точки (З3 в частности, оно должно быть одинаковым в обоих рассматриваемых интервалах: Ы =Ып=2Ъ при общем числе измерений, равном 50. Отсюда

  1. Анализируя группировку данных, приведенную в табл. 1.1.4, нетрудно заметить, что классом группировки, предположительно содержащим половину наблюдений левого интервала, является 3-й класс, а таким же классом для правого интервала — 6-й класс. Исходя из этого, по табл. 1.1.4 легко определить, что

для левого интервала /=19,5; /7в= 10; / =6; для правого интервала /=39,5; /•‘„=9; /р=6.

  1. Пользуясь найденными значениями величин, производим необходимые расчеты медиан обоих интервалов:

для левого С?| = 19,5+1^ ^-5 = 21,58,

6

12,9-9

для правого С?3 = 39,5              ’-              5 = 36,58.

о

  1. Согласно определению квартильного отклонения следует, что

т. е. в нашем примере lt;2 =

  1. Однако этот результат получен нами для нормального распределения данных. На самом же деле, как показывает табл. 1.1.4, в нашем примере мы имеем дело с явно асимметричным распределением. Поэтому истинные полуквартильные отклонения в данном случае необходимо было рассчитывать с учетом вычисленного значения для медианы (или (?2), а именно, что УИе=28,25. Тогда мы получаем для левого интервала              =28,25-21,58=6,67,

для правого интервала (?3-(?2=36,58-28,25=8,33.

С помощью данного приема можно очень легко определить право- и левостороннюю асимметрию любого распределения:

если              то имела место правосторонняя асимметрия;

если С?3-(2.гlt;С)2-С}г то — левосторонняя.

И только при равенстве указанных разностей можно говорить о строго симметричном распределении.

Для каких целей служат меры центральной тенденции (М или Ме) и меры изменчивости (О, Б, ст, С})} Во-первых, эти меры используются для интерпретации первичных результатов. На основе полученных значений мер центральной тенденции можно, например, предвидеть наиболее вероятные результаты аналогичного исследования другой выборки. На основе же мер изменчивости можно оценить точность проведенных измерений, т. е. выявить случайные ошибки измерения. Во-вторых, та или иная из вышеназванных мер необходима для проверки статистической значимости различий (см. с. 274, Приложение I: /-критерий Стьюдента) между результатами исследо

вания двух разных выборок, а также для вычисления так называемых коэффициентов корреляции, о которых сейчас пойдет речь.

Меры взаимосвязи. Коэффициентами корреляции пользуются для того, чтобы выяснить, существует ли взаимосвязь между двумя переменными, и определить ее степень, т. е. тесноту взаимосвязи. Значение коэффициента корреляции изменяется от -1 до +1. Величины, лежащие в этих пределах, отражают максимально возможную взаимосвязь сравниваемых переменных. Когда коэффициент корреляции равен нулю, то это означает, что взаимосвязь отсутствует. Положительная корреляционная связь указывает на прямо пропорциональное отношение между двумя переменными, а отрицательная — на обратно пропорциональную взаимосвязь. ЧЬм больше абсолютное значение коэффициента корреляции, тем теснее связь между изучаемыми переменными. При значениях коэффициентов ± 1 можно говорить об отношении тождественности между переменными.

При сравнении порядковых величин пользуются коэффициентом ранговой корреляции по Ч. Спирмену (р), при сравнении интервальных величин — коэффициентом корреляции произведений по К. Пирсону (г). Рассмотрим кратко способы расчета этих коэффициентов.

Допустим, что с помощью двух опросников (Л" и У), требующих альтернативных ответов «да» или «нет», были получены первичные результаты — ответы 15 испытуемых (N=15). Результаты представлены в виде сумм баллов за утвердительные ответы («да») для каждого испытуемого отдельно для опросника X и опросника У. Требуется определить, измеряют ли опросники X и У похожие личностные качества испытуемых, или не измеряют. Можно предположить, что если опросники по содержанию и формулировкам мало отличаются друг от друга, то сумма баллов, набранная каждым из испытуемых по опроснику X, будет близка к сумме баллов, набранных по опроснику У.

Полученные в эксперименте первичные результаты представляют собой два ряда порядковых величин для переменной X и для переменной У. Для установления взаимосвязи между каждой парой порядковых величин применяют коэффициент порядковой корреляции Спирмена (р). Для расчета величины р известна следующая формула:

. 61Л2 Р М(М2-1)’

где N — число сравниваемых пар величин двух переменных и ё'2 — квадрат разностей рангов этих величин.

Для вычисления предстоит проделать ряд операций. Прежде всего надлежит табулировать все первичные результаты (табл. 1.1.7). В 1-й графе записывают номер испытуемого, а во 2-й и 3-й — полученные им суммы баллов по первой методике (переменная X) и по второй (переменная У).

Затем каждому первичному результату присваивают ранг. Эта процедура называется ранжированием. Начинают ее с того, что среди всех значений переменной X находят наибольшее и в одной строке с ним, но уже в 4-й графе (/?^) проставляют единицу, что и означает 1-й ранг. В нашем случае мак-

Таблица 1.1.7

Табулирование первичных результатов для расчета коэффициента корреляции по Спирмену (р)

Номер

испытуемого

X

У

с/

с/2

1

47

75

11,0

8,0

3,0

9,00

2

71

79

4,0

6,0

2,0

4,00

3

52

85

9,0

5,0

4,0

16,00

4

48

50

10,0

14,0

4,0

16,00

5

35

49

14,5

15,0

0,5

0,25

6

35

59

14,5

12,0

2,5

6,25

7

41

75

12,5

8,0

4,5

20,25

8

82

91

1,0

3,0

2,0

4,00

9

72

102

3,0

1,0

2,0

4,00

10

56

87

7,0

4,0

3,0

9,00

11

59

70

6,0

10,0

4,0

16,00

12

73

92

2,0

2,0

0,0

0,00

13

60

54

5,0

13,0

8,0

64,00

14

55

75

8,0

8,0

0,0

0,00

15

41

68

12,5

11,0

1,5

2,25

I Ь!= 71,00

, 61й(2 , 6 171 , 1026 ,

Таким образом: р = 1— ,,—- = 1-——— = 1-——- = 1-0,305 = 0,695.

М(Л/2-1) 15-224 3360

симальное число баллов по методике X получил испытуемый № 8, и поэтому именно его результату следует присвоить 1-й ранг. Затем находят второй по величине результат и в его строке указывают соответственно 2-й ранг. В нашем примере необходимо обратить внимание на следующее: испытуемые № 7 и 15 получили по 41 баллу, а испытуемые № 5 и 6 — по 35 баллов. Для таких случаев принято следующее правило: если в ранжируемом ряду встречаются одинаковые величины, то для них находят среднее значение и считают, что оно определяет ранг как одной, так и другой величины. Следовательно, испытуемым № 7 и 15 надо присвоить одинаковый ранг, а именно 12,5, а испытуемым № 5 и 6 — 14,5, поскольку (12+13):2=12,5 и (14+15): 2=14,5. Аналогично осуществляют ранжирование по второй методике, т. е. для переменной У. Заметим, что в данном случае уже трое испытуемых № 1,7 и 14 получили по одинаковому числу баллов — 75. Первичным результатам этих испытуемых должны были бы быть присвоены 7, 8 и 9-й ранги.

Усреднив эти ранги, каждому испытуемому присваивают одинаковый ранг, в данном случае — 8-й.

На следующем этапе табулирования определяют разность рангов для каждой пары значений X и У и полученные результаты проставляют в 6-й графе: й =ЯХ-Яу. Наконец, в 7-й графе отражены значения квадратов разности рангов, т. е. с1'2 для каждой пары X и У. Полученные величины суммируют и записывают в последней строке таблицы: Ей2. Полученную величину (в нашем примере Ей2 = 171) и подставляют в формулу коэффициента ранговой корреляции.

В нашем примере р =0,695. Положительное значение полученного коэффициента позволяет утверждать, что оба опросника — X й У — дают возможность выявлять похожие, но не идентичные личностные свойства.

Коэффициент корреляции по формуле Пирсона рассчитывается на основе отклонения первичных результатов и среднего квадратичного отклонения от их среднеарифметического значения. Формула расчета коэффициента корреляции по К. Пирсону может быть представлена следующим образом:

'Ех-у ХУ Л/сгхсгу

где х — отклонение величины X (первичного результата) от средней арифметической Мх; у — отклонение величины У (первичного результата) от средней арифметической Му; Ех-(/ — алгебраическая сумма произведений отклонений х и у отМхи Му; N — объем выборки сравниваемых пар первичных результатов; ах— среднее квадратичное отклонение для первичных результатов X; аgt;, — среднее квадратичное отклонение для первичных результатов У.

Рассмотрим пример, который позволит проследить этапы расчета. Допустим, что переменная Xпредставлена результатами измерения (в сантиметрах) величины коленного рефлекса при инструкции расслабить мышцы; переменная У — то же, но при инструкции напрячь мышцы (табл. 1.1.8). Проверяется гипотеза о том, что величины коленного рефлекса не взаимосвязаны между собой.

Последовательность расчета коэффициента следующая.

  1. По формулам

х N              N

находим средние арифметические значения для переменных X и У (в нашем примере М= 7,5; М,,=8,0).

  1. Находим величины отклонений каждого из первичных результатов от Мх и Му — соответственно х и у (см. 4-ю и 5-ю графы).
  2. Значение каждого отклонения х и у возводим в квадрат: х2 и у1 (см. 5-ю и 6-ю графы).
  3. Таблица 1.1.8

    Расчет коэффициента корреляции по Пирсону (г)


Номер

пары

измерения

X

У

X

У

2

X

2

У

х.у

1

10

7

+2,5

1

6,25

1

-2,5

2

8

9

+0,5

+ 1

0,25

1

+0,5

3

6

11

-1,5

+3

2,25

9

-4,5

4

6

3

-1,5

-5

2,25

25

+7,5

5

13

11

+5,5

+3

30,25

9

+ 16,5

6

5

7

-1,5

-1

6,25

1

+2,5

7

12

14

+4,5

+6

20,25

36

+27,0

8

10

11

+2,5

+3

6,25

9

+7,5

9

3

6

-4,5

-2

20,25

4

+9,0

10

2

1

-5,5

-7

30,25

49

+38,5

?:

М:

75

7,5

83

8,0

0,0

0,0

124,50

144

+ 102,0

Тх-Ц 102,0 102,0 Таким образом: г„.=              ^ ^^ - —= 0.76.

  1. По формуле для среднего квадратичного отклонения рассчитываем ст^ и ст^ (в нашем примере стх=3,53; 0^=3,79).
  2. Определяем произведения для каждой пары отклонений (см. 8-ю графу).
  3. Полученные величины подставляем в формулу коэффициента корреляции по Пирсону. Полученный для нашего примера коэффициент корреляции гху=0,76 свидетельствует о том, что обе величины коленного рефлекса взаимосвязаны, несмотря на различные условия их измерения.

<< | >>
Источник: В. Д. Балин, В. К. Гайда, В. К. Гербачевский и др.. Практикум по общей, экспериментальной и прикладной психологии / Под общей ред. А. А. Крылова, С. А. Маничева. — 2-е изд., доп. и перераб. — СПб.: Питер. — 560 с.: ил. — (Серия «Практикум по психологии»). 2003

Еще по теме ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ:

  1. 2.3. Итоги опытно-экспериментальной работы
  2. Этапы социально-психологического исследования.
  3. I. ПРИЕМЫ ИЗМЕРЕНИЙ И СТАТИСТИЧЕСКИЕ СПОСОБЫ ОБРАБОТКИ ИХ РЕЗУЛЬТАТОВ В ПСИХОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ
  4. ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАЛЬНОГО ИССЛЕДОВАНИЯ
  5. Занятие 5.6 ИССЛЕДОВАНИЕ НЕПОСРЕДСТВЕННОГО И ОПОСРЕДСТВОВАННОГО ЗАПОМИНАНИЯ
  6. Диагностические исследования почерка в зарубежной криминалистике и медицине
  7. 2.2. Принципы патопсихологического экспериментального исследования
  8. 2.4.2. Проведение экспериментального исследования
  9. ИССЛЕДОВАНИЕ ПРОБЛЕМЫ БИОГЕОХИМИЧЕСКИХ ЦИКЛОВ НА ГЕОГРАФИЧЕСКОМ ФАКУЛЬТЕТЕ В МГУ М.А. Глазовская
  10. Методы научного исследования
  11. История исследований парапсихических явлений
  12. Методы и приёмы эмпирического исследования
  13. Результаты опытно-экспериментальной работы
  14. Анализ и оценка результатов экспериментальной работы
  15. 2.5. Результаты экспериментального исследования
  16. Анализ результатов экспериментальной работы по формированию у курсантов вузов МВД РФ готовности к использованию реабилитационной физической культуры в профессиональной деятельности
- Коучинг - Методики преподавания - Андрагогика - Внеучебная деятельность - Военная психология - Воспитательный процесс - Деловое общение - Детский аутизм - Детско-родительские отношения - Дошкольная педагогика - Зоопсихология - История психологии - Клиническая психология - Коррекционная педагогика - Логопедия - Медиапсихология‎ - Методология современного образовательного процесса - Начальное образование - Нейро-лингвистическое программирование (НЛП) - Образование, воспитание и развитие детей - Олигофренопедагогика - Олигофренопсихология - Организационное поведение - Основы исследовательской деятельности - Основы педагогики - Основы педагогического мастерства - Основы психологии - Парапсихология - Педагогика - Педагогика высшей школы - Педагогическая психология - Политическая психология‎ - Практическая психология - Пренатальная и перинатальная педагогика - Психологическая диагностика - Психологическая коррекция - Психологические тренинги - Психологическое исследование личности - Психологическое консультирование - Психология влияния и манипулирования - Психология девиантного поведения - Психология общения - Психология труда - Психотерапия - Работа с родителями - Самосовершенствование - Системы образования - Современные образовательные технологии - Социальная психология - Социальная работа - Специальная педагогика - Специальная психология - Сравнительная педагогика - Теория и методика профессионального образования - Технология социальной работы - Трансперсональная психология - Философия образования - Экологическая психология - Экстремальная психология - Этническая психология -