Реферат. Ергалиева С. 346ОМ


АО « Медицинский Университет Астана»

Кафедра « Физики, информатики с курсом биостатистики»

СРС

На тему: Ранговая корреляция. Коэффициент ранговой корреляции.

Выполнила: Ергалиева Самал 346 ОМ

Проверила: Оспанова Галия Карталовна

Астана 2014

План:

Введение

Правила выполнения ранжирования

Метод ранговой корреляции (Спирмена rs). Область применения.

Ограничения метода, его достоинства и недостатки.

Графическое представление метода ранговой корреляции.

Алгоритм расчета коэффициента ранговой корреляции.

Заключение

Список литературы

1.Введение

Исследуя природу, общество, экономику, психологию необходимо считаться с взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно-следственных связей между ними.

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Функциональная связь достаточно часто проявляется в физике, химии. В экономике примером такой зависимости может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь (которую так же называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтённые случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределённые в некотором интервале значения функции.

Например, некоторое увеличение аргумента повлечёт за собой лишь среднее увеличение (или уменьшение) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего значения. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесённых удобрений. Очевидно, что удобрения участвуют в формировании урожая. Но для каждого конкретного поля одно и тоже количество внесённых удобрений, вызовет разный прирост урожайности. Так как во взаимодействии находится ещё целый ряд факторов (погода, состояние почвы и другие факторы), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесённых удобрений, ведёт к росту урожайности.

2. Правила выполнения ранжирования данных

К наиболее часто встречаемым методам субъективного измерения относят ранжирование, парное сравнение, непосредственную оценку и последовательное сравнение.

Ранжирование – наиболее простой метод измерения в порядковой шкале. Однако, если объектов сравнения больше 15, то построение ранжировки представляет для человека достаточно сложную задачу.

Парное сравнение – это такое измерение в порядковой шкале; в результате получается множество матриц, которые требуют дальнейшей обработки для полного упорядочивания.

Непосредственная оценка – это приписывание объектам числовых значений в шкале интервалов или отношений. Измерение является достаточно точным при наличии полной информации у субъекта управления или экспертов. Однако это встречается редко и в таком случае пользуются балльной оценкой, когда измерение производится с точностью до определенного отрезка числовой оси.

Последовательное сравнение представляет собой комплексную процедуру измерения, включающую ранжирование и непосредственную оценку. Это самый трудоемкий тип оценок.

Рассмотрим правила ранжирования данных в простых случаях.

Ранжирование данных может производиться по возрастанию или убыванию выделенного признака. Для этого в исходных данных производится упорядочение данных по выделенному признаку в порядке возрастания или убывания. В случае, когда рассматриваются данные качественного признака, то в этом случае предварительно, качественному признаку приписывается некий балл (ранг) и, после этой процедуры производят ранжирование исходных данных по качественному признаку. Например, такая процедура проводится при расчёте коэффициента корреляции рангов Спирмэна.

Метод ранговой корреляции (Спирмена rs). Область применения.

Метод ранговой корреляции Спирмена позволяет определить силу и направление корреляционной связи между двумя признаками или двумя иерархиями признаков.

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами могут быть:

Два признака, измеренные в одной и той же группе переменных (наиболее часто в этом качестве выступает группа людей, которых принято тогда именовать испытуемыми или респондентами. Естественно, под переменными подразумеваются не сами люди, а данные ими ответы на те или иные вопросы.)

Б) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (скажем, по ответам на пункты анкеты или теста).

В) Две групповые иерархии признаков (например, соответствие каких-либо выборов, сделанных одной группой людей выборам другой группы).

Г) Индивидуальная и групповая иерархии признаков (например, сопоставление индивидуальной иерархии жизненных ценностей сотрудника усредненному мнению группы на этот же счет; сопоставление последовательности товаров, которые приобрели бы (в среднем) жители города А и города Б при условии получения премии, на которую заранее не рассчитывали.)

Методика расчета коэффициента корреляции рангов Спирмэна.Теснота связи, как между количественными, так и между качественными признаками, при условии, что значения этих признаков могут быть проранжированы по степени убывания или возрастания, оценивается коэффициентом корреляции рангов Спирмэна:,где разность между величинами рангов признака-фактора и результативного признака; число наблюдаемых единиц (объём выборочной совокупности).Коэффициент корреляции рангов Спирмэна изменяется в пределах от -1 до +1.Ранговый коэффициент обычно исчисляется на основе небольшого объёма исходной информации, поэтому необходимо выполнить проверку его существенности (значимости). В приложении 1 приводится таблица предельных значений коэффициента корреляции рангов Спирмэна при условии верности нулевой гипотезы об отсутствии корреляционной связи при заданном уровне значимости и определённом объёме выборочной совокупности (выборочных данные).Если полученное значение по модулю превышает критическую величину при данном уровне значимости, то нулевая гипотеза может быть отвергнута, то есть, величина не является результатом случайных совпадений рангов. То есть, если,то нулевая гипотеза отвергается при данном уровне значимости и числе степеней свободы , количество наблюдений. Это условие можно записать следующим образом:.Прямая трактовка коэффициента корреляции рангов Спирмэна состоит в том, что если , то связь между изучаемыми признаками отсутствует. Если величина положительная правильная дробь, то есть, , то между изучаемыми признаками имеется прямая связь. Если величина отрицательная правильная дробь, то есть, , то между изучаемыми признаками имеется обратная связь.

Пример 1Пусть в процессе системного анализа нам пришлось учитывать некоторую величину U, измерение которой возможно лишь по порядковой шкале (Ord).  Например, нам приходится учитывать 10 целей функционирования системы и требуется выяснить их относительную значимость,  удельные веса.Если имеется группа лиц, компетентность которых в данной области не вызывает сомнений, то можно опросить каждого из экспертов,  предложив им расположить цели по важности или “проранжировать” их. В простейшем случае можно не разрешать повторять ранги, хотя это не обязательно — повторение рангов всегда можно учесть.Результаты экспертной оценки в нашем примере представим таблицей рангов целей:Таблица  1

 Эксперты

  1

   2

   3

   4

   5

   6

   7

   8

   9

  10

 Сумма

   A

  3

   5

   1

   8

   7

  10

   9

   2

   4

  6

     55

    B

   5

   1

   2

   6

   8

   9

  10

   3

   4

  7

     55

 Сумма рангов

   8

   6

   3

  14

  15

 19

 19

   5

   8

  13

 

Суммарный ранг

 4.5

   3

   1

   7

   8

 9.5

 9.5

   2

 4.5

   6

     55

Итак, для  каждой из целей Ti мы можем найти сумму рангов, определенных экспертами, и затем суммарный или результирующий ранг цели Ri. Если суммы рангов совпадают — назначается среднее значение.                  Метод ранговой корреляции позволяет ответить на вопрос — насколько коррелированны, неслучайны ранжировки каждого из двух экспертов, а значит — насколько можно доверять результирующим рангам?  Как обычно, выдвигается основная гипотеза — об отсутствии  связи между ранжировками и устанавливается вероятность   справедливости этой гипотезы. Для  этого  можно использовать два подхода: определение коэффициентов ранговой корреляции Спирмэна или Кендэлла.Более простым в реализации является первый — вычисляется значение коэффициента  СпирмэнаRs=1-                                                                                      где  di  определяются разностями рангов первой и второй ранжировок по n объектов в каждой.В нашем примере сумма квадратов разностей рангов составляет 30, а коэффициент корреляции Спирмэна около 0.8, что дает значение вероятности гипотезы о полной независимости двух ранжировок всего лишь 0.004.При необходимости можно воспользоваться услугами группы из m экспертов, установить результирующие ранги целей, но тогда возникнет вопрос о согласованности мнений этих экспертов или конкордации.Пусть у нас имеются ранжировки 4 экспертов по отношению к 6 факторам, которые определяют эффективность некоторой системы.Таблица 2

 Факторы —>  Эксперты

    1

    2

    3

    4

    5

    6

Сумма

            A

     5

    4

    1

    6

    3

    2

 21

            B

     2

    3

    1

    5

    6

    4

21

            C

     4

    1

    6

    3

    2

    5

 21

            D

     4

    3

    2

    3

    2

    5



21

 Сумма   рангов    Сум. ранг

    15     4

  11  2

  10  1

   19   6

   12    3

   17    5

84

 Отклонение суммы      от среднего

   +1    1

  -3    9

  -4   16

  +5   25

   -2    4

  +3    9

 064

 Заметим, что полная сумма рангов составляет 84, что дает  в среднем по 14  на фактор.Для общего случая n факторов и  m  экспертов среднее значение суммы рангов для любого фактора определится выражениемD=                                                                           Теперь можно оценить степень согласованности мнений экспертов по отношению к шести факторам.  Для каждого из факторов наблюдается отклонение суммы рангов, указанных экспертами, от среднего значения такой суммы. Поскольку сумма этих отклонений всегда равна нулю, для  их усреднения разумно использовать квадраты значений.В нашем случае сумма таких квадратов составит  S= 64, а в общем случае эта сумма будет наибольшей только при полном совпадении мнений всех экспертов по отношению ко всем факторам:Smax=                                                                                                                                    М. Кэндэллом предложен показатель согласованности или коэффициент конкордации, определяемый как                                                                                                                                  В нашем примере значение коэффициента конкордации составляет около  0.229, что при четырех экспертах и шести факторах достаточно, чтобы с вероятностью не более 0.05 считать мнения экспертов несогласованными. Дело в том, что как раз случайность ранжировок, их некоррелированность просчитывается достаточно просто. Так для нашего примера указанная вероятность соответствует сумме квадратов отклонений S= 143.3 , что намного больше 64.В заключение вопроса об особенностях метода экспертных оценок в системном анализе отметим еще два обстоятельства.В первом примере мы получили результирующие ранги 10 целей функционирования некоторой системы. Как воспользоваться этой результируюзей ранжировкой? Как перейти от ранговой (Ord) шкалы целей к шкале весовых коэффициентов  — в диапазоне от 0 до 1?Здесь обычно используются элементарные приемы нормирования. Если цель 3 имеет ранг 1,  цель 8 имеет ранг 2  и т. д.,  а сумма рангов составляет 55, то весовой коэффициент для цели 3 будет наибольшим и сумма  весов  всех 10 целей составит 1. Вес цели    придется определять как (11-1) / 55  для 3 цели;(11-2) / 55  для 8 цели и т. д. При использовании групповой экспертной оценки можно не только выяснять мнение экспертов о показателях, необходимых для системного анализа. Очень часто в подобных ситуациях используют так называемый метод Дельфы (от легенды о дельфийском оракуле).Опрос экспертов проводят в несколько этапов, как правило — анонимно. После очередного этапа от эксперта требуется не просто ранжировка, но и ее обоснование. Эти обоснования сообщаются всем экспертам перед очередным этапом без указания авторов обоснований.Имеющийся опыт свидетельствует о возможностях существенно повысить  представительность,  обоснованность и,  главное, достоверность суждений экспертов. В качестве “побочного эффекта”  можно составить мнение о профессиональности каждого эксперта.

Пример 2(случай не повторяющихся рангов)Для примера рассмотрим зависимость между успеваемостью студентов ВУЗа по естественным и гуманитарным наукам. Таблица 3

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарным,

Иванов А.

5

7

Петров В.

4

4

Семёнова И.

8

1

Комков А.

2

10

Шулейкин Е.

10

2

Краснов П.

1

3

Белкин С.

9

6

Кандыба Н.

3

8

Марченко А.

7

9

Якупов Ф.

6

5

В таблице 5 дана оценка успеваемости каждого студента в группе. То есть, каждому студенту приписан ранг от 1 до 10. Ранжируем исходные данные по признаку успеваемость студента по естественным дисциплинамТаблица 4. Расчёты.

Студенты

Ранги успеваемости по наукам

естественные,

гуманитарные,

Краснов П.

1



Страницы: 1 | 2 | Весь текст


Предыдущий:

Следующий: