Видове корелационни коефициенти

от Администрация и управление
Направо към: навигация, търсене
a scheme of correlation coefficients.
Схема на корелационните коефициенти.

Логиката на корелационните коефициенти може да бъде пояснена и по друг начин. Значенията на зависимата променлива (Y) варират под влияние на различни фактори. Една част от тяхното разсейване се обяснява с влиянието на независимата променлива (Х), а останалата – с влиянието на други фактори. Колкото по-силна е зависимостта между променливите – толкова по-голяма част от дисперсията на стойностите на Y се дължи на влиянието на  Х, а съответно по-малка – на неизследваните фактори.

Коефициент на детерминация

Коефициентът на детерминация (r2), който е равен на квадрата на коефициента на корелация, описва т. нар. обяснена дисперсия. Той показва каква част от вариацията на Y се дължи на различията в стойностите на Х, т.е. на влиянието на изучавания фактор. Ако се умножи по 100, изразява  силата на влияние на зависимата променлива в  проценти.

Коефициент на неопределеност

Коефициентът на неопределеност  (k2) описва влиянието на невключените в изследването фактори, на които се дължи т. нар. необяснена дисперсия. Стойността му се получава, като от общата дисперсия на променливата Y, изразена като единица (100%), се извади обяснената с помощта на коефициента на детерминация (r2). С други думи k2 = 1 - r2. Очевидно е, че колкото по-силна е зависимостта между променливите величини, толкова обяснената дисперсия е по-голяма, а необяснената – по-малка.

В зависимост от вида и формата на зависимостта, както и от начина на скалиране на променливите величини, в практиката се използват различни коефициенти на корелация. На фигурата е направен преглед на най-често използваните коефициенти.

Коефициент на Пирсън

Коефициент на обикновена линейна корелация на Пирсън (r) - той се прилага се прилага в случай, че зависимостта е:

  • обикновена по вид, т.е. изследва се връзката между две променливи величини.
  • линейна по форма, т. е. предварителната проверка е доказала линейния характер на връзката между променливите.
  • признаците Х и Y са представени в пропорционална или интервална скала. 

Стойността на коефициента на  Пирсън (r) се изчислява по следната формула, където: Р – момент на произведенията; SX – стандартно отклонение на променливата Х; SY – стандартно отклонение на променливата Y

R.jpg

Моментът на произведенията (Р) се изчислява по формула, където: SХ – сумата на стойностите на Х; SY – сумата на стойностите на Y; SXY – сумата на произведенията на Х и Y:

P.jpg

Коефициент на Спирман

Коефициент на рангова корелация на Спирман  (rS) - използването на този коефициент е коректно, когато:

  • двете променливи са рангово скалирани признаци.
  • едната променлива е рангова, а другата количествена. В такъв случай предварително е необходимо количествената променлива да бъде трансформирана в рангова скала. 

Коефициентът на рангова корелация на Спирмън има голямо приложение в спортните игри, тъй като там спортния резултат е рангово скалиран. Стойността  на коефициента се изчислява по формулата, където: d – разлика в ранговите номера по Х и Y; n – обем на извадката:

Rs.jpg

Статистическа  значимост на коефициентите на корелация - При статистически проучвания изследователят се интересува от проявлението на зависимостите между явленията. Информацията, с която разполага, обикновено се базира на данни от извадка, а това означава, че стойността на коефициента на корелация  може да бъде повлияна от случайни фактори. Поради това се налага проверка на хипотезата за статистическата значимост на корелационния коефициент. Нулевата хипотеза гласи, че зависимост между изучаваните явления обективно не съществува, т.е. r=0, следователно емпиричният коефициент може да се счита за случаен. В случай, че стойността на изчисления по данни от извадката коефициент на корелация е по-малък от критичната стойност, за вярна се приема нулевата хипотеза, която твърди, че няма зависимост между променливите величини.

Вижте още

Източници

  • Riccardo Rebonato - Volatility and Correlation
  • A. D. McNaught and A. Wilkinson - Compendium of Chemical Terminology, 2nd ed. (the "Gold Book"); Blackwell Scientific Publications, Oxford (1997)
  • Peter Y Chen (Colorado State University) and Paula M Popovich (Ohio University) - Correlation Parametric and Nonparametric Measures; 104 pages SAGE Publications, Inc © 2002
  • Philip Bobko - Correlation And Regression: Applications For Industrial Organizational Psychology And Management (Hardcover)
  • B.V.K. Vijaya Kumar, (Carnegie Mellon University); and Abhijit Mahalanobis, (Lockheed Martin);and Richard Juday - Correlation Pattern Recognition

Външни препратки