Моделювання кореляційних залежностей

Регресійні математичні моделі будуються в тих випадках, коли відомо, що залежність між двома факторами існує і потрібно отримати її математичний опис. А зараз ми розглянемо завдання іншого роду. Нехай важливою характеристикою деякої складної системи є фактор А. На нього можуть впливати одночасно багато інших факторів: В, С, Du т. Д. Ми розглянемо два типи завдань:
1) визначити, чи робить фактор В якесь помітне регулярне вплив на фактор А?
2) які з факторів В, С, D і т. Д. Мають найбільший вплив на фактор А?
Як приклад складної системи будемо розглядати школу. Нехай для першого типу завдань фактором А є середня успішність учнів школи, фактором В – фінансові витрати школи на господарські потреби: ремонт будівлі, оновлення меблів, естетичне оформлення приміщення і т. П. Тут вплив фактора В на фактор А не очевидно. Напевно, набагато сильніше на успішність впливають інші причини: рівень кваліфікації вчителів, контингент учнів, рівень технічних засобів навчання та ін.
Фахівці за статистикою знають, що для того, щоб виявити залежність від якогось певного фактора, потрібно максимально виключити вплив інших факторів. Простіше кажучи, збираючи інформацію з різних шкіл, потрібно вибирати такі школи, в яких приблизно однаковий контингент учнів, кваліфікація вчителів і ін., Але господарські витрати різні (у одних шкіл можуть бути багаті спонсори, у інших – ні).
Отже, нехай господарські витрати школи виражаються кількістю рублів, віднесених до числа учнів у школі (руб. / Чол.), Витрачених за певний період часу (наприклад, за останні 5 років). Успішність ж нехай оцінюється середнім балом учнів школи за результатами закінчення останнього навчального року. Ще раз звертаємо вашу увагу на те, що в статистичних розрахунках зазвичай використовуються відносні і усереднені величини.

Значення обох величин: фінансових витрат і успішності учнів – мають значний розкид і, на перший погляд, взаємозв’язки між ними не видно. Однак вона цілком може існувати.
Залежності між величинами, кожна з яких піддається не контрольованому повністю розкиду, називаються кореляційними залежностями.
Розділ математичної статистики, який досліджує такі залежності, називається кореляційним аналізом. Кореляційний аналіз вивчає усереднений закон поведінки кожної з величин в залежності від значень іншої величини, а також міру такої залежності.
Оцінку кореляції величин починають з висловлювання гіпотези про можливий характер залежності між їх значеннями. Найчастіше допускають наявність лінійної залежності. У такому випадку заходом кореляційної залежності є величина, яка називається коефіцієнтом кореляції. Як і раніше, ми не будемо писати формули, за якими цей коефіцієнт обчислюється; їх написати неважко, набагато важче зрозуміти, чому вони саме такі. На даному етапі досить знати наступне:
– Коефіцієнт кореляції (звичайно позначається грецькою буквою р) є число з діапазону від -1 до +1;
– Якщо це число по модулю близько до 1, то має місце сильна кореляція, якщо до 0, то слабка;
– Близькість р до +1 означає, що зростанню значень одного набору відповідає зростання значень іншого набору, близькість до -1 означає, що зростанню значень одного набору відповідає спадання значень іншого набору;
– Значення р легко знайти за допомогою Excel, так як в цю програму вбудовані відповідні формули.
В Excel функція обчислення коефіцієнта кореляції називається КОРРЕЛ і входить до групи статистичних функцій. Покажемо, як нею скористатися. На тому ж аркуші Excel, де знаходиться таблиця, представлена ​​на рис. 6.6, треба встановити курсор на будь-яку вільну осередок і запустити функцію КОРРЕЛ. Вона запросить два діапазони значень. Вкажемо, відповідно, В2: В21 і С2: С21. Після їх введення буде виведений відповідь: р = 0,500273843. Ця величина говорить про середній рівень кореляції.
Наявність залежності між господарськими витратами школи та успішністю неважко зрозуміти. Учні із задоволенням ходять в чисту, красиву, затишну школу, відчувають там себе, як вдома, і тому краще вчаться.
У наступному прикладі проводиться дослідження за визначенням залежності успішності учнів старших класів від двох факторів: забезпеченості шкільної бібліотеки підручниками та оснащення школи комп’ютерами. І та, й інша характеристика кількісно виражається у відсотках від норми. Нормою забезпеченості підручниками є їх повний комплект, т. Е. Така кількість, коли кожному учневі видаються з бібліотеки всі потрібні йому для навчання книги. Нормою оснащення комп’ютерами вважатимемо таку їх кількість, при якому на кожних чотирьох старшокласників у школі припадає один комп’ютер. Передбачається, що комп’ютерами учні користуються не тільки на інформатиці, але й на інших уроках, а також в позаурочний час.


1 Star2 Stars3 Stars4 Stars5 Stars (2 votes, average: 4.50 out of 5)

Моделювання кореляційних залежностей