Зависимость между переменными величинами X и У может быть описана разными способами. В частности, любую форму связи можно выразить уравнением общего вида у= f(х), где у рассматривают в качестве зависимой переменной, или функции от другой - независимой переменной величины х, называемой аргументом . Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д. Изменение функции в зависимости от изменений одного или нескольких аргументов называется регрессией .
Термин «регрессия» (от лат. regressio - движение назад) ввел Ф. Гальтон, изучавший наследование количественных признаков. Он обнаружил. что потомство высокорослых и низкорослых родителей возвращается (регрессирует) на 1/3 в сторону среднего уровня этого признака в данной популяции. С дальнейшем развитием науки, этот термин утратил свое буквальное значение и стал применяться для обозначения и корреляционной зависимости между переменными величинами Y и X.
Различных форм и видов корреляционных связей много. Задача исследователя сводится к тому, чтобы в каждом конкретном случае выявить форму связи и выразить ее соответствующим корреляционным уравнением, что позволяет предвидеть возможные изменения одного признака Y на основании известных изменений другого X, связанного с первым корреляционно.
Уравнение параболы второго рода
Иногда связи, между переменными Y и X можно выразить через формулу параболы
Где a,b,c - неизвестные коэффициенты которые и надо найти, при известных измерениях Y и X
Можно решать матричным способом, но есть уже рассчитанные формулы, которыми мы и воспользуемся
N - число членов ряда регресии
Y - значения переменной Y
X - значения переменной X
Если вы будете пользоваться этим ботом через XMPP клиента, то синаксис такой
regress ряд X;ряд Y;2
Где 2 - показывает что регрессию рассчитываем как нелинейную в виде параболы второго порядка
Что ж, пора проверить наши расчеты.
Итак есть таблица
X | Y |
---|---|
1 | 18.2 |
2 | 20.1 |
3 | 23.4 |
4 | 24.6 |
5 | 25.6 |
6 | 25.9 |
7 | 23.6 |
8 | 22.7 |
9 | 19.2 |
Регрессионный и корреляционный анализ – статистические методы исследования. Это наиболее распространенные способы показать зависимость какого-либо параметра от одной или нескольких независимых переменных.
Ниже на конкретных практических примерах рассмотрим эти два очень популярные в среде экономистов анализа. А также приведем пример получения результатов при их объединении.
Регрессионный анализ в Excel
Показывает влияние одних значений (самостоятельных, независимых) на зависимую переменную. К примеру, как зависит количество экономически активного населения от числа предприятий, величины заработной платы и др. параметров. Или: как влияют иностранные инвестиции, цены на энергоресурсы и др. на уровень ВВП.
Результат анализа позволяет выделять приоритеты. И основываясь на главных факторах, прогнозировать, планировать развитие приоритетных направлений, принимать управленческие решения.
Регрессия бывает:
- линейной (у = а + bx);
- параболической (y = a + bx + cx 2);
- экспоненциальной (y = a * exp(bx));
- степенной (y = a*x^b);
- гиперболической (y = b/x + a);
- логарифмической (y = b * 1n(x) + a);
- показательной (y = a * b^x).
Рассмотрим на примере построение регрессионной модели в Excel и интерпретацию результатов. Возьмем линейный тип регрессии.
Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.
Модель линейной регрессии имеет следующий вид:
У = а 0 + а 1 х 1 +…+а к х к.
Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.
В нашем примере в качестве У выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).
В Excel существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии. Но быстрее это сделает надстройка «Пакет анализа».
Активируем мощный аналитический инструмент:
После активации надстройка будет доступна на вкладке «Данные».
Теперь займемся непосредственно регрессионным анализом.
В первую очередь обращаем внимание на R-квадрат и коэффициенты.
R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».
Коэффициент 64,1428 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.
Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.
Корреляционный анализ в Excel
Корреляционный анализ помогает установить, есть ли между показателями в одной или двух выборках связь. Например, между временем работы станка и стоимостью ремонта, ценой техники и продолжительностью эксплуатации, ростом и весом детей и т.д.
Если связь имеется, то влечет ли увеличение одного параметра повышение (положительная корреляция) либо уменьшение (отрицательная) другого. Корреляционный анализ помогает аналитику определиться, можно ли по величине одного показателя предсказать возможное значение другого.
Коэффициент корреляции обозначается r. Варьируется в пределах от +1 до -1. Классификация корреляционных связей для разных сфер будет отличаться. При значении коэффициента 0 линейной зависимости между выборками не существует.
Рассмотрим, как с помощью средств Excel найти коэффициент корреляции.
Для нахождения парных коэффициентов применяется функция КОРРЕЛ.
Задача: Определить, есть ли взаимосвязь между временем работы токарного станка и стоимостью его обслуживания.
Ставим курсор в любую ячейку и нажимаем кнопку fx.
- В категории «Статистические» выбираем функцию КОРРЕЛ.
- Аргумент «Массив 1» - первый диапазон значений – время работы станка: А2:А14.
- Аргумент «Массив 2» - второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.
Чтобы определить тип связи, нужно посмотреть абсолютное число коэффициента (для каждой сферы деятельности есть своя шкала).
Для корреляционного анализа нескольких параметров (более 2) удобнее применять «Анализ данных» (надстройка «Пакет анализа»). В списке нужно выбрать корреляцию и обозначить массив. Все.
Полученные коэффициенты отобразятся в корреляционной матрице. Наподобие такой:
Корреляционно-регрессионный анализ
На практике эти две методики часто применяются вместе.
Пример:
Теперь стали видны и данные регрессионного анализа.
Имеются следующие данные разных стран об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у).
Индекс розничных цен на продукты питания (х) | Индекс промышленного производства (у) | |
---|---|---|
1 | 100 | 70 |
2 | 105 | 79 |
3 | 108 | 85 |
4 | 113 | 84 |
5 | 118 | 85 |
6 | 118 | 85 |
7 | 110 | 96 |
8 | 115 | 99 |
9 | 119 | 100 |
10 | 118 | 98 |
11 | 120 | 99 |
12 | 124 | 102 |
13 | 129 | 105 |
14 | 132 | 112 |
Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
А) линейной;
Б) степенной;
В) равносторонней гиперболы.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз значения индекса промышленного производства у при прогнозном значении индекса розничных цен на продукты питания х=138.
Решение:
1. Для расчёта параметров линейной регрессии
Решаем систему нормальных уравнений относительно a и b:
Построим таблицу расчётных данных, как показано в таблице 1.
Таблица 1 Расчетные данные для оценки линейной регрессии
№ п/п | х | у | ху | x 2 | y 2 | ||
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 7000 | 10000 | 4900 | 74,26340 | 0,060906 |
2 | 105 | 79 | 8295 | 11025 | 6241 | 79,92527 | 0,011712 |
3 | 108 | 85 | 9180 | 11664 | 7225 | 83,32238 | 0,019737 |
4 | 113 | 84 | 9492 | 12769 | 7056 | 88,98425 | 0,059336 |
5 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
6 | 118 | 85 | 10030 | 13924 | 7225 | 94,64611 | 0,113484 |
7 | 110 | 96 | 10560 | 12100 | 9216 | 85,58713 | 0,108467 |
8 | 115 | 99 | 11385 | 13225 | 9801 | 91,24900 | 0,078293 |
9 | 119 | 100 | 11900 | 14161 | 10000 | 95,77849 | 0,042215 |
10 | 118 | 98 | 11564 | 13924 | 9604 | 94,64611 | 0,034223 |
11 | 120 | 99 | 11880 | 14400 | 9801 | 96,91086 | 0,021102 |
12 | 124 | 102 | 12648 | 15376 | 10404 | 101,4404 | 0,005487 |
13 | 129 | 105 | 13545 | 16641 | 11025 | 107,1022 | 0,020021 |
14 | 132 | 112 | 14784 | 17424 | 12544 | 110,4993 | 0,013399 |
Итого: | 1629 | 1299 | 152293 | 190557 | 122267 | 1299,001 | 0,701866 |
Среднее значение: | 116,3571 | 92,78571 | 10878,07 | 13611,21 | 8733,357 | х | х |
8,4988 | 11,1431 | х | х | х | х | х | |
72,23 | 124,17 | х | х | х | х | х |
Среднее значение определим по формуле:
Cреднее квадратическое отклонение рассчитаем по формуле:
и занесём полученный результат в таблицу 1.
Возведя в квадрат полученное значение получим дисперсию:
Параметры уравнения можно определить также и по формулам:
Таким образом, уравнение регрессии:
Следовательно, с увеличением индекса розничных цен на продукты питания на 1, индекс промышленного производства увеличивается в среднем на 1,13.
Рассчитаем линейный коэффициент парной корреляции:
Связь прямая, достаточно тесная.
Определим коэффициент детерминации:
Вариация результата на 74,59% объясняется вариацией фактора х.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значения .
следовательно, параметры уравнения определены правильно.
Рассчитаем среднюю ошибку аппроксимации - среднее отклонение расчётных значений от фактических:
В среднем расчётные значения отклоняются от фактических на 5,01%.
Оценку качества уравнения регрессии проведём с помощью F-теста.
F-тест состоит в проверке гипотезы Н 0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического F факт и критического (табличного) F табл значений F-критерия Фишера.
F факт определяется по формуле:
где n - число единиц совокупности;
m - число параметров при переменных х.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза.
Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит:
2. Степенная регрессия имеет вид:
Для определения параметров производят логарифмиро-вание степенной функции:
Для определения параметров логарифмической функции строят систему нормальных уравнений по способу наи-меньших квадратов:
Построим таблицу расчётных данных, как показано в таблице 2.
Таблица 2 Расчетные данные для оценки степенной регрессии
№п/п | х | у | lg x | lg y | lg x*lg y | (lg x) 2 | (lg y) 2 |
---|---|---|---|---|---|---|---|
1 | 100 | 70 | 2,000000 | 1,845098 | 3,690196 | 4,000000 | 3,404387 |
2 | 105 | 79 | 2,021189 | 1,897627 | 3,835464 | 4,085206 | 3,600989 |
3 | 108 | 85 | 2,033424 | 1,929419 | 3,923326 | 4,134812 | 3,722657 |
4 | 113 | 84 | 2,053078 | 1,924279 | 3,950696 | 4,215131 | 3,702851 |
5 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
6 | 118 | 85 | 2,071882 | 1,929419 | 3,997528 | 4,292695 | 3,722657 |
7 | 110 | 96 | 2,041393 | 1,982271 | 4,046594 | 4,167284 | 3,929399 |
8 | 115 | 99 | 2,060698 | 1,995635 | 4,112401 | 4,246476 | 3,982560 |
9 | 119 | 100 | 2,075547 | 2,000000 | 4,151094 | 4,307895 | 4,000000 |
10 | 118 | 98 | 2,071882 | 1,991226 | 4,125585 | 4,292695 | 3,964981 |
11 | 120 | 99 | 2,079181 | 1,995635 | 4,149287 | 4,322995 | 3,982560 |
12 | 124 | 102 | 2,093422 | 2,008600 | 4,204847 | 4,382414 | 4,034475 |
13 | 129 | 105 | 2,110590 | 2,021189 | 4,265901 | 4,454589 | 4,085206 |
14 | 132 | 112 | 2,120574 | 2,049218 | 4,345518 | 4,496834 | 4,199295 |
Итого | 1629 | 1299 | 28,90474 | 27,49904 | 56,79597 | 59,69172 | 54,05467 |
Среднее значение | 116,3571 | 92,78571 | 2,064624 | 1,964217 | 4,056855 | 4,263694 | 3,861048 |
8,4988 | 11,1431 | 0,031945 | 0,053853 | х | х | х | |
72,23 | 124,17 | 0,001021 | 0,0029 | х | х | х |
Продолжение таблицы 2 Расчетные данные для оценки степенной регрессии
№п/п | х | у | ||||
---|---|---|---|---|---|---|
1 | 100 | 70 | 74,16448 | 17,34292 | 0,059493 | 519,1886 |
2 | 105 | 79 | 79,62057 | 0,385112 | 0,007855 | 190,0458 |
3 | 108 | 85 | 82,95180 | 4,195133 | 0,024096 | 60,61728 |
4 | 113 | 84 | 88,59768 | 21,13866 | 0,054734 | 77,1887 |
5 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
6 | 118 | 85 | 94,35840 | 87,57961 | 0,110099 | 60,61728 |
7 | 110 | 96 | 85,19619 | 116,7223 | 0,11254 | 10,33166 |
8 | 115 | 99 | 90,88834 | 65,79901 | 0,081936 | 38,6174 |
9 | 119 | 100 | 95,52408 | 20,03384 | 0,044759 | 52,04598 |
10 | 118 | 98 | 94,35840 | 13,26127 | 0,037159 | 27,18882 |
11 | 120 | 99 | 96,69423 | 5,316563 | 0,023291 | 38,6174 |
12 | 124 | 102 | 101,4191 | 0,337467 | 0,005695 | 84,90314 |
13 | 129 | 105 | 107,4232 | 5,872099 | 0,023078 | 149,1889 |
14 | 132 | 112 | 111,0772 | 0,85163 | 0,00824 | 369,1889 |
Итого | 1629 | 1299 | 1296,632 | 446,4152 | 0,703074 | 1738,357 |
Среднее значение | 116,3571 | 92,78571 | х | х | х | х |
8,4988 | 11,1431 | х | х | х | х | |
72,23 | 124,17 | х | х | х | х |
Решая систему нормальных уравнений, определяем параметры логарифмической функции.
Получим линейное уравнение:
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи - индекс корреляции и среднюю ошибку аппроксимации.
Связь достаточно тесная.
В среднем расчётные значения отклоняются от фактических на 5,02%.
Таким образом, Н 0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение индекса розничных цен на продукты питания х = 138, тогда прогнозное значение индекса промышленного производства составит:
Для определения параметров этого уравнения используется система нормальных уравнений:
Произведем замену переменных
и получим следующую систему нормальных уравнений:
Решая систему нормальных уравнений, определяем параметры гиперболы.
Составим таблицу расчётных данных, как показано в таблице 3.
Таблица 3 Расчетные данные для оценки гиперболической зависимости
№п/п | х | у | z | yz | ||
---|---|---|---|---|---|---|
1 | 100 | 70 | 0,010000000 | 0,700000 | 0,0001000 | 4900 |
2 | 105 | 79 | 0,009523810 | 0,752381 | 0,0000907 | 6241 |
3 | 108 | 85 | 0,009259259 | 0,787037 | 0,0000857 | 7225 |
4 | 113 | 84 | 0,008849558 | 0,743363 | 0,0000783 | 7056 |
5 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
6 | 118 | 85 | 0,008474576 | 0,720339 | 0,0000718 | 7225 |
7 | 110 | 96 | 0,009090909 | 0,872727 | 0,0000826 | 9216 |
8 | 115 | 99 | 0,008695652 | 0,860870 | 0,0000756 | 9801 |
9 | 119 | 100 | 0,008403361 | 0,840336 | 0,0000706 | 10000 |
10 | 118 | 98 | 0,008474576 | 0,830508 | 0,0000718 | 9604 |
11 | 120 | 99 | 0,008333333 | 0,825000 | 0,0000694 | 9801 |
12 | 124 | 102 | 0,008064516 | 0,822581 | 0,0000650 | 10404 |
13 | 129 | 105 | 0,007751938 | 0,813953 | 0,0000601 | 11025 |
14 | 132 | 112 | 0,007575758 | 0,848485 | 0,0000574 | 12544 |
Итого: | 1629 | 1299 | 0,120971823 | 11,13792 | 0,0010510 | 122267 |
Среднее значение: | 116,3571 | 92,78571 | 0,008640844 | 0,795566 | 0,0000751 | 8733,357 |
8,4988 | 11,1431 | 0,000640820 | х | х | х | |
72,23 | 124,17 | 0,000000411 | х | х | х |
Продолжение таблицы 3 Расчетные данные для оценки гиперболической зависимости
Степенная регрессия
Степенная функция имеет вид y = bx a . Приведем эту функцию к линейному виду, для этого прологарифмируем обе части: . Пусть = y * , = x * , = b * , тогда y * = ax * + b * . Требуется найти два параметра: a и b * . Для этого составим функцию i * - (ax i * +b *)) 2 , раскроем скобки i * - ax i * - b *) 2 и составим систему:
Пусть А = i * , В = i * , С = i * x i * , D = i *2 , тогда система примет вид: aD + bA = C
Решим эту систему линейных алгебраических уравнений методом Крамера и, таким образом, найдем искомые значения параметров a и b * :
Таблица. Имеются точки
Используя способ вычисления параметров степенной функции, получаем:
a = 1,000922 , b = 1,585807. Так как показатель степени переменной примерно равен единице, то график функции будет иметь вид прямой.
График функции y = 1,585807x 1,000922:
Блок-схема:
Параболическая регрессия
Квадратичная функция имеет вид y = ax 2 + bx + c, следовательно, требуется найти три параметра: a, b, c, с условием, что даны координаты n точек. Для этого составим функцию S = i - (ax i 2 + bx i + c)) 2 , раскроем скобки S = i - ax i 2 - bx i - c) 2 и составим систему:
Решим эту систему линейных алгебраических уравнений методом Крамера и, таким образом, найдем искомые значения параметров a, b и c:
Таблица. Имеются точки:
Используя способ вычисления параметров квадратичной функции, получаем:
a = 0,5272728 , b = -5,627879 , c = 14,87333.
График функции y = 0,5272728x 2 - 5,627879x + 14,87333:
Блок-схема
Решение уравнений вида f(x)=0
Уравнение вида f(x) = 0 является нелинейным алгебраическим уравнением с одной переменной, где функция f(x) определена и непрерывна на конечном или бесконечном интервале a < x < b. Всякое значение C???, обращающее функцию f(x) в ноль, называется корнем уравнения f(x) = 0. Большинство алгебраических нелинейных уравнений вида f(x) = 0 аналитически (т.е. точно) не решается, поэтому на практике для нахождения корней часто используются численные методы.
Задача численного нахождения корней уравнения состоит из двух этапов: отделения корней, т.е. нахождения таких окрестностей рассматриваемой области, в которых содержится одно значение корня, и уточнения корней, т.е. их вычисления с заданной степенью точности в этих окрестностях.
1. Какие из следующих измерений относятся к классу наименований измерительных шкал:
а) числа, кодирующие темперамент;
г) телефонные номера.
2. Какие из следующих измерений относятся к классу порядка измерительных шкал:
б) академический ранг как мера продвижения по службе;
в) метрическая система измерения расстояния;
г) телефонные номера.
3. Какие из следующих измерений относятся к классу отношений измерительных шкал:
а) числа, кодирующие темперамент;
б) академический ранг как мера продвижения по службе;
в) метрическая система измерения расстояния;
г) телефонные номера.
4. Какие из следующих признаков относятся количественным видам:
б) родственные связи членов семьи;
в) пол и возраст человека;
г) социальное положение вкладчика;
д) количество детей в семье;
е) розничный товарооборот торговых предприятий.
5. Какие из следующих признаков относятся качественным видам:
а) количество работников на фирме;
б) родственные связи членов семьи;
в) пол и возраст человека;
г) социальное положение вкладчика;
д) количество детей в семье;
е) розничный товарооборот торговых предприятий.
6. Какую шкалу используют при измерении уровня интеллекта человека:
а) наименований;
б) порядковую;
в) интервальную;
г) отношений.
7. Среднее квадратическое отклонение — это:
а) квадрат размаха вариационного ряда;
б) корень квадратный из дисперсии;
в) квадрат коэффициента вариации;
г) квадратный корень из величины размаха вариации.
8. Коэффициент вариации ряда определяется отношением:
а) среднего квадратического отклонения к среднему арифметическому значению ряда;
б) дисперсии к медиане ряда;
в) дисперсии к максимальному значению ряда;
г) абсолютного показателя вариации к среднему арифметическому значению ряда.
9. Мода данного вариационного ряда
x 10 15 35
n 1 2 3
это:
а) 20;
б) 16;
в) 3;
г) 35.
10. Среднее арифметическое значение совокупности это:
а) значение признака в середине вариационного ряда;
б) полуразность максимального и минимального значений вариационного ряда;
в) полусумма максимального и минимального значений вариационного ряда;
г) отношение суммы всех величин совокупности к их общему числу.
11. Известны данные о стаже работы семи продавцов магазина: 2; 3; 2; 5; 10; 7; 1 лет. Найти среднее значение стажа их работы.
а) 4,3 года;
б) 5 лет;
в) 3года;
г) 3,8 года.
12. Ряд распределения это:
а) последовательность выборочных данных;
б) упорядоченное расположение данных по количественному признаку;
в) числовая последовательность данных;
г) последовательность значений, упорядоченная по качественным признакам.
13. Частотой варианты вариационного ряда называется:
а) численность выборки;
б) значение варианты вариационного ряда;
в) численность отдельных вариант или группы вариационного ряда;
г) число групп вариационного ряда.
14. Мода — это:
а) максимальное значение признака совокупности;
б) наиболее часто встречающееся значение признака;
в) среднее арифметическое значение совокупности.
15. Известны данные о стаже работы продавцов магазина: 2; 3; 2; 5; 10; 7; 1. Найти медиану стажа их работы:
а) 4,5 года;
б) 4,3 года;
в) 3 года;
г) 5 лет.
16. Вариационный размах данного вариационного ряда:
x 10 15 20 30
n 1 2 3 2
это:
а) 15;
б) 10;
в) 30;
г) 20.
17. Численность упорядоченного ряда делит пополам:
а) мода;
б) средняя арифметическая;
в) средняя гармоническая;
г) медиана.
18. Статистическая группировка — это:
а) объединение или разделение данных по существенным признакам;
б) научная организация статистического наблюдения;
в) виды отчетности;
г) непосредственный сбор массовых данных.
19. Коэффициент осцилляции это:
а) абсолютный показатель;
б) средний показатель;
в) относительный показатель вариации.
20. Дисперсия вариационного ряда характеризует:
а) среднее значение индивидуальных признаков;
б) рассеяние индивидуальных значений признаков от среднего значения;
в) среднеквадратическое отклонение.
21. Уравнение прямолинейной функции регрессии отображает динамику развития:
а) с переменным ускорением;
в) равномерное;
г) равноускоренное.
22. Если величина коэффициента корреляции равна 0,6, то по шкале Чедд.ка:
а) связь практически отсутствует;
б) связь слабая;
в) связь умеренная;
г) связь сильная.
23. Данные представляют оценки взрослых людей в тесте на определение коэффициента интеллектуальности Стенфорда-Бине 104, 87, 101, 130, 148, 92, 97, 105, 134, 121. Найти размах вариации:
а) 61;
б) 60;
в) 75.
24. Найти среднюю арифметическую взвешанную для следующего интервального ряда:
li ni
10-14 1
15-19 1
20-24 4
25-29 2
30-34 4
а) 24;
б) 24,92;
в) 25,38.
25. Вычислить медиану следующего ряда 2,1; 1,5; 1,6; 2,1; 2,4:
а) 2;
б) 1,5;
в) 2,1.
26. Вычислить моду следующего интервального ряда
частота 5-7 8-10 11-13 14-16
интервал 4 7 26 41
а) 14;
б) 14,54;
в) 15,23;
27. Какие из следующих измерений относятся к классу наименований измерительных шкал:
а) диагноз больного;
б) автомобильные номера;
в) твердость минерала;
г) календарное время;
д) вес человека.
28. Какие из следующих измерений относятся к классу порядковый измерительных шкал:
а) диагноз больного;
б) автомобильные номера;
в) твердость минерала;
г) календарное время;
д) вес человека.
29. Какие из следующих измерений относятся к классу интервальный измерительных шкал:
а) диагноз больного;
б) автомобильные номера;
в) твердость минерала;
г) календарное время;
д) вес человека.
30. Какие из следующих измерений относятся к классу отношений измерительных шкал:
а) диагноз больного;
б) автомобильные номера;
в) твердость минерала;
г) календарное время;
д) вес человека.
31. Какую шкалу используют при измерении времени:
а) интервальную;
б) отношений;
в) Чеддока.
32. К количественным видам относятся следующие признаки:
а) рост человека;
б) награды за заслуги;
в) цвет глаз;
г) автомобильные номера.
33. К качественным видам относятся следующие признаки:
а) рост человека;
б) награды за заслуги;
в) цвет глаз;
г) автомобильные номера
34. Вычислить моду
xi 5 8 10 13 14
ni 7 4 5 9 1
а) 10;
б) 11;
в) 13
35. В больших по счету числу учеников в классах наблюдается меньшие успехи в приобретении знаний за четверть, чем в небольших классах. Что является результативным признаком?
а) число учеников в классе;
б) успехи в приобретении знаний,
в) число учеников с успехами в приобретении знаний.
36. Длина интервала в интервальном ряду – это:
а) размах вариации поделенное на среднеарифметическое значение;
б) размах вариации поделенный на число групп;
в) дисперсия поделенная на объем выборки.
37. Пример парной корреляции: ученики, научившиеся читать раньше других имеют тенденцию к более высокой успеваемости. Какой из этих признаков: умение рано читать или высокая успеваемость ученика является факторным признаком?
а) умение рано читать;
б) высокая успеваемость;
в) ни один из них.
38. Какой из следующих методов можно применять при сравнении средних трех и более выборок:
а) тест Стьюдента;
б) тест Фишера;
в) дисперсионный анализ.
39. Объем выборки вариационного ряда
xi 10 15 20 30
ni 1 2 3 2
а) 5;
б) 8;
в) 12;
г) 30.
40. Мода вариационного ряда
xi 10 15 20 25
ni 1 5 4 3
а) 15;
б) 5;
в) 23;
г) 3.
41. Уравнение параболической функции регрессии отражает динамику развития:
а) с переменным ускорением;
б) с замедлением роста в конце периода;
в) равномерное;
г) равноускоренное.
42.Коэффициент регрессии В показывает:
а) ожидаемое значение зависимой переменной при нулевом значении предиктора
б) ожидаемое значение зависимой переменной при изменении предиктора на единицу
в) вероятность ошибки регрессии
г) этот вопрос еще окончательно не решен
43. Выборка — это:
а) все множество объектов, по поводу которых строятся рассуждения исследователя;
б) множество объектов, доступных для эмпирического исследования;
в) все возможные значения дисперсии;
г) то же, что и рандомизация.
44. Какой из следующих коэффициентов корреляции демонстрирует наибольшую связь переменных:
а) -0.90;
б) 0;
в) 0.07;
г) 0.01.
45. Генеральная совокупность — это:
а) все множество объектов, по поводу которых строятся рассуждения исследователя;
б) множество объектов, доступных для эмпирического исследования;
в) все возможные значения математического ожидания;
г) нормальное распределение.
46. Как соотносятся объемы выборки и генеральной совокупности:
а) выборка как правило значительно меньше генеральной совокупности;
б) генеральная совокупность всегда меньше выборки;
в) выборка и генеральная совокупность практически всегда совпадают;
г) нет правильного ответа.
47. Точечно-бисериальный коэффициент корреляции является частным случаем коэффициента корреляции:
а) Спирмена;
б) Пирсона;
в) Кендала;
г) все ответы верны.
48. При каком минимальном уровне значимости принято отвергать нулевую гипотезу?
а) 5% уровень
б) 7 % уровень
в) 9 % уровень
г) 10% уровень
49. Какой из следующих методов обычно применяют при сравнении средних в двух нормальных выборках:
а) тест Стьюдента;
б) тест Фишера;
в) однофакторный дисперсионный анализ;
г) корреляционный анализ.
50. С помощью чего проверяются статистические гипотезы:
а) статистик;
б) параметров;
в) экспериментов;
г) наблюдения.
51. Какое из следующих значений коэффициента корреляции невозможно:
а) -0.54;
б) 2.18;
в) 0; г) 1.
52. Какое преобразование необходимо произвести при сравнении двух коэффициентов корреляции:
а) Стьюдента;
б) Фишера;
в) Пирсона;
г) Спирмена.
53. Что такое медиана распределения:
а) то же, что и биссектриса;
б) то же, что и мода;
в) среднее арифметическое;
г) 50%-ый квантиль распределения;
д) нет правильного ответа.
54. Точечно-биссериальный коэффициент корреляции является частным случаем коэффициента корреляции:
а) Спирмена;
б) Пирсона;
в) Кендалла;
г) все ответы верны.
55.Какая из следующих переменных является дискретной:
а) тип темперамента;
б) уровень интеллекта;
в) время реакции;
г) все ответы верны.
56. В каком диапазоне может изменяться коэффициент корреляции:
а) от –1 до 1;
б) от 0 до 1;
в) от 0 до 100;
г) в любом.
57. По поводу чего выдвигаются статистические гипотезы:
а) понятий;
б) статистик;
в) выборок;
г) параметров.
58. Как называется непараметрический аналог дисперсионного анализа:
а) тест Стьюдента;
б) метод Краскела-Уоллиса;
в) тест Вилкоксона;
г) тест Манна-Уитни.
59. Понятие коэффициента корреляции было впервые разработано в работах:
а) Фишера;
б) Стьюдента;
в) Пирсона;
г) Спирмена.
60. Какая из следующих статистик является несмещенной оценкой математического ожидания:
а) среднее арифметическое;
б) мода;
в) медиана;
г) все ответы верны.
61. Как соотносятся коэффициенты корреляции Пирсона и Спирмена:
а) коэффициент Пирсона является частным случаем Спирмена;
б) коэффициент Спирмена является частным случаем Пирсона;
в) эти коэффициенты имеют различную логику построения;
г) это одно и то же.
62. Согласно теоретическим предположениям дисперсионного анализа, F-отношение не может быть:
а) равно 1;
б) больше 1;
в) меньше 1;
г) нет правильного ответа.