- | y | x 1 | x 2 | x 3 |
y | 1 | r yx1 | r yx2 | r yx3 |
x 1 | r x1y | 1 | r x1x2 | r x1x3 |
x 2 | r x2y | r x2x1 | 1 | r x2x3 |
x 3 | r x3y | r x3x1 | r x3x2 | 1 |
Вставьте в поле матрицу парных коэффициентов.
Пример . По данным 154 сельскохозяйственных предприятий Кемеровской области 2003 г. изучить эффективность производства зерновых (табл. 13).
- Определите факторы, формирующие рентабельность зерновых в сельскохозяйственных предприятий в 2003 г.
- Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.
- Постройте уравнение регрессии, характеризующее зависимость рентабельности зерновых от всех факторов.
- Оцените значимость полученного уравнения регрессии. Какие факторы значимо воздействуют на формирование рентабельности зерновых в этой модели?
- Оцените значение рентабельности производства зерновых в сельскохозяйственном предприятии № 3.
Решение получаем с помощью калькулятора Уравнение множественной регрессии :
1. Оценка уравнения регрессии.
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор получается из выражения:
s = (X T X) -1 X T Y
Матрица X
1 | 0.43 | 2.02 | 0.29 |
1 | 0.87 | 1.29 | 0.55 |
1 | 1.01 | 1.09 | 0.7 |
1 | 0.63 | 1.68 | 0.41 |
1 | 0.52 | 0.3 | 0.37 |
1 | 0.44 | 1.98 | 0.3 |
1 | 1.52 | 0.87 | 1.03 |
1 | 2.19 | 0.8 | 1.3 |
1 | 1.8 | 0.81 | 1.17 |
1 | 1.57 | 0.84 | 1.06 |
1 | 0.94 | 1.16 | 0.64 |
1 | 0.72 | 1.52 | 0.44 |
1 | 0.73 | 1.47 | 0.46 |
1 | 0.77 | 1.41 | 0.49 |
1 | 1.21 | 0.97 | 0.88 |
1 | 1.25 | 0.93 | 0.91 |
1 | 1.31 | 0.91 | 0.94 |
1 | 0.38 | 2.08 | 0.27 |
1 | 0.41 | 2.05 | 0.28 |
1 | 0.48 | 1.9 | 0.32 |
1 | 0.58 | 1.73 | 0.38 |
1 | 0 | 0 | 0 |
Матрица Y
0.22 |
0.67 |
0.79 |
0.42 |
0.32 |
0.24 |
0.95 |
1.05 |
0.99 |
0.96 |
0.73 |
0.52 |
2.1 |
0.58 |
0.87 |
0.89 |
0.91 |
0.14 |
0.18 |
0.27 |
0.37 |
0 |
Матрица X T
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0.43 | 0.87 | 1.01 | 0.63 | 0.52 | 0.44 | 1.52 | 2.19 | 1.8 | 1.57 | 0.94 | 0.72 | 0.73 | 0.77 | 1.21 | 1.25 | 1.31 | 0.38 | 0.41 | 0.48 | 0.58 | 0 |
2.02 | 1.29 | 1.09 | 1.68 | 0.3 | 1.98 | 0.87 | 0.8 | 0.81 | 0.84 | 1.16 | 1.52 | 1.47 | 1.41 | 0.97 | 0.93 | 0.91 | 2.08 | 2.05 | 1.9 | 1.73 | 0 |
0.29 | 0.55 | 0.7 | 0.41 | 0.37 | 0.3 | 1.03 | 1.3 | 1.17 | 1.06 | 0.64 | 0.44 | 0.46 | 0.49 | 0.88 | 0.91 | 0.94 | 0.27 | 0.28 | 0.32 | 0.38 | 0 |
Умножаем матрицы, (X T X)
Находим определитель det(X T X) T = 34.35
Находим обратную матрицу (X T X) -1
0.6821 | 0.3795 | -0.2934 | -1.0118 |
0.3795 | 9.4402 | -0.133 | -14.4949 |
-0.2934 | -0.133 | 0.1746 | 0.3204 |
-1.0118 | -14.4949 | 0.3204 | 22.7272 |
Вектор оценок коэффициентов регрессии равен
s = (X T X) -1 X T Y =
0.1565 |
0.3375 |
0.0043 |
0.2986 |
Уравнение регрессии (оценка уравнения регрессии)
Y = 0.1565 + 0.3375X 1 + 0.0043X 2 + 0.2986X 3
Матрица парных коэффициентов корреляции
Число наблюдений n = 22. Число независимых переменных в модели ровно 3, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 5. Матрица, независимых переменных Х имеет размерность (22 х 5). Матрица Х T Х определяется непосредственным умножением или по следующим предварительно вычисленным суммам.Матрица составленная из Y и X
1 | 0.22 | 0.43 | 2.02 | 0.29 |
1 | 0.67 | 0.87 | 1.29 | 0.55 |
1 | 0.79 | 1.01 | 1.09 | 0.7 |
1 | 0.42 | 0.63 | 1.68 | 0.41 |
1 | 0.32 | 0.52 | 0.3 | 0.37 |
1 | 0.24 | 0.44 | 1.98 | 0.3 |
1 | 0.95 | 1.52 | 0.87 | 1.03 |
1 | 1.05 | 2.19 | 0.8 | 1.3 |
1 | 0.99 | 1.8 | 0.81 | 1.17 |
1 | 0.96 | 1.57 | 0.84 | 1.06 |
1 | 0.73 | 0.94 | 1.16 | 0.64 |
1 | 0.52 | 0.72 | 1.52 | 0.44 |
1 | 2.1 | 0.73 | 1.47 | 0.46 |
1 | 0.58 | 0.77 | 1.41 | 0.49 |
1 | 0.87 | 1.21 | 0.97 | 0.88 |
1 | 0.89 | 1.25 | 0.93 | 0.91 |
1 | 0.91 | 1.31 | 0.91 | 0.94 |
1 | 0.14 | 0.38 | 2.08 | 0.27 |
1 | 0.18 | 0.41 | 2.05 | 0.28 |
1 | 0.27 | 0.48 | 1.9 | 0.32 |
1 | 0.37 | 0.58 | 1.73 | 0.38 |
1 | 0 | 0 | 0 | 0 |
Транспонированная матрица.
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0.22 | 0.67 | 0.79 | 0.42 | 0.32 | 0.24 | 0.95 | 1.05 | 0.99 | 0.96 | 0.73 | 0.52 | 2.1 | 0.58 | 0.87 | 0.89 | 0.91 | 0.14 | 0.18 | 0.27 | 0.37 | 0 |
0.43 | 0.87 | 1.01 | 0.63 | 0.52 | 0.44 | 1.52 | 2.19 | 1.8 | 1.57 | 0.94 | 0.72 | 0.73 | 0.77 | 1.21 | 1.25 | 1.31 | 0.38 | 0.41 | 0.48 | 0.58 | 0 |
2.02 | 1.29 | 1.09 | 1.68 | 0.3 | 1.98 | 0.87 | 0.8 | 0.81 | 0.84 | 1.16 | 1.52 | 1.47 | 1.41 | 0.97 | 0.93 | 0.91 | 2.08 | 2.05 | 1.9 | 1.73 | 0 |
0.29 | 0.55 | 0.7 | 0.41 | 0.37 | 0.3 | 1.03 | 1.3 | 1.17 | 1.06 | 0.64 | 0.44 | 0.46 | 0.49 | 0.88 | 0.91 | 0.94 | 0.27 | 0.28 | 0.32 | 0.38 | 0 |
Матрица A T A.
22 | 14.17 | 19.76 | 27.81 | 13.19 |
14.17 | 13.55 | 15.91 | 16.58 | 10.56 |
19.76 | 15.91 | 23.78 | 22.45 | 15.73 |
27.81 | 16.58 | 22.45 | 42.09 | 14.96 |
13.19 | 10.56 | 15.73 | 14.96 | 10.45 |
Полученная матрица имеет следующее соответствие:
Найдем парные коэффициенты корреляции.
Для y и x 1
Средние значения
Дисперсия
Коэффициент корреляции
Для y и x 2
Уравнение имеет вид y = ax + b
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для y и x 3
Уравнение имеет вид y = ax + b
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для x 1 и x 2
Уравнение имеет вид y = ax + b
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для x 1 и x 3
Уравнение имеет вид y = ax + b
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Для x 2 и x 3
Уравнение имеет вид y = ax + b
Средние значения
Дисперсия
Среднеквадратическое отклонение
Коэффициент корреляции
Матрица парных коэффициентов корреляции.
- | y | x 1 | x 2 | x 3 |
y | 1 | 0.62 | -0.24 | 0.61 |
x 1 | 0.62 | 1 | -0.39 | 0.99 |
x 2 | -0.24 | -0.39 | 1 | -0.41 |
x 3 | 0.61 | 0.99 | -0.41 | 1 |
Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых r yxi < 0.5 исключают из модели.
Коллинеарность – зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
r(x j y) > r(x k x j) ; r(x k y) > r(x k x j).
Если одно из неравенств не соблюдается, то исключается тот параметр x k или x j , связь которого с результативным показателем Y оказывается наименее тесной.
3. Анализ параметров уравнения регрессии.
Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации
Для несмещенной оценки дисперсии проделаем следующие вычисления:
Несмещенная ошибка e = Y - X*s (абсолютная ошибка аппроксимации)
-0.18 |
0.05 |
0.08 |
-0.08 |
-0.12 |
-0.16 |
-0.03 |
-0.24 |
-0.13 |
-0.05 |
0.06 |
-0.02 |
1.55 |
0.01 |
0.04 |
0.04 |
0.03 |
-0.23 |
-0.21 |
-0.15 |
-0.1 |
-0.16 |
s e 2 = (Y - X*s) T (Y - X*s)
Несмещенная оценка дисперсии равна
Оценка среднеквадратичного отклонения равна
Найдем оценку ковариационной матрицы вектора k = a*(X T X) -1
0.26 | 0.15 | -0.11 | -0.39 |
0.15 | 3.66 | -0.05 | -5.61 |
-0.11 | -0.05 | 0.07 | 0.12 |
-0.39 | -5.61 | 0.12 | 8.8 |
Дисперсии параметров модели определяются соотношением S 2 i = K ii , т.е. это элементы, лежащие на главной диагонали
С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности , которые определяются по формуле:
Частные коэффициент эластичности E 1 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частные коэффициент эластичности E 2 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частные коэффициент эластичности E 3 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции (от 0 до 1)
Связь между признаком Y факторами X умеренная
Коэффициент детерминации
R 2 = 0.62 2 = 0.38
т.е. в 38.0855 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - средняя
Значимость коэффициента корреляции
По таблице Стьюдента находим Tтабл
T табл (n-m-1;a) = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически - значим
Интервальная оценка для коэффициента корреляции (доверительный интервал)
Доверительный интервал для коэффициента корреляции
r(0.3882;0.846)
5. Проверка гипотез относительно коэффициентов уравнения регрессии (проверка значимости параметров множественного уравнения регрессии).
1) t-статистика
Статистическая значимость коэффициента регрессии b 0 не подтверждается
Статистическая значимость коэффициента регрессии b 1 не подтверждается
Статистическая значимость коэффициента регрессии b 2 не подтверждается
Статистическая значимость коэффициента регрессии b 3 не подтверждается
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(b i - t i S i ; b i + t i S i)
b 0: (-0.7348;1.0478)
b 1: (-2.9781;3.6531)
b 2: (-0.4466;0.4553)
b 3: (-4.8459;5.4431)
2) F-статистика. Критерий Фишера
Fkp = 2.93
Поскольку F < Fkp, то коэффициент детерминации статистически не значим и уравнение регрессии статистически ненадежно.
6. Проверка на наличие гетероскедастичности методом графического анализа остатков.
В этом случае по оси абсцисс откладываются значения объясняющей переменной X i , а по оси ординат квадраты отклонения e i 2 .
y | y(x) | e=y-y(x) | e 2 |
0.22 | 0.4 | -0.18 | 0.03 |
0.67 | 0.62 | 0.05 | 0 |
0.79 | 0.71 | 0.08 | 0.01 |
0.42 | 0.5 | -0.08 | 0.01 |
0.32 | 0.44 | -0.12 | 0.02 |
0.24 | 0.4 | -0.16 | 0.03 |
0.95 | 0.98 | -0.03 | 0 |
1.05 | 1.29 | -0.24 | 0.06 |
0.99 | 1.12 | -0.13 | 0.02 |
0.96 | 1.01 | -0.05 | 0 |
0.73 | 0.67 | 0.06 | 0 |
0.52 | 0.54 | -0.02 | 0 |
2.1 | 0.55 | 1.55 | 2.41 |
0.58 | 0.57 | 0.01 | 0 |
0.87 | 0.83 | 0.04 | 0 |
0.89 | 0.85 | 0.04 | 0 |
0.91 | 0.88 | 0.03 | 0 |
0.14 | 0.37 | -0.23 | 0.05 |
0.18 | 0.39 | -0.21 | 0.04 |
0.27 | 0.42 | -0.15 | 0.02 |
0.37 | 0.47 | -0.1 | 0.01 |
0.16 | -0.16 | 0.02 |
Для определения степени зависимости между несколькими показателями применяется множественные коэффициенты корреляции. Их затем сводят в отдельную таблицу, которая имеет название корреляционной матрицы. Наименованиями строк и столбцов такой матрицы являются названия параметров, зависимость которых друг от друга устанавливается. На пересечении строк и столбцов располагаются соответствующие коэффициенты корреляции. Давайте выясним, как можно провести подобный расчет с помощью инструментов Excel.
Принято следующим образом определять уровень взаимосвязи между различными показателями, в зависимости от коэффициента корреляции:
- 0 – 0,3 – связь отсутствует;
- 0,3 – 0,5 – связь слабая;
- 0,5 – 0,7 – средняя связь;
- 0,7 – 0,9 – высокая;
- 0,9 – 1 – очень сильная.
Если корреляционный коэффициент отрицательный, то это значит, что связь параметров обратная.
Для того, чтобы составить корреляционную матрицу в Экселе, используется один инструмент, входящий в пакет «Анализ данных» . Он так и называется – «Корреляция» . Давайте узнаем, как с помощью него можно вычислить показатели множественной корреляции.
Этап 1: активация пакета анализа
Сразу нужно сказать, что по умолчанию пакет «Анализ данных» отключен. Поэтому, прежде чем приступить к процедуре непосредственного вычисления коэффициентов корреляции, нужно его активировать. К сожалению, далеко не каждый пользователь знает, как это делать. Поэтому мы остановимся на данном вопросе.
После указанного действия пакет инструментов «Анализ данных» будет активирован.
Этап 2: расчет коэффициента
Теперь можно переходить непосредственно к расчету множественного коэффициента корреляции. Давайте на примере представленной ниже таблицы показателей производительности труда, фондовооруженности и энерговооруженности на различных предприятиях рассчитаем множественный коэффициент корреляции указанных факторов.
Этап 3: анализ полученного результата
Теперь давайте разберемся, как понимать тот результат, который мы получили в процессе обработки данных инструментом «Корреляция» в программе Excel.
Как видим из таблицы, коэффициент корреляции фондовооруженности (Столбец 2 ) и энерговооруженности (Столбец 1 ) составляет 0,92, что соответствует очень сильной взаимосвязи. Между производительностью труда (Столбец 3 ) и энерговооруженностью (Столбец 1 ) данный показатель равен 0,72, что является высокой степенью зависимости. Коэффициент корреляции между производительностью труда (Столбец 3 ) и фондовооруженностью (Столбец 2 ) равен 0,88, что тоже соответствует высокой степени зависимости. Таким образом, можно сказать, что зависимость между всеми изучаемыми факторами прослеживается довольно сильная.
Как видим, пакет «Анализ данных» в Экселе представляет собой очень удобный и довольно легкий в обращении инструмент для определения множественного коэффициента корреляции. С его же помощью можно производить расчет и обычной корреляции между двумя факторами.
Задание 2
1. Построить матрицу парных коэффициентов корреляции. Проверить наличие мультиколлинеарности. Обосновать отбор факторов в модель.
2. Построить уравнение множественной регрессии в линейной форме с выбранными факторами.
3. Оценить статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
4. Построить уравнение регрессии со статистически значимыми факторами. Оценить качество уравнения регрессии с помощью коэффициента детерминации R 2 . Оценить точность построенной модели.
5. Оценить прогноз объема выпуска продукции, если прогнозные значения факторов составляют 75% от их максимальных значений.
Условия задачи (Вариант 21)
По данным, представленным в таблице 1 (n =17), изучается зависимость объема выпуска продукции Y (млн. руб.) от следующих факторов (переменных):
X 1 – численность промышленно-производственного персонала, чел.
X 2 – среднегодовая стоимость основных фондов, млн. руб.
X 3 – износ основных фондов, %
X 4 – электровооруженность, кВт×ч.
X 5 – техническая вооруженность одного рабочего, млн. руб.
X 6 – выработка товарной продукции на одного работающего, руб.
Таблица 1. Данные выпуска продукции
№ | Y | X 1 | X 2 | X 3 | X 4 | X 5 | X 6 |
39,5 | 4,9 | 3,2 | |||||
46,4 | 60,5 | 20,4 | |||||
43,7 | 24,9 | 9,5 | |||||
35,7 | 50,4 | 34,7 | |||||
41,8 | 5,1 | 17,9 | |||||
49,8 | 35,9 | 12,1 | |||||
44,1 | 48,1 | 18,9 | |||||
48,1 | 69,5 | 12,2 | |||||
47,6 | 31,9 | 8,1 | |||||
58,6 | 139,4 | 29,7 | |||||
70,4 | 16,9 | 5,3 | |||||
37,5 | 17,8 | 5,6 | |||||
62,0 | 27,6 | 12,3 | |||||
34,4 | 13,9 | 3,2 | |||||
35,4 | 37,3 | 19,0 | |||||
40,8 | 55,3 | 19,3 | |||||
48,1 | 35,1 | 12,4 |
Построить матрицу парных коэффициентов корреляции. Проверить наличие мультиколлинеарности. Обосновать отбор факторов в модель
В таблице 2 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в Excel.
Таблица 2. Матрица коэффициентов парной корреляции
Y | X1 | X2 | X3 | X4 | X5 | X6 | |
Y | |||||||
X1 | 0,995634 | ||||||
X2 | 0,996949 | 0,994947 | |||||
X3 | -0,25446 | -0,27074 | -0,26264 | ||||
X4 | 0,12291 | 0,07251 | 0,107572 | 0,248622 | |||
X5 | 0,222946 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | ||
X6 | 0,067685 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
Визуальный анализ матрицы позволяет установить:
1) У имеет довольно высокие парные корреляции с переменными Х1, Х2 (>0,5) и низкие с переменными Х3,Х4,Х5,Х6 (<0,5);
2) Переменные анализа Х1, Х2 демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных.
Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам Х1,Х2,Х3,Х4,Х5,Х6 .
Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов.
1) Проверка наличия мультиколлинеарности всего массива переменных .
Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Для выявления мультиколлинеарности между факторами вычисляется матрица межфакторных корреляций R с помощью Пакета анализа данных (таблица 3).
Таблица 3.Матрица межфакторных корреляций R
X1 | X2 | X3 | X4 | X5 | X6 | |
X1 | 0,994947 | -0,27074 | 0,07251 | 0,166919 | -0,00273 | |
X2 | 0,994947 | -0,26264 | 0,107572 | 0,219914 | 0,041955 | |
X3 | -0,27074 | -0,26264 | 0,248622 | -0,07573 | -0,28755 | |
X4 | 0,07251 | 0,107572 | 0,248622 | 0,671386 | 0,366382 | |
X5 | 0,166919 | 0,219914 | -0,07573 | 0,671386 | 0,600899 | |
X6 | -0,00273 | 0,041955 | -0,28755 | 0,366382 | 0,600899 |
Между факторами Х1 и Х2, Х5 и Х4, Х6 и Х5 наблюдается сильная зависимость (>0,5).
Определитель det (R) = 0,001488 вычисляется с помощью функции МОПРЕД. Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов.
2) Проверка наличия мультиколлинеарности каждой переменной с другими переменными:
· Вычислим обратную матрицу R -1 с помощью функции Excel МОБР (таблица 4):
Таблица 4. Обратная матрица R -1
X1 | X2 | X3 | X4 | X5 | X6 | |
X1 | 150,1209 | -149,95 | 3,415228 | -1,70527 | 6,775768 | 4,236465 |
X2 | -149,95 | 150,9583 | -3,00988 | 1,591549 | -7,10952 | -3,91954 |
X3 | 3,415228 | -3,00988 | 1,541199 | -0,76909 | 0,325241 | 0,665121 |
X4 | -1,70527 | 1,591549 | -0,76909 | 2,218969 | -1,4854 | -0,213 |
X5 | 6,775768 | -7,10952 | 0,325241 | -1,4854 | 2,943718 | -0,81434 |
X6 | 4,236465 | -3,91954 | 0,665121 | -0,213 | -0,81434 | 1,934647 |
· Вычисление F-критериев , где – диагональные элементы матрицы , n=17, k = 6 (таблица 5).
Таблица 5. Значения F-критериев
F1 (Х1) | F2 (Х2) | F3 (Х3) | F4 (Х4) | F5 (Х5) | F6 (Х6) |
89,29396 | 89,79536 | 0,324071 | 0,729921 | 1,163903 | 0,559669 |
· Фактические значения F-критериев сравниваются с табличным значением F табл = 3,21 (FРАСПОБР(0,05;6;10)) при n1= 6 и n2 = n - k – 1=17-6-1=10 степенях свободы и уровне значимости α=0,05, где k – количество факторов.
· Значения F-критериев для факторов Х1 и Х2 больше табличного, что свидетельствует о наличии мультиколлинеарности между данными факторами. Меньше всего влияет на общую мультиколлинеарность факторов фактор Х3.
3) Проверка наличия мультиколлинеарности каждой пары переменных
· Вычислим частные коэффициенты корреляции по формуле , где – элементы матрицы (таблица 6)
Таблица 6. Матрица коэффициентов частных корреляций
X1 | X2 | X3 | X4 | X5 | X6 | |
X1 | ||||||
X2 | 0,996086 | |||||
X3 | -0,22453 | 0,197329 | ||||
X4 | 0,093432 | -0,08696 | 0,415882 | |||
X5 | -0,32232 | 0,337259 | -0,1527 | 0,581191 | ||
X6 | -0,24859 | 0,229354 | -0,38519 | 0,102801 | 0,341239 |
· Вычисление t -критериев по формуле (таблица 7)
n - число данных = 17
K - число факторов = 6
Таблица 7.t-критерии для коэффициентов частной корреляции
X1 | X2 | X3 | X4 | X5 | X6 | |
X1 | ||||||
X2 | 35,6355 | |||||
X3 | -0,72862 | 0,636526 | ||||
X4 | 0,296756 | -0,27604 | 1,446126 | |||
X5 | -1,07674 | 1,13288 | -0,4886 | 2,258495 | ||
X6 | -0,81158 | 0,745143 | -1,31991 | 0,326817 | 1,147999 |
t табл = СТЬЮДРАСПОБР(0,05;10) = 2,23
Фактические значения t-критериев сравниваются с табличным значением при степенях свободы n-k-1 = 17-6-1=10 и уровне значимости α=0,05;
t21 > tтабл
t54 > tтабл
Из таблиц 6 и 7 видно, что две пары факторов X1 и Х2, Х4 и Х5 имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными. Для того чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. В паре Х1 и Х2 оставляем Х2, в паре Х4 и Х5 оставляем Х5.
Таким образом, в результате проверки теста Фаррара-Глоубера остаются факторы: Х2, Х3, Х5, Х6.
Завершая процедуры корреляционного анализа, целесообразно посмотреть частные корреляции выбранных факторов с результатом Y.
Построим матрицу парных коэффициентов корреляции, исходя из данных таблицы 8.
Таблица 8. Данные выпуска продукции с отобранными факторами Х2, Х3, Х5, Х6.
№ наблю-дения | Y | X 2 | X 3 | X 5 | X 6 |
39,5 | 3,2 | ||||
46,4 | 20,4 | ||||
43,7 | 9,5 | ||||
35,7 | 34,7 | ||||
41,8 | 17,9 | ||||
49,8 | 12,1 | ||||
44,1 | 18,9 | ||||
48,1 | 12,2 | ||||
47,6 | 8,1 | ||||
58,6 | 29,7 | ||||
70,4 | 5,3 | ||||
37,5 | 5,6 | ||||
12,3 | |||||
34,4 | 3,2 | ||||
35,4 | |||||
40,8 | 19,3 | ||||
48,1 | 12,4 |
В последнем столбце таблицы 9 представлены значения t-критерия для столбца У.
Таблица 9.Матрица коэффициентов частной корреляции с результатом Y
Y | X2 | X3 | X5 | X6 | t критерий (t табл (0,05;11)= 2,200985 | |
Y | 0,996949 | -0,25446 | 0,222946 | 0,067685 | ||
X2 | 0,996949 | -0,26264 | 0,219914 | 0,041955 | 44,31676 | |
X3 | -0,25446 | -0,26264 | -0,07573 | -0,28755 | 0,916144 | |
X5 | 0,222946 | 0,219914 | -0,07573 | 0,600899 | -0,88721 | |
X6 | 0,067685 | 0,041955 | -0,28755 | 0,600899 | 1,645749 |
Из таблицы 9 видно, что переменная Y имеет высокую и одновременно статистически значимую частную корреляцию с фактором Х2.
Коллинеарными являются факторы …
И коллинеарны.
4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и … мультиколлинеарность факторов.
5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):
Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются
…x (2)
и x (3)
1. Дана таблица исходных данных для построения эконометрической регрессионной модели:
Фиктивными переменными не являются …
стаж работы
производительность труда
2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …
использовать фиктивную переменную – пол потребителя
разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола
3. Изучается зависимость цены квартиры (у
) от ее жилой площади (х
) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …
для типа дома кирпичный
для типа дома монолитный
4. При анализе промышленных предприятий в трех регионах (Республика Марий Эл, Республика Чувашия, Республика Татарстан) были построены три частных уравнения регрессии:
для Республики Марий Эл;
для Республики Чувашия;
для Республики Татарстан.
Укажите вид фиктивных переменных и уравнение с фиктивными переменными, обобщающее три частных уравнения регрессии.
5. В эконометрике фиктивной переменной принято считать …
переменную, принимающую значения 0 и 1
описывающую количественным образом качественный признак
1. Для регрессионной модели зависимости среднедушевого денежного дохода населения (руб., у ) от объема валового регионального продукта (тыс. р., х 1 ) и уровня безработицы в субъекте (%, х 2 ) получено уравнение . Величина коэффициента регрессии при переменной х 2 свидетельствует о том, что при изменении уровня безработицы на 1% среднедушевой денежный доход ______ рубля при неизменной величине валового регионального продукта.
изменится на (-1,67)
2. В уравнении линейной множественной регрессии: , где – стоимость основных фондов (тыс. руб.); – численность занятых (тыс. чел.); y – объем промышленного производства (тыс. руб.) параметр при переменной х 1 , равный 10,8, означает, что при увеличении объема основных фондов на _____ объем промышленного производства _____ при постоянной численности занятых.
на 1 тыс. руб. … увеличится на 10,8 тыс. руб.
3. Известно, что доля остаточной дисперсии зависимой переменной в ее общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,8
4. Построена эконометрическая модель для зависимости прибыли от реализации единицы продукции (руб., у ) от величины оборотных средств предприятия (тыс. р., х 1 ): . Следовательно, средний размер прибыли от реализации, не зависящий от объема оборотных средств предприятия, составляет _____ рубля. 10,75
5. F-статистика рассчитывается как отношение ______ дисперсии к ________ дисперсии, рассчитанных на одну степень свободы. факторной … остаточной
1. Для эконометрической модели уравнения регрессии ошибка модели определяется как ______ между фактическим значением зависимой переменной и ее расчетным значением. Разность
2. Величина называется … случайной составляющей
3. В эконометрической модели уравнения регрессии величина отклонения фактического значения зависимой переменной от ее расчетного значения характеризует … ошибку модели
4. Известно, что доля объясненной дисперсии в общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,2
5. При методе наименьших квадратов параметры уравнения парной линейной регрессии определяются из условия ______ остатков . минимизации суммы квадратов
1. Для обнаружения автокорреляции в остатках используется …
статистика Дарбина – Уотсона
2. Известно, что коэффициент автокорреляции остатков первого порядка равен –0,3. Также даны критические значения статистики Дарбина – Уотсона для заданного количества параметров при неизвестном и количестве наблюдений , . По данным характеристикам можно сделать вывод о том, что …автокорреляция остатков отсутствует
1. ПОСТРОИМ МАТРИЦУ КОЭФФИЦИЕНТОВ ПАРНОЙ КОРРЕЛЯЦИИ.
Для этого рассчитаем коэффициенты парной корреляции по формуле:
Необходимые расчеты представлены в таблице 9.
-
связь между выручкой предприятия Y и объемом капиталовложений Х 1 слабая и прямая;
-
связи между выручкой предприятия Y и основными производственными фондами Х 2 практически нет;
-
связь между объемом капиталовложений Х 1 и основными производственными фондами Х 2 тесная и прямая;
Таблица 9
Вспомогательная таблица для расчета коэффициентов парных корреляций
t | Y | X1 | X2 | (y-yср)* | (y-yср)* | (х1-х1ср)* |
|||
1998 | 3,0 | 1,1 | 0,4 | 0,0196 | 0,0484 | 0,0841 | 0,0308 | 0,0406 | 0,0638 |
1999 | 2,9 | 1,1 | 0,4 | 0,0576 | 0,0484 | 0,0841 | 0,0528 | 0,0696 | 0,0638 |
2000 | 3,0 | 1,2 | 0,7 | 0,0196 | 0,0144 | 1E-04 | 0,0168 | -0,0014 | -0,0012 |
2001 | 3,1 | 1,4 | 0,9 | 0,0016 | 0,0064 | 0,0441 | -0,0032 | -0,0084 | 0,0168 |
2002 | 3,2 | 1,4 | 0,9 | 0,0036 | 0,0064 | 0,0441 | 0,0048 | 0,0126 | 0,0168 |
2003 | 2,8 | 1,4 | 0,8 | 0,1156 | 0,0064 | 0,0121 | -0,0272 | -0,0374 | 0,0088 |
2004 | 2,9 | 1,3 | 0,8 | 0,0576 | 0,0004 | 0,0121 | 0,0048 | -0,0264 | -0,0022 |
2005 | 3,4 | 1,6 | 1,1 | 0,0676 | 0,0784 | 0,1681 | 0,0728 | 0,1066 | 0,1148 |
2006 | 3,5 | 1,3 | 0,4 | 0,1296 | 0,0004 | 0,0841 | -0,0072 | -0,1044 | 0,0058 |
2007 | 3,6 | 1,4 | 0,5 | 0,2116 | 0,0064 | 0,0361 | 0,0368 | -0,0874 | -0,0152 |
Σ | 31,4 | 13,2 | 6,9 | 0,684 | 0,216 | 0,569 | 0,182 | -0,036 | 0,272 |
Средн. | 3,14 | 1,32 | 0,69 |
Также матрицу коэффициентов парных корреляций можно найти в среде Excel с помощью надстройки АНАЛИЗ ДАННЫХ, инструмента КОРРЕЛЯЦИЯ.
Матрица коэффициентов парной корреляции имеет вид:
Y | X1 | X2 | |
Y | 1 | ||
X1 | 0,4735 | 1 | |
X2 | -0,0577 | 0,7759 | 1 |
Матрица парных коэффициентов корреляции показывает, что результативный признак у (выручка) имеет слабую связь с объемом капиталовложений х 1 , а с Размером ОПФ связи практически нет. Связь между факторами в модели оценивается как тесная, что говорит о их линейной зависимости, мультиколлинеарности.
2. ПОСТРОИТЬ ЛИНЕЙНУЮ МОДЕЛЬ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
Параметры модели найдем с помощью МНК. Для этого составим систему нормальных уравнений.
Расчеты представлены в таблице 10.
Решим систему уравнений, используя метод Крамера:
Таблица 10
Вспомогательные вычисления для нахождения параметров линейной модели множественной регрессии
y | |||||||
3,0 | 1,1 | 0,4 | 1,21 | 0,44 | 0,16 | 3,3 | 1,2 |
2,9 | 1,1 | 0,4 | 1,21 | 0,44 | 0,16 | 3,19 | 1,16 |
3,0 | 1,2 | 0,7 | 1,44 | 0,84 | 0,49 | 3,6 | 2,1 |
3,1 | 1,4 | 0,9 | 1,96 | 1,26 | 0,81 | 4,34 | 2,79 |
3,2 | 1,4 | 0,9 | 1,96 | 1,26 | 0,81 | 4,48 | 2,88 |
2,8 | 1,4 | 0,8 | 1,96 | 1,12 | 0,64 | 3,92 | 2,24 |
2,9 | 1,3 | 0,8 | 1,69 | 1,04 | 0,64 | 3,77 | 2,32 |
3,4 | 1,6 | 1,1 | 2,56 | 1,76 | 1,21 | 5,44 | 3,74 |
3,5 | 1,3 | 0,4 | 1,69 | 0,52 | 0,16 | 4,55 | 1,4 |
3,6 | 1,4 | 0,5 | 1,96 | 0,7 | 0,25 | 5,04 | 1,8 |
31,4 | 13,2 | 6,9 | 17,64 | 9,38 | 5,33 | 41,63 | 21,63 |
Линейная модель множественной регрессии имеет вид:
Если объем капиталовложений увеличить на 1 млн. руб., то выручка предприятия увеличиться в среднем на 2,317 млн. руб. при неизменных размерах основных производственных фондов.
Если основные производственные фонды увеличить на 1 млн. руб., то выручка предприятия уменьшиться в среднем на 1,171 млн. руб. при неизменном объеме капиталовложений.
3. РАССЧИТАЕМ:
коэффициент детерминации:
67,82% изменения выручки предприятия обусловлено изменением объема капиталовложений и основных производственных фондов, на 32,18% - влиянием факторов, не включенных в модель.
F – критерий Фишера
Проверим значимость уравнения
Табличное значение F – критерия при уровне значимости α = 0,05 и числе степеней свободы d.f. 1 = k = 2 (количество факторов), числе степеней свободы d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 составит 4,74.
Так как F расч. = 7,375 > F табл. = 4.74, то уравнение регрессии в целом можно считать статистически значимым.
Рассчитанные показатели можно найти в среде Excel с помощью надстройки АНАЛИЗА ДАННЫХ, инструмента РЕГРЕССИЯ.
Таблица 11
Вспомогательные вычисления для нахождения средней относительной ошибки аппроксимации
y | А | ||||
3,0 | 1,1 | 0,4 | 2,97 | 0,03 | 0,010 |
2,9 | 1,1 | 0,4 | 2,97 | -0,07 | 0,024 |
3,0 | 1,2 | 0,7 | 2,85 | 0,15 | 0,050 |
3,1 | 1,4 | 0,9 | 3,08 | 0,02 | 0,007 |
3,2 | 1,4 | 0,9 | 3,08 | 0,12 | 0,038 |
2,8 | 1,4 | 0,8 | 3,20 | -0,40 | 0,142 |
2,9 | 1,3 | 0,8 | 2,96 | -0,06 | 0,022 |
3,4 | 1,6 | 1,1 | 3,31 | 0,09 | 0,027 |
3,5 | 1,3 | 0,4 | 3,43 | 0,07 | 0,019 |
3,6 | 1,4 | 0,5 | 3,55 | 0,05 | 0,014 |
0,353 |
среднюю относительную ошибку аппроксимации
В среднем расчетные значения отличаются от фактических на 3,53 %. Ошибка небольшая, модель можно считать точной.
4. Построить степенную модель множественной регрессии
Для построения данной модели прологарифмируем обе части равенства
lg y = lg a + β 1 ∙ lg x 1 + β 2 ∙ lg x 2 .
Сделаем замену Y = lg y, A = lg a, X 1 = lg x 1 , X 2 = lg x 2 .
Тогда Y = A + β 1 ∙ X 1 + β 2 ∙ X 2 – линейная двухфакторная модель регрессии. Можно применить МНК.
Расчеты представлены в таблице 12.
Таблица 12
Вспомогательные вычисления для нахождения параметров степенной модели множественной регрессии
y | lg y | |||||||||
3,0 | 1,1 | 0,4 | 0,041 | -0,398 | 0,477 | 0,002 | -0,016 | 0,020 | 0,158 | -0,190 |
2,9 | 1,1 | 0,4 | 0,041 | -0,398 | 0,462 | 0,002 | -0,016 | 0,019 | 0,158 | -0,184 |
3,0 | 1,2 | 0,7 | 0,079 | -0,155 | 0,477 | 0,006 | -0,012 | 0,038 | 0,024 | -0,074 |
3,1 | 1,4 | 0,9 | 0,146 | -0,046 | 0,491 | 0,021 | -0,007 | 0,072 | 0,002 | -0,022 |
3,2 | 1,4 | 0,9 | 0,146 | -0,046 | 0,505 | 0,021 | -0,007 | 0,074 | 0,002 | -0,023 |
2,8 | 1,4 | 0,8 | 0,146 | -0,097 | 0,447 | 0,021 | -0,014 | 0,065 | 0,009 | -0,043 |
2,9 | 1,3 | 0,8 | 0,114 | -0,097 | 0,462 | 0,013 | -0,011 | 0,053 | 0,009 | -0,045 |
3,4 | 1,6 | 1,1 | 0,204 | 0,041 | 0,531 | 0,042 | 0,008 | 0,108 | 0,002 | 0,022 |
3,5 | 1,3 | 0,4 | 0,114 | -0,398 | 0,544 | 0,013 | -0,045 | 0,062 | 0,158 | -0,217 |
3,6 | 1,4 | 0,5 | 0,146 | -0,301 | 0,556 | 0,021 | -0,044 | 0,081 | 0,091 | -0,167 |
31,4 | 13,2 | 6,9 | 1,178 | -1,894 | 4,955 | 0,163 | -0,165 | 0,592 | 0,614 | -0,943 |
Решаем систему уравнений применяя метод Крамера.
Степенная модель множественной регрессии имеет вид:
В степенной функции коэффициенты при факторах являются коэффициентами эластичности. Коэффициент эластичности показывает на сколько процентов измениться в среднем значение результативного признака у, если один из факторов увеличить на 1 % при неизменном значении других факторов.
Если объем капиталовложений увеличить на 1%, то выручка предприятия увеличиться в среднем на 0,897% при неизменных размерах основных производственных фондов.
Если основные производственные фонды увеличить на 1%, то выручка предприятия уменьшиться на 0,226% при неизменных капиталовложениях.
5. РАССЧИТАЕМ:
коэффициент множественной корреляции:
Связь выручки предприятия с объемом капиталовложений и основными производственными фондами тесная.
Таблица 13
Вспомогательные вычисления для нахождения коэффициента множественной корреляции, коэффициента детерминации, ср.относ.ошибки аппроксимации степенной модели множественной регрессии
Y | (Y-Y расч.) 2 | A | ||||
3,0 | 1,1 | 0,4 | 2,978 | 0,000 | 0,020 | 0,007 |
2,9 | 1,1 | 0,4 | 2,978 | 0,006 | 0,058 | 0,027 |
3,0 | 1,2 | 0,7 | 2,838 | 0,026 | 0,020 | 0,054 |
3,1 | 1,4 | 0,9 | 3,079 | 0,000 | 0,002 | 0,007 |
3,2 | 1,4 | 0,9 | 3,079 | 0,015 | 0,004 | 0,038 |
2,8 | 1,4 | 0,8 | 3,162 | 0,131 | 0,116 | 0,129 |
2,9 | 1,3 | 0,8 | 2,959 | 0,003 | 0,058 | 0,020 |
3,4 | 1,6 | 1,1 | 3,317 | 0,007 | 0,068 | 0,024 |
3,5 | 1,3 | 0,4 | 3,460 | 0,002 | 0,130 | 0,012 |
3,6 | 1,4 | 0,5 | 3,516 | 0,007 | 0,212 | 0,023 |
31,4 | 13,2 | 6,9 | 0,198 | 0,684 | 0,342 |
коэффициент детерминации:
71,06% изменения выручки предприятия в степенной модели обусловлено изменением объема капиталовложений и основных производственных фондов, на 28,94 % - влиянием факторов, не включенных в модель.
F – критерий Фишера
Проверим значимость уравнения
Табличное значение F – критерия при уровне значимости α = 0,05 и числе степеней свободы d.f. 1 = k = 2, числе степеней свободы d.f. 2 = (n – k – 1) = (10 – 2 – 1) = 7 составит 4,74.
Так как F расч. = 8,592 > F табл. = 4.74, то уравнение степенной регрессии в целом можно считать статистически значимым.
Посадка невозможна, в каком из реализуемых случаев расход топлива меньше. Получить программу оптимального управления, когда до некоторого момента t1 управление отсутствует u*=0, а начиная с t=t1, управление равно своему максимальному значению u*=umax, что соответствует минимальному расходу топлива. 6.) Решить каноническую систему уравнений, рассматривая ее для случаев, когда и управление...
К составлению математических моделей. Если математическая модель - это диагноз заболевания, то алгоритм - это метод лечения. Можно выделить следующие основные этапы операционного исследования: наблюдение явления и сбор исходных данных; постановка задачи; построение математической модели; расчет модели; тестирование модели и анализ выходных данных. Если полученные результаты не удовлетворяют...
Математических построений по аналогии с выявляет в плоском приближении продольно-скалярную электромагнитную волну с электрической - (28) и магнитной (29) синфазными составляющими. Математическая модель безвихревой электродинамики характеризуется скалярно-векторной структурой своих уравнений. Основополагающие уравнения безвихревой электродинамики сведены в таблице 1. Таблица 1 , ...