БарГУ.by » Шпоры по ЭМММ ч.1

Шпоры по ЭМММ ч.1

Автор: Maxvel 7-12-2014, 10:33

Скачать



1. Определение эконометрики.
Эконометрика — самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенных для того, чтобы на базе экономической теории, экономической статистики и экономических измерений, математико-статистического инструментария придавать конкретное количественное выражение общим (качественным) закономерностям, обусловленным экономической теорией
Основная цель эконометрики заключается в модельном описании конкретных количественных взаимосвязей, обусловленных общими качественными закономерностями, выявленными в экономической теории.
Основной предмет исследования эконометрики – это массовые экономические явления и процессы. Предметы исследования эконометрики и статистики являются весьма схожими, потому что эконометрика исследует массовые экономические явления и процессы, а статистика исследует массовые явления и процессы любой природы (в том числе и экономические).
Слово «эконометрика» образовано от двух слов: «экономика» и «метрика» («метрон» (греч.) – правило определения расстояния между двумя точками в пространстве, «метрия» – измерение). Следовательно, эконометрику можно определить как науку об экономических измерениях.

2.Эконометрика и экономическая теория. Эконометрика и статистика. Эконометрика и экономико-математические методы.
ЭМ возникла на основе междисциплинарного подхода к изучению экономики. Поэтому ЭМ можно представить как комбинацию трёх наук – экономической теории, матем-ой и экономической статистики и математики. Помимо этого, на совр. этапе развития науки одним из важнейших факторов развития ЭМ стало развитие компьютерных технологий и спец. пакетов прикладных программ.
Большинство эконометрических методов и приёмов исследования экономических явлений и процессов позаимствованы из математической статистики. Однако в применении этих методов в ЭМ существует определённая специфика. В связи с тем, что практически все экономические показатели являются случайными величинами, а не результатами контролируемого эксперимента, были разработаны определённые усовершенствования и модификации методов, которые не применяются в математической статистике.
По причине того, что экономические данные могут быть измерены с ошибкой, в ЭМ были разработаны специальные методы анализа, позволяющие устранить или снизить влияние этих ошибок на полученные результаты.
Т. о, эконометрика исследует различные экономические закономерности, установленные экономической теорией, с помощью методов математической и экономической статистики.

3. Эконометрические модели: общая характеристика, различия статистического и эконометрического подходов к моделированию.
Главным инструментом ЭМ служит эконометрическая модель, т.е. экономико-математическая модель факторного анализа, параметры кот. оцениваются средствами математической статистики. Эта модель выступает в качестве средства анализа и прогнозирования конкретных экономических процессов на основе реальной статистич-ой информации.
3 класса эконометрических моделей: - модель временных данных; - регрессионная модель с одним уравнением; - система одновременных уравнений.
В модели временных данных результатный признак является функцией переменной времени или переменных, относящихся к другим моментам времени. Модели временных данных, представляющих собой зависимость результативного признака от времени: - модели тренда; - модели сезонности; - модели тренда и сезонности.
Модели временных данных, представляющих собой зависимость результативного признака от переменных, датированных другими моментами времени:
- модели с распределенным лагом (объясняют поведение результативного признака в зависимости от предыдущих факторных переменных Х);
- модели авторегрессии (объясняют поведение результативного признака в зависимости от предыдущих значений результативных переменных);
- модели ожиданий (объясняют поведение результативного признака в зависимости от будущих значений факторных переменных). В регрессионных моделях с одним уравнением результативный признак представляется в виде функции факторных переменных.
Системы регрессионных уравнений описываются системами взаимосвязанных регрессионных уравнений. Система «Объясняет», а также прогнозирует сколько результативных признаков, сколько поведенческих уравнений входит в систему.
Исходными данными, необходимыми для построения эконометрической модели, явл. известные наборы (массивы) значений зависимой переменной у и независимых факторов При этом могут использоваться два принципиально разл. типа исходных информационных массивов — статический и динамический. Статический массив представляет собой значения результирующей (зависимой, объясняемой и т. п.) переменной у и влияющих на нее факторов (независимых, объясняющих переменных) , имевших место у объектов однородной совокупности в определенный период времени. Примером таких объектов являются однотипные промышленные предприятия (заводы одной отраслевой направленности). В качестве у в практических исследованиях часто рассматриваются показатели производительности труда, объемов выпускаемой продукции и некоторые другие. В качестве — влияющие на уровень этих показателей факторы — объемы используемых фондов, численность и квалификация рабочей силы и т. п.

4.Проблемы эконометрического моделирования. Понятие эконометрической модели.
Эконометрическое исследование связано с решением следующих проблем:
-качественный анализ связей экономических переменных, т. е. определение зависимых (yi) и независ. (хi) переменных;- изучение соотв.раздела экономической теории;- подбор данных;- спецификация формы связи между yi и хi;- оценка неизвестных параметров модели;- проверка ряда гипотез о св-ах распределения вероятностей для случайной компоненты (гипотезы о средней дисперсии и ковариации);-анализ мультиколлинеарности объясняющих переменных, оценка ее статистич-ой значимости, определение переменных, ответственных за мультиколлинеарность;- введение фиктивных переменных;- выявление автокорреляции;- выявление тренда, циклической и случайной компонент;- проверка остатков модели на гетероскедастичность;-анализ структуры связей и построения системы одноврем-х уравнений;- проверка условия идентификации;- оценка параметров системы одноврем-х уравнений;- проблемы моделирования на основе системы временных рядов;-построение рекурсивных моделей, авторегрессионных моделей;- выработка управленческих решений;-прогноз экономич-х показателей, характеризующих изучаемый процесс;- моделирование поведения процесса при разл. знач. независ. (факторных) переменных.
Выделяют 3 основных вида моделей:
1.Регрессионные модели с одним уравнением. В таких моделях зависимая переменная У представляется функцией f:S(x,b)=S(x1,x2,xn;b0,b1,bm). Разл. линейные и нелинейные модели. Осн. проблемой при создании модели явл. отбор значимых параметров оценивания и идентификации модели.
2.Система одновременных уравнений описывается сис. уравнений. Сист. могут состоять из тождеств или регрессионных уравнений, каждая из кот. может содержать как объясняющие, так и объясняемые переменные из др.уравнений системы.
3.Модели временных рядов. К ним относятся модели тренда Y(t)=T(t)+E, модель сезонности Y(t)=S(t)+E, и модель тренда и сезонности Y(t)=T(t)+S(t)+E

5.Классификация эконометрических моделей.
Общая классификация эконометрических или экономико-математических моделей вкл. более десяти основных признаков.
1) По целевому назначению:
а) теоретико-аналитические модели – исп. при исследовании общих свойств и закономерностей экономических процессов;
б) прикладные модели – исп. при решении конкретных экономических задач (модели экономического анализа, прогнозирования, управления);
2) По исследуемым экономическим процессам и содержательной проблематике:
а) модели народного хозяйства в целом и его отдельных подсистем-отраслей, регионов и т. д.;
б) комплексы моделей производства и потребления;
в) комплексы моделей формирования и распределения доходов;
г) комплексы моделей трудовых ресурсов;
д) комплексы моделей ценообразования;
е) комплексы моделей финансовых связей и др.
3) Дескриптивные и нормативные модели:
а)дескриптивные - предназначены для объяснения наблюдаемых фактов или для построения вероятностного прогноза;
б) нормативные - отвечают на вопрос «как это должно быть?», т. е. предполагают целенаправленную деятельность.;
4) По характеру отражения причинно-следственных связей:
а) модели жестко детерминистские;
б) модели, в которых учитываются факторы случайности и неопределенности.
5) По способам отражения фактора времени:
а) статические модели, характеризующие исследуемую зависимость между переменными на определённый момент времени;
б) динамические модели, характеризующие изменение экономических процессов во времени.
6.Методологические вопросы построения эконометрических моделей: обзор используемых методов.
Весь процесс эконометрического моделирования можно разбить на шесть основных этапов.
1-й этап (постановочный) - определение конечных целей моделирования, набора участвующих в модели факторов и показателей, их роли;
2-й этап (априорный) - предмодельный анализ экономической сущности изучаемого явления, формирование и формализация априорной информации и исходных допущений, в частности относящейся к природе и генезису исходных статистических данных и случайных остаточных составляющих в виде ряда гипотез;
3-й этап (параметризация) - собственно моделирование, т.е. выбор общего вида модели, в том числе состава и формы входящих в неё связей между переменными;
4-й этап (информационный) - сбор необходимой статистической информации, т.е. регистрация значений участвующих в модели факторов и показателей;
5-й этап (идентификация модели) - статистический анализ модели и в первую очередь статистическое оценивание неизвестных параметров модели Непосредственно связан с проблемой идентифицируемости модели, то есть ответа на вопрос «Возможно ли в принципе однозначно восстановить значения неизвестных параметров модели по имеющимся исходным данным в соответст-вии с решением, принятым на этапе параметризации?». После положительного ответа на этот вопрос необходимо решить проблему идентификации модели то есть предложить и реализовать математически корректную процедуру оценивания неизвестных параметров модели по имеющимся исходным данным.

7.Области применения эконометрических моделей.
Области применения эконометрических моделей напрямую связаны с целями эконометрического моделирования:
1) прогноз экономических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы;
2) имитация различных возможных сценариев социально-экономического развития анализируемой системы.
В качестве анализируемой экономической системы могут выступать страна в целом (макроэкономические системы), регионы, отрасли и корпорации (мезосистемы), а также предприятия, фирмы и домохозяйства (микроэкономические системы).
В любой эконометрической модели, в зависимости от конечных прикладных целей ее использования все участвующие в ней переменные подразделяются на:
- экзогенные переменные, задаваемые как бы извне, автономно, в определенной степени управляемые (планируемые);
- эндогенные переменные, значения которых формируются в процессе и внутри функционирования анализируемой социально-экономической системы под воздействием экзогенных переменных и во взаимодействии друг с другом, являются предметом объяснения в эконометрической модели;
- предопределенные переменные выступают в роли факторов-аргументов или объясняющих переменных;
- лаговые эндогенные переменные входят в уравнения анализируемой эконометрической системы, но измерены в прошлые моменты, а следовательно, являются уже известными, заданными.
Эконометрическая модель служит для объяснения поведения эндогенных переменных в зависимости от значений экзогенных и лаговых эндогенных переменных.

8.Понятие о функциональной, статистической и корреляционных связях.
Между обществ. и экономическими явлен. имеется два осн. типа связи - функциональная и статистическая (называемая также стохастической, вероятностной или корреляционной).
При функциональной связи изменение независ. переменных приводит к получению точно определенных знач. завис. переменной.
При статистической связи каждому значению независ. переменной Х соотв. множество значений завис. переменной Y.
Т.о.,статистич.связь отл. от функциональной наличием действия на зависимую переменную большого числа факторов.
Корреляционной явл. статистич. связь между признаками, при кот. изменение значений независ. переменной Х приводит к закономерному изменению математического ожидания случайной величины Y.
Раздел статистической науки, занимающийся исследованием причинных связей между социально-экономическими явлениями и процессами, имеющими количественное выражение,- это корреляционно-регрессионный анализ.

9.Основные задачи прикладного корреляционно-регрессионного анализа.
Основными задачами корреляционного анализа явл. решение след. задач:
1)выявл. из большого числа факторов наиболее информативных, оказывающих более существ. воздействие на результативную величину (предварит. анализ, базирующийся на простейших методах выявл. зависимостей и экспертных оценках);
2) определение направления и количественной оценки тесноты завис-ти между факторной величиной Х и результативной Y (при этом факторных переменных может быть достаточно много, тогда определяется множественная корреляция);
3) нахождение математической функции, описывающей завис-ть результативного показателя Yот наиболее информативных факторных Х.
4) оценка качества полученной модели, определение возможной величины ошибки получаемых по этой модели прогнозных значений Y;
5) построение прогнозов.

10.Уравнение регрессии, его смысл и экономическая интерпретация.
Парная регрессия представляет собой регрессию между двумя переменными– y и x , т. е. модель вида: ^
y= f (x ) ,
где y – зависимая переменная(результативный признак); x – независимая, или объясняющая, переменная (признак-фактор). Знак «^» означает, что между переменными x и y нет строгой функциональной зависимости, поэтому практически в каждом отдельном случае величина y складываетсяиз двух слагаемых: ^
y= yх +ε ,
где y – фактическое значение результативного признака;
^
yх – теоретическое значение результативного признака, найденное исходя из уравнения регрессии; ε – случайная величина, характеризующая отклонения реального
значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина ε называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками:
спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака ^
y x , подходят к фактическим данным y .
Регрессия - величина, выражающая завис-ть среднего значения случ. величины у от значений случ .величины х.
Интерпретация моделей регрессии осущ-ся методами той отрасли знаний, к кот. относится исследуемое явление. Но всякая интерпретация начинается со статистической оценки уравн-ия регрессии в целом и оценки значимости входящих в модель факторных признаков.
Прежде всего необходимо рассмотреть коэффициенты регрессии. Чем больше величина коэфф-та регрессии, тем значительнее влияние данного признака на моделируемый.
Знаки коэфф. регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак +, то с увеличением данного фактора результативный признак возрастает; если факторный признак имеет знак -, то с его увеличением результативный признак уменьшается.

11.Выбор типа математической функции при построении уравнения регрессии.
Ур-ие регрессии – модель зависимости показателя результатов деятельности от влияющих на него факторов, выраженная в численной форме. Сложность его построения заключ. в том, что из всего многообразия функций необходимо выбрать такую, которая наиболее полно и точно будет описывать изучаемую зависимость. Этот выбор делается либо на основании теоретических знаний об изучаемом явлении, либо опыте предыдущих аналогичных исследовании, либо с пом. простого перебора и оценки функций разных типов.
Существуют разл. виды моделей функциональной зависимости. Наиболее распростр. - линейная, гиперболическая, квадратическая, степенная, показательная и экспоненциальная.
Исходным мат-лом для сост. уравнения явл. значения показателей x и y, полученные в результате наблюдения. На их основе составл-ся таблица, в кот. отражаются некоторые фактические значения фактора и соотв. им значениях результативного признака y.
Проще всего построить ур-ние парной регрессии. Оно имеет вид: y = ax+b. Параметр а - это свободный член. Параметр b – это коэфф-т регрессии. Он показывает, на какую величину в среднем изменяется результативный признак у при изменении факторного признака х на единицу.
Построение ур-я регрессии сводится к определению ее параметров. Они находятся с пом. МНК, кот. представляет собой решение системы нормальных уравнений. Если невозможно обеспечит равенство всех прочих условий при анализе влияния фактора, строят уравнение так называемой множественной регрессии. В этом случае в выбранную модель вводят другие факторные признаки, кот. должны отвечать следующ. параметрам: быть количественно измеримыми и находиться в функциональной зависимости. Тогда функция принимает вид:y = b+a1x1+a2x2+a3x3…anxn. Параметры этого уравнения находятся так же как и для уравнения парной регрес.
12.Парная регрессия.
Парной регрессией называется уравнение связи двух переменных у и х Вида y = f (x),где у – зависимая переменная (результативный признак); х – независимая, объясняющая переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Для оценки параметров регрессий, линейных по этим параметрам, используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений ŷx при тех же значениях фактора x минимальна, т. е.

13.Метод наименьших квадратов и условия его применения для определения параметров уравнения парной регрессии.
Рабочая формула МНК: У t+1 = а*Х + b, где t + 1 – прогнозный период; Уt+1 – прогнозируемый показатель; a и b - коэффициенты; Х - условное обозначение времени.
Расчет коэффициентов a и b осуществляется по следующим формулам:

где, Уф – фактические значения ряда динамики; n – число уровней временного ряда;
Сглаживание временных рядов методом НК служит для отражения закономерности развития изучаемого явления. В аналитическом выражении тренда время рассматривается как независимая переменная, а уровни ряда выступают как функция этой независимой переменной.
Развитие явления зависит не от того, сколько лет прошло с отправного момента, а от того, какие факторы влияли на его развитие, в каком направлении и с какой интенсивностью. Отсюда ясно, что развитие явления во времени выступает как результат действия этих факторов.
Правильно установить тип кривой, тип аналитической зависимости от времени – одна из самых сложных задач предпрогнозного анализа.
Подбор вида функции, описывающей тренд, параметры которой определяются методом наименьших квадратов, производится в большинстве случаев эмпирически, путем построения ряда функций и сравнения их между собой по величине среднеквадратической ошибки, вычисляемой по формуле:

где Уф – фактические значения ряда динамики; Ур – расчетные (сглаженные) значения ряда динамики; n – число уровней временного ряда; р – число параметров, определяемых в формулах, описывающих тренд (тенденцию развития).
Недостатки МНК:
при попытке описать изучаемое экономическое явление с помощью математического уравнения, прогноз будет точен для небольшого периода времени и уравнение регрессии следует пересчитывать по мере поступления новой информации;
сложность подбора уравнения регрессии, которая разрешима при использовании типовых компьютерных программ.

14.Нелинейные модели регрессии и их линеаризация.
Регрессии нелинейные по объясняющим переменным, но линейные по оценивающим параметрам – для расчета параметров нелинейной регрессии применяется метод наименьших квадратов, после предварительной процедуры линеаризации функции регрессии. Приводятся к линейным путем замены переменных. Нелинейная регрессия y = a + b*ln(x) приводится к линейной y = a + bx', где x' = ln(x).
Регрессии нелинейные по оценивающим параметрам:
нелинейные модели внутри линейных (приводятся к линейному виду);
нелинейные модели внутри нелинейных.
Для оценки параметров нелинейной модели используется два подхода:
линеаризация модели (с помощью преобразований исходных переменных исследуемую зависимость представляют в виде линейного соотношения);
методы нелинейной оптимизации (применяются когда подобрать линеаризирующее преобразование не получается).

15.Оценка степени тесноты связи между количественными переменными.
Связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции. По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.
Практически для количественной оценки тесноты связи широко используют линейный коэффициент корреляции. Иногда его называют просто коэффициентом корреляции. Если заданы значения переменных Х и У, то он вычисляется по формуле
Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.

16.Показатели корреляции: линейный коэффициент корреляции, индекс корреляции, теоретическое корреляционное отношение.
Коэффициент линейной корреляции отражает меру линейной зависимости между двумя переменными. Предполагается, что переменные измерены в интервальной шкале либо в шкале отношений.Если представить две переменные на координатном поле , то каждая пара значений будет отображать координаты точки в этом поле. Чем ближе точки к усредненной прямой, тем выше коэффициент корреляции Коэффициент корреляции будет положительным числом, когда при повышении X происходит повышение Y (прямопропорциональная связь), отрицательным при обратнопропорциональной связи
Индекс корреляции - нормированный показатель тесноты связи. Для линейной связи его значение равно коэффициенту корреляции.
Для нелинейных регрессионных моделей его значение используется для оценки значимости этих моделей по критерию Фишера.

17.Оценка статистической значимости показателей корреляции, параметров уравнения регрессии, уравнения регрессии в целом: t-критерий Стьюдента, F-критерий Фишера.

18.Спецификация модели.
Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели исходя из соответствующей теории связи между переменными. В первую очередь из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется один доминирующий фактор, который и используется в качестве объясняющей переменной.
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений.. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией.
Практически в каждом отдельном случае величина y складывается из двух слагаемых: yj=yxj+ ej
где yj – фактическое значение результативного признака; yxj –теоретическое значение результативного признака, найденное из уравнения регрессии; ej– случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Случайная величина ej, или возмущение, включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели обусловлено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных.
От правильно выбранной спецификации модели зависит величина случайных ошибок – они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным.

19.Понятие множественной линейной регрессии (МЛР).

20.Классическая линейная модель множественной регрессии (КЛММР). Оценка параметров ММЛР. Метод наименьших квадратов и метод максимального правдоподобия. Предпосылки метода наименьших квадратов.

21.Статистические свойства МНК-оценок параметров ММЛР (состоятельность, несмещенность, эффективность).
Статистические проверки параметров регрессии, показателей корреляции основаны на непроверяемых предпосылках распределения случайной составляющей . Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок (случайных остатков) тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными. Несмещенность оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям. Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Большой практический интерес представляют те результаты регрессии, для которых доверительный интервал ожидаемого значения параметра регрессии имеет предел значений вероятности, равный единице( вероятность получения оценки на заданном расстоянии от истинного значения параметра близка к единице. Указанные критерии оценок (несмещенность, состоятельность и эффективность) обязательно учитываются при разных способах оценивания. Метод наименьших квадратов строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии . Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, предст.собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии.

22.Стандартизованные коэффициенты регрессии, их интерпретация.
В множественной линейной регрессии относительными показателями силы связи являются стандартизованные коэффициенты регрессии. Они показывают силу влияния факторов на результат. Стандартизованные коэффициенты и коэффициенты условно чистой регрессии характеризуют одну и ту же модель, поэтому взаимосвязаны между собой. Коэффициент условно чистой регрессии показывает на сколько в среднем изменится результат при изменении фактора на 1 при фиксированном значении всех остальных факторов. Стандартизованные коэффициенты регрессии показывают на сколько своих среднеквадратических отклонений в среднем изменится результат при изменении фактора на одно среднеквадратическое отклонение при фиксированном уровне других факторов, включенных в модель регрессии.

23.Оценка качества модели множественной регрессии.
Проводится определением следующих величин:
1. Стандартные ошибки оценок
2. Доверительные интервалы коэффициентов , где γ – уровень значимости, n – число наблюдений, - табличное (критическое) значение t-критерия Стьюдента.
3. Значимость коэффициентов регрессии Проверяется по t-критерию Стьюдента:
4. Коэффициент детерминации R2 (см. для парной регрессии)
5. Скорректированный коэффициент детерминации Низкое значение R2 не свидетельствует о плохом качестве модели, и может объясняться наличием существенных факторов, не включенных в модель R2. всегда увеличивается с включением новой переменной. Поэтому рассчитывают скорректированный коэффициент детерминации
6. Стандартная ошибка регрессии Значения Se в однотипных моделях с разным числом наблюдений и (или) переменных сравнимы.
7. Значимость уравнения регрессии. Проверяется по F-критерию Фишера . Если F>Fтабл, то уравнение статистически значимо, иначе – незначимо. F-критерии в разных моделях с разным числом наблюдений и (или) переменных несравнимы.
8. Средняя абсолютная процентная ошибка (см. для парной регрессии)

24.Прогнозирование на основе регрессионных моделей.
Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками сложных систем. Получение регрессионной модели происходит в два этапа:
-подбор вида функции;
-вычисление параметров функции.
Чаще всего выбор производится среди следующих функций:
y=ax+b – линейная функция;
y=ax2+bx+c – квадратичная функция;
y=aln(x)+b – логарифмическая функция;
y=aebx - экспоненциальная функция;
y=axb - степенная функция.
Если Вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (a,b,c и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Для этого подходит метод наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у – координат всех экспериментальных точек от у – координат графика функции была бы минимальной.
Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос – вопрос критерия соответствия.
Получив регрессионную математическую модель мы можем прогнозировать процесс путем вычислений.
Два сп-ба прогнозов по регрессионной модели. Если прогноз производится в пределах экспериментальных знач.независ. переменной, то это называется восстановлением значения.
Прогнозирование за пределами экспериментальных данных называется экстраполяцией.
Имея регрессионную модель, легко прогнозировать, производя расчеты с помощью электронной таблицы.

25.Проблема гетероскедастичности.
Под гетероскедастичностью понимается предположение о том, что дисперсии случайных ошибок являются разными величинами для всех наблюдений, что означает нарушение второго условия нормальной линейной модели множественной регрессии:

Гетероскедастичность можно записать через ковариационную матрицу случайных ошибок модели регрессии:

Тогда можно утверждать, что случайная ошибка модели регрессии βi подчиняется нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2Ω:
εi~N(0; G2Ω),где Ω – матрица ковариаций случайной ошибки.
Если дисперсии случайных ошибок модели регрессии известны заранее, то проблема гетероскедастичности легко устраняется. Однако в большинстве случаев неизвестными являются не только дисперсии случайных ошибок, но и сама функция регрессионной зависимости y=f(x), которую предстоит построить и оценить.
Для обнаружения гетероскедастичности остатков модели регрессии необходимо провести их анализ. При этом проверяются гипотезы:
Основная гипотеза H0 предполагает постоянство дисперсий случайных ошибок модели регрессии, т. е. присутствие в модели условия гомоскедастичности:

Альтернативная гипотеза H1 предполагает непостоянство дисперсиий случайных ошибок в различных наблюдениях, т. е. присутствие в модели условия гетероскедастичности:
Гетероскедастичность остатков модели регрессии может привести к негативным последствиям:
1) оценки неизвестных коэффициентов нормальной линейной модели регрессии являются несмещёнными и состоятельными, но при этом теряется свойство эффективности;
2) существует большая вероятность того, что оценки стандартных ошибок коэффициентов модели регрессии будут рассчитаны неверно, что конечном итоге может привести к утверждению неверной гипотезы о значимости коэффициентов регрессии и значимости модели регрессии в целом.

26.Критерии обнаружения гетероскедастичности (критерий Парка, критерий Голфилда–Квандта).
Тест Голдфелда-Кванта применяется, когда есть предположение о прямой зависимости дисперсии ошибок от некоторого признака. Алгоритм метода:
Упорядочить данные по убыванию того признака, относительно которого сделано предположение;
Делим наблюдения на три части, причём они должны быть равны или примерно равны, а также первая и третья должны быть одинаковы.
Провести две независимые регрессии для первой части и для последней. Рассчитать выровненные значения и построить соответствующие остатки (YVYR)-Y:e1 и e2 ;
Cоставить cтатистику Фишера F=(€(e1)2 )/ (€(e2)2) Если F>Fкр, следовательно есть гетероскедостичность.
Тест Парка - статистический тест, используемый для проверки гетероскедастичности (определенного вида) случайных ошибок регрессионной (эконометрической) модели.
В данном тесте предполагается (альтернативная гипотеза) возможность зависимости дисперсии случайной ошибки модели от значений некоторого фактора следующего вида:

Нулевая гипотеза (отсутствие гетероскедастичности) состоит в равенстве коэффициента нулю. Отклонение этой гипотезы означает наличие гетероскедастичности указанного вида, принятие нулевой гипотезы означает, что гетероскедастичность данного вида отсутствует (что не исключает возможность наличия гетероскедастичности иного вида).
С помощью обычного МНК оценивается исходная регрессионная модель: и определяются остатки регрессии .
Далее также с помощью обычного МНК оценивается следующая вспомогательная регрессия:
и проверяется статистическая значимость коэффициента с помощью t-критерия Стьюдента или эквивалентного в данном случае F-теста на значимость вспомогательной регрессии в целом. Если коэффициент признается значимым, то случайные ошибки модели признаются гетероскедастичными, в противном случае гетероскедастичность данного вида считается незначимой (в этом случае следует использовать также и другие тесты для исключения возможной гетероскедастичности иного вида).

27.Автокорреляция остатков регрессионной модели. Проверка статистической гипотезы о наличии автокорреляции. Критерий Дарбина–Уотсона.
Рассматривая последов-сть остатков как временной ряд, можно построить график их зависимости от времени. В соотв.с предпосылками МНК остатки должны быть случайными. Однако нередко встречается ситуация, когда остатки содержат тенденцию или циклические колебания. Это - автокорреляция остатков.
Причины автокорреляция остатков:
1-я - связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.
2-я - явл. следствием неправильной спецификации модели. Сущ. два метода определения автокорреляции остатков:
1) построение графика завис-ти остатков от времени и визуальное определение наличия или отсутствия автокорреляции.
2) использование критерия Дарбина — Уотсона и расчет величины:
где y(t+1) и y(t) – последовательные знач. временного ряда.
Значение статистики Дарбина-Уотсона изменяется в диапазоне от 0 до 4. При этом d = 2 указывает на отсутствие автокорреляции элементов временного ряда. Если d <2, то имеет место положительная автокорреляции, а >2 - отрицательная.
Есть несколько существенных ограничений на применение критерия Дарбина — Уотсона:
1. Он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака, т.е. к моделям авторегрессии.
2. Методика расчета и использования критерия Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка.
3. Критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.
28.Анализ линейной модели множественной регрессии при наличии гетероскедастичности и автокорреляции.
Множественная линейная регрессия является обобщением парной линейной регрессии на случай, когда зависимая переменная гипотетически связана более чем с одной независимой переменной. Вследствие этого многие элементы анализа множественной линейной регрессии совпадают с элементами анализа парной регрессии (как то оценка дисперсии коэффициентов регрессии, проверка гипотезы об их значимости, вычисление коэффициента детерминации и т.д.)
Часто при построении модели приходится учитывать влияние на объект исследования сразу нескольких факторов. Линейная модель множественной регрессии выглядит следующим образом: Y = β0 + β1x1 + β2x2 + …+ βkxk + ε, где Y – зависимая переменная (результативный признак); x1,…,xk – независимые, или объясняющие переменные; β 0, β 1,…, β k – коэффициенты регрессии; ε – ошибка регрессии.
Общая последовательность построения множественной линейной регрессионной модели следующая: 1) Оценка параметров уравнения; 2) Оценка качества регрессии; 3) Проверка на мультиколлинеарность, ее исключение; 4) Проверка на гетероскедастичность, коррекция на гетероскедастичность; 5)Корректировка вида модели: тест на функциональную форму, тест Вальда; 6) Экономическая интерпретация.

29.Обобщенный метод наименьших квадратов (ОМНК).
ОМНК— метод оценки параметров регрессионных моделей, являющийся обобщением классич-го МНК. ОМНК сводится к минимизации «обобщённой суммы квадратов» остатков регрессии — , где — вектор остатков, — симметрическая положительно определенная весовая матрица. Обычный МНК явл. частным случаем обобщённого, когда весовая матрица пропорциональна единичной.
Обычно ОМНК называют частный случай, когда в качестве весовой матрицы используется матрица, обратная ковариационной матрице случайных ошибок модели.
Известно, что симметрическую положительно определенную матрицу можно разложить как , где P- некоторая невырожденная квадратная матрица. Тогда обобщённая сумма квадратов может быть представлена как сумма квадратов преобразованных (с пом. P) остатков . Для линейной регрессии это означает, что минимизируется величина:
где, то есть фактически суть обобщённого МНК сводится к линейному преобразованию данных и применению к этим данным обычного МНК. Если в качестве весовой матрицы исп. обратная ковариационная матрица случайных ошибок (то есть ), преобразование P приводит к тому, что преобр. модель удовлетворяет классическим предположениям (Гаусса-Маркова), следоват-но оценки параметров с пом. обычного МНК будут наиболее эффективными в классе линейных несмещенных оценок. Поскольку параметры исходной и преобразов-й модели одинаковы, то следует утверждение — оценки ОМНК являются наиболее эффективными в классе линейных несмещенных оценок (теорема Айткена). Формула ОМНК имеет вид:
Ковариационная матрица этих оценок равна:

30.Мультиколлинеарности экзогенных переменных, ее причины и признаки.
Мультиколлинеарность — линейная взаимосвязь двух или нескольких объясняющих переменных
2 вида мультиколлинеарности:
1) Строгая Мультиколлинеарность – наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой)
2) Нестрогая мультиколлинеарность – наличие сильной линейной кореляционой связи между независимыми переменными (иногда также и зависимой)
Мультиколлинеарность возникает когда :
1. Ошибочное включение в уравнение двух или более линейно зависимых переменных
2. Две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными.
3. В модель включается переменная, сильно коррелирующая с зависимой переменной (такая независимая переменная называ Признаки мультиколлинеарности: неправильные с экономической точки зрения знаки оценок регрессии; неоправданно большие значения оценок; высокие R2 и F-статистика, но некоторые (или все) коэффициенты незначимы (имеют низкие t-статистики); высокие парные коэффициенты корреляции; высокие частные коэффициенты корреляции; добавление или удаление наблюдений из выборки сильно изменяют значения оценок.



Обсудить на форуме

Комментарии к статье:

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Регистрация

Реклама

Последние комментарии