Reklama

Регрессионный анализ и планирование эксперимента

При пассивном опыте исследователь не имеет способности повлиять на изучаемый объект. Вследствие того, что на значение выходного параметра кроме входного фактора оказывает влияние фактор случайности. Эта зависимость не является совершенно точно определенной и в простом виде может быть представлена аддитивной математической моделью:

, (14.1)

где Е – случайные отличия.

Если экспериментальные данные нанести на график, то значимость (у) от (х) будет диффузной (расплывчатой). Такая не полностью определенная зависимость именуется регрессионной, а зависимость приведенного вида представляет собой регрессию. Линия, лучшим образом разглаживающая зависимость средних значений именуется уравнением регрессии. Регрессия – это закон конфигурации условного математического ожидания выходной величины зависимо от конфигурации входной величины. Для линейного варианта уравнение регрессии имеет вид:

, (14.2)

где α – коэффициенты регрессии.

Задачка исследования механизма явления считается решенной, если найдена регрессионная модель и оценены статистические свойства случайных отклонений. Регрессионная модель является приближенной оценкой настоящей многофункциональной зависимости. Регрессионную модель принято записывать в виде:

, (14.3)

где - оценки рассчитанных коэффициентов.

Регрессионная модель – это аналитическое описание полосы регрессии. Если экспериментальные данные нанести на график, то полосы регрессии можно аппроксимировать прямой, участком синусоиды, параболы, эллипса и т.п. Огромную трудность при подборе вида аппроксимирующих функций оказывает разброс экспериментальных данных относительно предполагаемой кривой. Этот разброс определяется фактором случайности на выходной параметр.

Когда зависимости плохо интерпретируемы, употребляют резвые и обыкновенные графические способы, к примеру, способ контура, способ медианных центров.

Способ меньших квадратов (МНК) – более серьезный способ подбора эмпирических зависимостей – является общей частью корреляционного и регрессионного анализов, задачка которых получение коэффициентов уравнения регрессии.

Как корреляционный, так и регрессионный анализы состоят из 2-ух частей: расчет коэффициентов уравнения регрессии способом МНК и статистическая оценка результатов. Если МНК можно использовать при всех статистических данных, распределенных по хоть какому закону плотности вероятности, то дать статистическую оценку приобретенным коэффициентам и уравнению регрессии можно только на базе определенных теоретических предпосылок. Корреляционный и регрессионный анализы различаются теоретическими предпосылками, т.е. методами статистической оценки.

Задачка корреляционного анализа – исследование тесноты корреляционной связи меж случайными переменными процесса и получение коэффициентов уравнения регрессии. Теснота корреляционной связи исследуется методом вычисления коэффициентов парной и множественной корреляции, обоюдной и автокорреляционных функций.

Для непрерывных случайных переменных обоюдная корреляционная функция меж случайными переменными определяется формулой:

(14.4)

На практике обычно употребляют дискретные замеры через равные промежутки времени, а интеграл подменяют суммой.

Расчет корреляционной функции является очень трудозатратной операцией, потому употребляют ЭВМ. Есть отлично переработанные программки расчета корреляционных функций. Обоюдные корреляционные функции употребляются в теории планирования опыта для учета динамики в объектах с непрерывными технологическими процессами. На рисунке приведен пример обычной обоюдной корреляционной функции.

Рис. 14. 1 Вид обоюдной корреляционной функции.

По расположению максимума этой функции на оси времени определяется время эквивалентного запаздывания. Физический смысл этого понятия заключается в том, что всякий скачок функции на входе объекта более много отражается на выходе из него только через определенный просвет времени.

Данный принцип применяется в устройствах измерения скорости потока меточными способами, к примеру, с внедрением солевых смесей.

В теории опыта используют также автокорреляционные функции. По ним оценивают величину промежутков времени меж примыкающими измерениями входного сигнала. Эти промежутки именуются временем корреляции.

. (14.5)

Статистические аспекты являются правилами, которые позволяют делать статистические выводы о свойствах характеристик генеральной совокупы с принятым уровнем значимости. Для этой цели обширно используют аспекты Стьюдента, Пирсона, Фишера.

Теоретические предпосылки внедрения методики корреляционного анализа:

· все входные и выходные случайные переменные должны подчиняться многомерному нормальному закону рассредотачивания вероятности;

· все случайные процессы должны быть стационарными, т.е. их средние значения и дисперсии не должны значительно изменяться во времени;

· все выходные случайные переменные не должны быть функционально связаны меж собой;

· отдельные измерения по каждой их входных переменных должны быть статистически независящими;

· все входные переменные должны измеряться с пренебрежимо малой ошибкой, значительно наименьшей шумового поля.

Перечисленные требования являются довольно жесткими ограничениями, но в ряде всевозможных случаев все они же удовлетворяются. Условия многомерного обычного рассредотачивания случайных переменных сузивают область внедрения корреляционного анализа, потому они используются только для получения линейных математических моделей.

Задачки регрессионного анализа - исследование тесноты статистической связи меж входными и выходными случайными переменными при помощи регрессионных уравнений и коэффициентов. В простом случае получают двумерное регрессионное уравнение, в каком участвует только одна переменная.

Регрессионный анализ позволяет решать более широкий класс задач, чем корреляционный анализ, и получать оценки коэффициентов нелинейности уравнений регрессии.

Теоретические предпосылки для регрессионного анализа являются наименее жесткими:

· случайные помехи обязаны иметь обычный закон рассредотачивания;

· дисперсии выхода во всех точках факторного места должны быть однородными;

· все примыкающие измерения по каждой входной переменной должны быть независящими;

· случайные помехи на выходе объекта в каждом опыте должны быть независимы друг от друга, также от значений входных переменных и коэффициентов уравнений регрессии.

Таким макаром, при регрессионном анализе не требуется, чтоб все входные переменные были распределены нормально.

При экспериментальном исследовании объекта качество приобретенных результатов и произведенные издержки определяются организацией опыта. В связи с этим, кроме исследования действенных способов обработки экспериментальных данных, нужно улучшить сам опыт по последующим характеристикам: числу учитываемых входных причин, интервалам варьирования и числу уровней варьирования причин, сочетанием их и последовательностью проведения опытов.

При проведении опыта нужно включать в рассмотрение все причины, которые могут оказывать влияние на выходной параметр. В процессе опыта поочередно можно устанавливать несколько значений уровней причин. Таковой опыт именуется полным факторным тестом (ПФЭ). Опыт, в каком встречаются не все вероятные сочетания уровней причин, именуется дробным факторным тестом (ДФЭ).

Если причины варьируются на (р) уровнях, то число опытов для ПФЭ будет , где к – число причин. Потому выбор сочетаний уровней причин, их числа и порядка постановки опытов является целью планирования опыта.

Ортогональным именуется план с попарно ортогональными вектор-столбцами матрицы планирования. Внедрение аспекта ортогональности имеет целью упрощение вычислений и получение независящих оценок коэффициентов. При всем этом подмена хоть какого коэффициента в модели не изменяет оценок других коэффициентов.

В ряде всевозможных случаев реальные объекты имеют нелинейные зависимости. Один из нередко встречающихся видов нелинейности связан с эффектом взаимодействия, когда значение 1-го фактора находится в зависимости от значения другого фактора. Для того, чтоб отыскать оценку коэффициента при парном содействии, нужно, пользуясь правилом перемножения столбцов, получить столбец произведения 2-ух причин.

На рисунке представлена матрица планирования опыта с варьированием 2-ух причин по двум уровням («+» - верхний уровень, «-» – нижний уровень сигнала).

№ опыта

у

1

2

3

4

+

+

+

+

+

-

+

-

+

+

-

-

+

-

-

+

С учетом эффекта взаимодействия математическая модель запишется последующим образом:

, (14.6)

. (14.7)

Столбцы () и () задают планирование, и по ним конкретно определяются условия опытов, а столбцы (- фиктивная переменная) и () служат только для расчета.

· Матрица планирования должна владеть последующими качествами: симметрией т.е. сумма частей столбца каждого фактора должна быть равна нулю относительно центра опыта (центра меж уровнями);

· нормальностью, т.е. сумма квадратов частей каждого столбца должна быть равна числу опытов;

· ротабельностью, т.е. равенством точности пророчества значений отклика на равных расстояниях от центра опыта.

При увеличении числа входных причин общее число опытов в ПФЭ резко возрастает. При построении линейных моделей имеется возможность сокращения числа опытов за счет утраты инфы, несущественной для данного вида моделей.

Пользуясь таким планированием, можно вычислить четыре коэффициента для рассматриваемого примера. Если имеется основание считать, что эффект парного взаимодействия отсутствует, то последний столбец можно представить в виде варьирования нового фактора . Тогда оценка коэффициентов, удовлетворяющих МНК, определяются по выражениям:

; ; ; . (14.8)

Потому чтов данном плане как взаимодействие , то оценка 4-ого коэффициента является смешанной. Поставив только четыре опыта для оценки воздействия 3-х причин, была применена только половина всех вероятных для данного примера вариантов. На основании данного примера можно прийти к выводу о том, что с целью уменьшения числа опытов часть причин целенаправлено разнообразить как взаимодействие.

Разрешающей способностью таковой полуреплики именуют число независящих переменных, входящих в определенный контраст. Дробные высказывания обширно используются при получении линейных моделей. Необходимость их растет по мере роста числа причин. Если план обладает избыточностью опытов для нахождения оценок коэффициентов регрессионного уравнения, то он именуется насыщенным.

При увеличении числа рассматриваемых причин для уменьшения числа тестов можно пользоваться и другими особыми способами, к примеру, планом в виде латинского квадрата, греко-латинского квадрата и др. Планы второго порядка употребляют для нахождения коэффициентов нелинейных моделей второго порядка.

Reklama