ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР ИССЛЕДОВАТЕЛЬСКИЕ ИСПЫТАНИЯ ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА. ГОСТ 24026-80 ГОСУДАРСТВЕННЫЙ
КОМИТЕТ СССР Москва
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Постановлением Государственного комитета СССР по стандартам от 06.03.80 № 1035 срок введения установлен с 01.01.81 Настоящий стандарт устанавливает термины и определения основных понятий в области исследовательских испытаний, относящихся к разделу планирования эксперимента. Термины, установленные настоящим стандартом, обязательны для применения в нормативно-технической документации, учебниках, учебных пособиях, технической и справочной литературе в области планирования эксперимента. Для каждого понятия установлен один стандартизованный термин. Встречающиеся в литературе термины-синонимы приведены в стандарте как недопустимые и обозначены пометкой «Ндп». Для отдельных терминов приведены краткие формы, которые разрешается применять в случаях, исключающих возможность их различного толкования. Стандартизованные термины набраны полужирным шрифтом, краткая форма - светлым, а нерекомендуемые - курсивом. В случаях, когда существенные признаки понятия содержатся в буквальном значении термина, определение не приведено и соответственно в графе «определение» поставлен прочерк. В стандарте приведен алфавитный указатель содержащихся в нем терминов. В справочном приложении даны примеры и пояснения к некоторым терминам.
АЛФАВИТНЫЙ УКАЗАТЕЛЬ
ПРИЛОЖЕНИЕ Справочное ПОЯСНЕНИЯ К ТЕРМИНАМ К термину «Эксперимент» (п. 1) В теории планирования эксперимента часто определяют эксперимент как совокупность условий и результатов проведения серий опытов. К термину «План эксперимента» (п. 3) Формально план часто можно представить в виде последовательности векторов , и=1, 2, . . . , n, где n - число опытов в плане, а компоненты „ определяют условия каждого опыта. К термину «Планирование эксперимента» (п. 4) В широком смысле слова планирование эксперимента - научная дисциплина, занимающаяся разработкой и изучением оптимальных программ проведения экспериментальных исследований. К термину «Фактор» (п. 5) В большинстве моделей, используемых в планировании эксперимента, предполагается, что факторы могут рассматриваться как детерминированные переменные. Обычно факторы выражаются в безразмерных единицах масштаба и обозначаются буквами xi, i = 1, 2, . . ., k. Совокупность факторов изображается вектором = . Здесь и далее векторы обозначаются малыми полужирными буквами, матрицы - большими полужирными. 1 Символ «Т» обозначает операцию транспортирования. К термину «Уровень фактора» (п. 6) Факторы могут различаться по числу уровней, на которых возможно их фиксировать в данной задаче. Фактор, варьируемый на р уровнях, называют р-уровневым фактором. К термину «Основной уровень фактора» (п. 7) Основной уровень фактора, обозначаемый , где индекс i относится к номеру фактора, служит для фиксирования в области планирования таких условий эксперимента, которые представляют наибольший интерес для исследователя в данный момент, и относится к определенному плану эксперимента. К термину «Нормализация факторов» (п. 8) За единицу масштаба безразмерной системы координат принимается некоторый интервал в натуральных единицах. При нормализации фактора наряду с изменениями масштаба изменяется начало отсчета. Значение i-го фактора в безразмерной системе связано со значением этого фактора в натуральной системе (в именованных единицах) формулой
где - основной уровень фактора, принимаемый за начало отсчета; - интервал в натуральных единицах масштаба, соответствующий одной единице масштаба в безразмерных переменных. С геометрической точки зрения нормализация факторов равноценна линейному преобразованию пространства факторов, при котором производится перенос начала координат в точку, отвечающую основным уровням, и сжатие-растяжение пространства в направлении координатных осей. К термину «Априорное ранжирование факторов» (п. 9) Метод основан на упорядочении экспертами множества факторов по убыванию (или возрастанию) их важности, суммирование рангов факторов и выборе факторов путем рассмотрения суммарного ранжирования. К термину «Размах варьирования фактора» (п. 10) Указывает границы области варьирования данного фактора в данном эксперименте. К термину «Интервал варьирования фактора» (п. 11) Интервал или шаг варьирования фактора, обозначаемый , для фактора с номером i служит для перехода от натурального масштаба к безразмерному. Вместе с основным уровнем он задает область действия для данного плана, т. е. область действия есть ± или иначе (+;-). К термину «Эффект взаимодействия факторов» (п. 12) В полиномиальном уравнении регрессии эффект взаимодействия выражается параметром при членах, включающих произведения факторов. Различаются парные взаимодействия вида хi хj, тройные вида хi хj xk и более высокого порядка. К термину «Факторное пространство» (п. 13) Размерность факторного пространства равна числу факторов k. Каждой точке факторного пространства соответствует вектор = . К термину «Область экспериментирования» (п. 14) Если область планирования задается интервалами возможного изменения факторов, она представляет собой гиперпараллелепипед (в частном случае куб). Иногда область планирования задается гиперсферой. К термину «Функция отклика» (п. 19) Функция отклика выражается соотношением
или . Функция отклика связывает между собой математическое ожидание отклика , совокупность факторов, выражаемую вектором , и совокупность параметров модели, определяемую вектором . Параметры модели априори неизвестны и подлежат определению из эксперимента. На функцию отклика могут переноситься определения, связанные с моделью, например, линейная (по параметрам), полиномиальная, квадратичная и т. д. К термину «Поверхность отклика» (п. 22) Поверхность отклика имеет размерность k и размещена в (k+1)-мерном пространстве. К термину «Параллельные опыты» (п. 26) Параллельные опыты служат для получения выборочной оценки дисперсии воспроизводимости результатов эксперимента. К термину «Временной дрейф» (п. 27) Дрейф обычно связывают с изменением во времени каких-либо характеристик функции отклика (параметров, положения экстремальной точки и т. п.). Различают детерминированный и случайный дрейфы. В первом случае процесс изменения параметров (или иных характеристик функции отклика) описывается детерминированной (обычно степенной) функцией времени. Во втором случае изменение параметров - случайный процесс. Если дрейф аддитивный, то поверхность отклика смещается во времени, не деформируясь (при этом дрейфует только свободный член функции отклика, т. е. член, не зависящий от значений факторов). При неаддитивном дрейфе поверхность отклика во времени деформируется. Цель планирования в условиях аддитивного дрейфа исключить влияние дрейфа на оценки эффектов факторов. При дискретном дрейфе это удается сделать путем разбиения эксперимента на блоки. При непрерывном дрейфе используют планы эксперимента, ортогональные к дрейфу, описываемому степенной функцией известного вида. В задачах экспериментальной оптимизации в условиях дрейфа функции отклика применяют методы адаптационной оптимизации, к которым относятся метод эволюционного планирования и последовательный симплексный метод. К термину «Модель регрессионного анализа» (п. 28) Модель регрессионного анализа выражается соотношением , где - случайная ошибка. Для некоторого и-го наблюдения имеем , Наиболее простые предположения о случайных величинах eи состоят в том, что их математические ожидания равны нулю E{eи}=0, дисперсии постоянны , а ковариации равны нулю E{eи ev}=0, и¹v. Последние условия соответствуют равноточности и некоррелированности наблюдений. К термину «Модель регрессионного анализа, линейная по параметрам» (п. 29) Линейная по параметрам модель регрессионного анализа представима в форме
где b1 - параметры модели, i = l, 2, . . . , т; - известные базисные функции переменных (факторов), не зависящие от параметров модели. Линейная модель может быть записана более лаконично
или
где -вектор-строка базисных функций (базисная вектор-функция) , b - вектор параметров модели
К термину «Модель регрессионного анализа первого порядка» (п. 31) Модель первого порядка может содержать свободный член - дополнительный параметр; при этом обозначать параметры модели индексами, начиная с нуля
Иногда при обозначении модели первого порядка используется фиктивная переменная, тождественно равная единице: x0=1. С учетом этого обозначения модель может быть записана в виде суммы
К термину «Модель регрессионного анализа второго порядка» (п. 32) Модель регрессионного анализа второго порядка для факторов в общем случае содержит параметров. Параметры модели чаще всего нумеруют не подряд от 1 до , а начиная с нуля и в соответствии с индексами независимых переменных, на которые умножаются параметры. Наиболее распространенная форма записи квадратичной модели следующая
К термину «Модель дисперсионного анализа» (п. 33) Модель вида
где х1 - дискретные переменные, обычно целочисленные (часто хi, либо 0, либо 1). Наиболее простые предположения о случайных величинах те же, что и для модели регрессионного анализа. Неизвестные параметры дисперсионной модели могут быть детерминированными или случайными величинами. В первом случае, модель называют моделью с постоянными факторами или моделью 1. Модель, в которой все параметры bi (может быть за исключением одного) являются случайными величинами, называется моделью со случайными факторами или моделью II. В промежуточных случаях модель называется смешанной. К термину «Адекватность математической модели» (п. 34) Для проверки адекватности модели часто используют F-критерий Фишера. К термину «Коэффициент регрессии» (п. 35) Под коэффициентом регрессии обычно понимают параметры регрессионной модели, линейной по параметрам. Их чаще всего обозначают буквой b. К термину «Блок плана» (п. 36) Чтобы исключить воздействие на оценки эффектов факторов каких-либо источников неоднородности, план разбивают на блоки. Различают полноблочные планы, в которых в каждом блоке реализуется одна и та же совокупность опытов, и неполноблочные, когда блоки состоят из различных комбинаций опытов. Неполноблочные планы бывают сбалансированными и частично-сбалансированными (сбалансированные неполные блок-схемы и частично-сбалансированные неполные блок-схемы соответственно). К термину «Точка плана» (п. 37) Точке плана с номером и в факторном пространстве отвечает вектор
К термину «Центральная точка плана» (п. 38) Набор основных уровней всех факторов образует вектор-точку в факторном пространстве, которая и называется центральной точкой плана:
К термину «Матрица плана» (п. 42) Матрица плана имеет размеры (N´k), она может иметь совпадающие строки; (i, j) - элемент матрицы плана равен уровню j-го фактора в i-м опыте. К термину «Матрица спектра плана» (п. 43) Все строки матрицы спектра плана различны, ее размеры (n´k), где n - число точек в спектре плана. К термину «Матрица дублирования» (п. 44) Матрица дублирования имеет вид
Примечание. План эксперимента может быть задан либо матрицей плана, либо матрицей спектра плана в совокупности с матрицей дублирования. К термину «Матрица базисных функций модели» (п. 45) Матрица базисных функций модели состоит из N строк т столбцов. Элементами i-й строки такой матрицы являются значения базисных функции в i-м опыте. Матрица базисных функций имеет вид
К термину «Усеченная матрица базисных функций модели» (п. 46) Усеченная матрица базисных функций модели содержит набор различающихся между собой строк матрицы Х, следовательно она имеет размеры (п´т)
К термину «Матрица моментов плана» (п. 47) Это определение справедливо при обычных предположениях регрессионного анализа (о равноточности и некоррелированности наблюдений отклика). Матрица моментов имеет размеры (m´m) и может быть выражена
или
В общем случае при неравноточных и коррелированных откликах матрица моментов может быть выражена: , где Dy - ковариационная матрица вектора наблюдений. К термину «Информационная матрица плана» (п. 48) Матрица моментов, каждый элемент которой поделен на число опытов в плане. К термину «Полный факторный план» (п. 49) Факторный план характеризуется наличием ряда факторов, каждый из которых варьируется на двух или более уровнях. Многие типы планов можно интерпретировать как частные случаи факторных планов. К термину «Дробный факторный план» (п. 50) Различают регулярные и нерегулярные дробные факторные планы (дробные реплики). Регулярность реплики означает сохранение в ее структуре некоторых важных характеристик полного плана, например, симметрии и ортогональности. К термину «План взвешивания» (п. 53) Название связано с операцией взвешивания предметов на одночашечных (безмены) или двухчашечных весах. Рассматривается случай, когда действие факторов можно считать аддитивным. К термину «Симплекс-план» (п. 54) Симплекс-план может быть изображен в факторном пространстве в виде полного набора вершин k-мерного симплекса. К термину «Латинский квадрат» (п. 57) Если обозначить число символов через S, то латинский квадрат - это такая структура, где S символов расположены в S2 ячейках. Символы располагаются в S строках и S столбцах так, что каждый символ встречается один и только один раз в каждой строке и в каждом столбце. К термину «Латинский куб первого порядка»(п. 58) Если обозначить число символов через S, то латинский куб это такая структура, где S символов расположены в S3 ячейках. Они располагаются в S квадратах из S строк и S столбцов так, что каждый символ встречается одинаковое число раз в квадрате. К термину «Критерий оптимальности плана» (п. 59) К числу важнейших критериев относят: а) критерий D-оптимальности - это мера эффективности плана, сформулированная на языке свойств информационной матрицы плана. Пусть М=ХT×X - матрица моментов плана, а МN = ХT×X - информационная матрица плана. Здесь N - общее число опытов в плане, Х - матрица базисных функций для заданной модели и фиксированного плана, ХT - транспонированная матрица X. Удовлетворение требования D-оптимальностп означает минимизацию определителя матрицы ( матрица, обратная информационной матрице МN) на множестве элементов хij матрицы плана, т. е. min det . Здесь хij - элемент i-й строки и j-го столбца матрицы плана, i=l, 2, . . . , N, j=1, . . . , k (k - число факторов). Wх - область экспериментирования. det - обозначение операции вычисления определителя матрицы. D - оптимальный план минимизирует на множестве допустимых планов обобщенную дисперсию оценок коэффициентов регрессии; б) критерий А-оптимальности - это мера эффективности плана, сформулированная на языке свойств информационной матрицы плана. Пусть М=ХT×X - матрица моментов плана, а МN = ХT×X - информационная матрица плана. Здесь N - общее число опытов в плане, Х - матрица базисных функций для заданной модели и фиксированного плана, ХT - транспонированная матрица X. Удовлетворение требования A-оптимальности означает минимизацию следа матрицы на множестве элементов хij матрицы плана, т. е. min Sp , . где Sp - обозначение операции вычисления следа матрицы; хij - элемент i-й строки и j-го столбца матрицы плана, (i=l, 2, . . . , N, j=1, 2, . . . , k); Wх - область экспериментирования. А-оптимальный план минимизирует на множестве допустимых планов среднюю дисперсию оценок коэффициентов регрессии. В настоящее время используется свыше 20 различных критериев оптимальности планов. К термину «Ротатабельность плана» (п. 61) Планирование является ротатабельным, если матрица моментов плана инвариантна к ортогональному вращению координат. К термину «Насыщенность плана» (п. 63) Различают ненасыщенные планы, когда разность равна нулю, и перенасыщенные (сверхнасыщенные) планы, когда разность отрицательна. К термину «Метод случайного баланса» (п. 64) Случайный баланс использует нерегулярную дробную реплику от полного факторного плана, задающую сверхнасыщенный план для модели, включающий линейные эффекты и парные воздействия. Обработка данных основывается на методах статистического оценивания и некоторых эвристических соображениях. К термину «Эволюционное планирование» (п. 65) Существуют различные модификации ЭВОП: обычное ЭВОП (ЭВОП Бокса), последовательный симплексный метод, квадратичное вращаемое ЭВОП и т. п. К термину «Дисперсионный анализ» (п. 69) К количественным относятся такие факторы, как температура, давление, вес и т. п. примеры качественных факторов - тип прибора, вид материала, сорт зерна и т. п. Если количественный фактор принимает в эксперименте небольшое число различных значений, то его можно рассматривать как качественный. В такой ситуации применима техника дисперсионного анализа. |