|
ГОСТ Р ИСО 3534-1-2019
ОКС 01.040.03; 03.120.30
Дата введения 2020-01-01
Предисловие
1 ПОДГОТОВЛЕН Закрытым акционерным обществом "Научно-исследовательский центр контроля и диагностики технических систем" (ЗАО "НИЦ КД") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 125 "Применение статистических методов"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 5 сентября 2019 г. N 636-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 3534-1:2006* "Статистика. Словарь и условные обозначения. Часть 1. Общие статистические термины и термины, используемые в теории вероятностей" (ISO 3534-1:2006 "Statistics - Vocabulary and symbols - Part 1: General statistical terms and terms used in probability", IDT).
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. - Примечание изготовителя базы данных.
Международный стандарт разработан Техническим комитетом ISO/TC 69.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5)
5 ВЗАМЕН ГОСТ Р 50779.10-2000 (ИСО 3534-1-93)
Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
Введение
В настоящем стандарте использован минимальный уровень математической абстракции, при котором возможно введение последовательных, корректных и лаконичных определений. Термины, представленные в настоящем стандарте, являются основополагающими в теории вероятностей и статистике, вследствие чего они имеют несколько усложненное математическое представление. Работа с другими стандартами по прикладной статистике предполагает обращение к настоящему стандарту для уточнения определений соответствующих терминов, по этой причине некоторые определения представлены менее формально и сопровождены примечаниями и примерами. Данное неформальное представление не заменяет собой формальных определений, но позволяет работать с приведенными терминами и определениями пользователям с различными уровнями подготовки в области теории вероятностей и математической статистики. Примечания и примеры позволяют настоящему стандарту быть более доступным для пользователей.
Корректное и полное определение терминов, используемых в теории вероятностей и математической статистике, важно для разработки и эффективного применения стандартов, содержащих статистические методы. Определения, представленные в настоящем стандарте, являются достаточно точными и имеют необходимый уровень математического представления, что дает возможность разработчикам стандартов на статистические методы избежать неопределенности в представлении информации. Более детальное представление содержания излагаемых концепций и сферы их применения приведено в литературе по теории вероятностей и математической статистике.
В приложениях представлены схемы для каждой группы терминов: 1) общие статистические термины (приложение В) и 2) термины, используемые в теории вероятностей (приложение С). Приведены шесть диаграмм для общих статистических терминов и четыре диаграммы для терминов, связанных с теорией вероятностей. Некоторые термины включены в несколько диаграмм, что обеспечивает связь между представленными концепциями. Приложение D содержит краткое введение в методологию концептуальных диаграмм и их интерпретацию.
Использованные схемы позволяют выявлять взаимосвязи терминов. Они также полезны при переводе терминов на другие языки.
Большая часть терминов и определений, представленных в настоящем стандарте, если не указано иное, дана для одномерного случая без упоминания этого предположения. Это позволяет избежать многократных указаний на размерность в большинстве определений.
Область применения________________
Разделу не присвоен номер для сохранения идентичности настоящего стандарта.
Настоящий стандарт устанавливает общие статистические термины и термины, используемые в теории вероятностей, которые могут быть использованы при разработке других стандартов.
Приведенные в настоящем стандарте термины подразделены:
a) на общие статистические термины (раздел 1);
b) термины, используемые в теории вероятностей (раздел 2).
Приложение А содержит перечень обозначений и сокращений, используемых в настоящем стандарте.
Термины и определения, представленные в настоящем стандарте, упорядочены в соответствии со схемами, приведенными в приложениях В и С.
1 Общие статистические термины
|
|
|
1.1 (генеральная) совокупность: Множество всех рассматриваемых единиц.
|
en
|
population
|
|
fr
|
population
|
Примечание 1 - Совокупность может состоять из реальных объектов и быть конечной, может состоять из реальных объектов и быть бесконечной или может быть полностью гипотетической. Иногда используют термин "конечная совокупность", особенно в ситуациях, связанных с получением конечных выборок. Подобным образом термин "бесконечная совокупность" используют в случае выборки из континуума. В главе 2 совокупность рассматривается в вероятностном контексте как пространство элементарных событий (2.1).
Примечание 2 - Гипотетическая совокупность позволяет делать различные предположения о природе ожидаемых данных. Таким образом, гипотетическая совокупность полезна на стадии статистических исследований, особенно при выборе подходящего объема выборки. Гипотетическая совокупность может состоять из конечного или бесконечного числа элементов. Ее использование особенно полезно при работе с аналитическими статистиками в статистических исследованиях.
Примечание 3 - Область применения исследований определяет свойства совокупности. Например, если для демографического или медицинского исследования выбраны три населенных пункта, то генеральная совокупность состоит из жителей данных конкретных населенных пунктов. Однако если эти три населенных пункта выбраны случайным образом среди всех населенных пунктов заданного региона, то совокупность состоит из всех жителей данного региона.
|
|
|
1.2 выборочная единица: Одна из конкретных единиц, из которых состоит генеральная совокупность (1.1).
|
en
|
sampling unit
|
Примечание - В зависимости от обстоятельств единицей может быть человек, семья, учебное заведение, административное подразделение и т.д.
|
fr
|
-
nage
|
1.3 выборка: Подмножество генеральной совокупности (1.1), состоящее из одной выборочной единицы (1.2) или более.
|
en
|
sample
|
Примечание 1 - В зависимости от рассматриваемой генеральной совокупности выборочными единицами могут быть предметы, числовые значения или даже абстрактные объекты.
Примечание 2 - Определение выборки, приведенное в ИСО 3534-2, включает пример схемы отбора выборки, которая необходима при отборе случайной выборки из конечной совокупности.
|
fr
|
|
1.4 наблюдаемое значение: Значение исследуемой характеристики, полученное в результате единичного наблюдения.
|
en
|
observed value
|
Примечание 1 - Часто используемые синонимы данного понятия - это "реализация" и "данная величина". Множественное число от понятия "данная величина" - данные.
Примечание 2 - Определение не указывает на происхождение или способ получения данного значения. Значение может представлять только одну реализацию случайной величины (2.10), но это не является общей ситуацией. Последующему статистическому анализу может быть подвергнута одна из нескольких реализаций случайной величины. Несмотря на то что соответствующие выводы требуют некоторого статистического обоснования, ничто не препятствует вычислительной обработке или графическому представлению наблюдаемых значений. Только при появлении таких вопросов, как определение вероятности появления конкретного набора реализаций случайной величины, применение статистических методов обработки данных становится уместным и важным. Предварительный этап изучения наблюдаемых значений, как правило, относят к анализу данных.
|
fr
|
valeur
|
1.5 описательная статистика: Краткое представление наблюдаемых значений (1.4) в графическом, численном или ином виде.
|
en
|
descriptive statistics
|
Пример 1 - Численные сводки включают выборочное среднее (1.15), выборочный размах (1.10), выборочное стандартное отклонение (1.17) и т.д.
Пример 2 - Примеры графических представлений включают "ящики с усами", диаграммы, графики "квантиль-квантиль", графики нормального квантиля, диаграммы рассеяния, множественные диаграммы рассеяния и гистограммы.
|
fr
|
statistique descriptive
|
1.6 случайная выборка: Выборка (1.3), отобранная методом случайного отбора.
|
en
|
random sample
|
________________
Случайный отбор - метод образования выборки из генеральной совокупности, при котором для каждого элемента генеральной совокупности существует предполагаемая вероятность попасть в выборку.
Примечание 1 - Данное определение имеет меньше ограничений, чем приведенное в ИСО 3534-2, которое допускает наличие бесконечной генеральной совокупности.
Примечание 2 - Когда выборка из выборочных единиц отобрана из конечного пространства элементарных событий (2.1), каждая из возможных комбинаций выборочных единиц имеет свою вероятность (2.5) быть отобранной. Для выборочных планов данных опроса конкретная вероятность каждой возможной комбинации может быть вычислена заранее.
Примечание 3 - Для выборочных планов данных опроса, составляемых для конечного пространства элементарных событий, случайная выборка может быть отобрана с помощью различных планов отбора выборки, таких как планы отбора стратифицированной случайной выборки, систематической случайной выборки, групповой выборки, выборки с вероятностью отбора пропорционально величине вспомогательной переменной, а также с помощью различных других планов.
Примечание 4 - Как правило, определение относят к фактическим наблюдаемым значениям (1.4). Эти наблюдаемые значения считают реализациями случайных величин (2.10), и каждое наблюдаемое значение соответствует одной случайной величине. Если оценки (1.12), статистические критерии для проверки статистических гипотез (1.48) и доверительные интервалы (1.28) получены на основе случайной выборки, определение дополняют ссылкой на случайные величины, возникающие в большей степени на основе абстрактных объектов выборки, чем на основе фактически наблюдаемых значений этих случайных величин.
Примечание 5 - Случайные выборки из бесконечной генеральной совокупности часто генерируют путем многократного отбора из пространства элементарных событий таким образом, что выборка состоит из независимых одинаково распределенных случайных величин в соответствии с интерпретацией данного определения, приведенной в примечании 4.
|
fr
|
|
1.7 простая случайная выборка: Случайная выборка (1.6) из конечной генеральной совокупности, такая, что всем подмножествам заданного объема соответствует одна и та же вероятность быть отобранными.
|
en
|
simple random sample
|
Примечание - Данное определение гармонизировано с определением, приведенным в ИСО 3534-2, хотя и имеет немного отличную формулировку.
|
fr
|
simple
|
1.8 статистика: Полностью определенная функция случайных величин (2.10).
|
en
|
statistic
|
|
fr
|
statistique
|
Примечание 1 - Для случайной выборки (1.6), понимаемой в смысле примечания 4 к 1.6, статистика представляет собой функцию случайных величин.
Примечание 2 - В соответствии с примечанием 1, если - случайная выборка из нормального распределения (2.50) с неизвестным математическим ожиданием (2.35) и неизвестным стандартным отклонением (2.37) , то выражение представляет собой статистику, называемую выборочным средним (1.15), тогда как выражение не является статистикой, так как включает неизвестное значение параметра (2.9) .
Примечание 3 - Приведенное определение является формальным и соответствует трактовке, используемой в математической статистике. В приложениях многочисленные статистические данные, в частности статистики, могут иметь отношение к различным областям технических знаний, включающим анализ действий, представленный в международных стандартах ISO/TC 69.
|
|
|
1.9 порядковая статистика: Статистика (1.8), определяемая порядковым номером случайной величины (2.10) в ряду случайных величин, расположенных в неубывающем порядке.
|
en
|
order statistic
|
Пример - Пусть выборка состоит из наблюдаемых значений (1.4): 9, 13, 7, 6, 13, 7, 19, 6, 10 и 7. Наблюдаемые значения в порядке неубывания: 6, 6, 7, 7, 7, 9, 10, 13, 13, 19. Эти значения являются реализациями порядковых статистик , ..., .
Примечание 1 - Пусть наблюдаемые значения (1.4), составляющие случайную выборку (1.6), образующие множество , при сортировке в неубывающем порядке обозначены следующим образом: . Тогда представляют собой наблюдаемые значения порядковой статистики , а - наблюдаемое значение -й порядковой статистики.
Примечание 2 - На практике определение порядковых статистик для набора данных сводится к сортировке данных, как формально описано в примечании 1. Отсортированные данные применяют для определения полезных сводных статистик, как представлено в нескольких следующих определениях.
Примечание 3 - Порядковая статистика представляет собой выборочное значение, соответствующее его позиции в последовательности данных после их ранжирования в неубывающем порядке. Как показано в примере, легче понять сортировку выборочных значений (реализаций случайных величин), чем сортировку ненаблюдаемых случайных величин. Тем не менее можно представлять случайные величины из случайной выборки (1.6), упорядоченной в неубывающем порядке. Например, максимальное значение набора из случайных величин может быть изучено заранее на основе его реализованного значения.
Примечание 4 - Отдельная порядковая статистика представляет собой полностью заданную функцию случайной величины. Эта функция является идентификатором положения или ранга случайной величины в отсортированном наборе случайных величин.
Примечание 5 - Потенциальную проблему представляет ранжирование совпадающих значений, особенно для дискретных случайных величин и для значений, полученных с низкой точностью. Формулировка "неубывающий порядок" точнее, чем "возрастающий порядок", при учете всех тонкостей процесса ранжирования данных. Необходимо акцентировать внимание на том, что совпадающие значения сохраняют при обработке данных, а не заменяют одним значением. В примере, представленном выше, две реализации, "6" и "6", представляют собой совпадающие значения.
Примечание 6 - Упорядочивание выполняют на основе фактических значений, а не на основе абсолютных значений случайных величин.
Примечание 7 - Полный набор порядковых статистик составляет случайную величину размерности , где - число наблюдений в выборке.
Примечание 8 - Компоненты порядковой статистики также рассматривают как порядковые статистики, но снабженные спецификатором, указывающим их номер в упорядоченной последовательности значений в выборке.
Примечание 9 - Минимальное и максимальное значения, а также при нечетном объеме выборки выборочная медиана (1.13) представляют собой частные случаи порядковых статистик. Например, для выборки объема 11 единиц, - минимум, - максимум и - выборочная медиана.
|
en
|
statistique d’ordre
|
1.10 выборочный размах: Разность между значениями наибольшей и наименьшей порядковых статистик (1.9).
|
en
|
sample range
|
Пример - Для примера, рассмотренного в 1.9, выборочный размах, полученный на основе наблюдений, равен 19-6=13.
Примечание - В статистическом управлении процессами выборочный размах часто используют для отслеживания дисперсии процесса, особенно при относительно небольших объемах выборки.
|
fr
|
|
1.11 середина размаха: Среднее арифметическое (1.15) наименьшей и наибольшей порядковых статистик (1.9).
|
en
|
mid-range
|
Пример - В примере, рассмотренном в 1.9, середина размаха на основе наблюдений равна (6+19)/2=12,5.
Примечание - Середина размаха дает быструю и простую оценку середины небольших наборов данных.
|
fr
|
milieu de
|
1.12 оценка: статистика (1.8), используемая для оценивания (1.36) параметра .
|
en
|
estimator
|
|
fr
|
estimateur
|
Примечание 1 - Оценкой может быть выборочное среднее (1.15) при определении оценки математического ожидания (2.35) генеральной совокупности, которое может быть обозначено . Для такого распределения (2.11), как нормальное распределение (2.50), естественной оценкой математического ожидания генеральной совокупности является выборочное среднее.
Примечание 2 - При определении оценок характеристик генеральной совокупности [например, моды (2.27) для одномерного распределения (2.16)] подходящей оценкой может быть функция оценки(ок) параметра распределения или сложная функция случайной выборки (1.6).
Примечание 3 - Термин "оценка" использован в широком смысле. Он включает в себя как точечную, так и интервальную оценки параметра, которые могут быть использованы для прогнозирования (иногда их рассматривают как прогностические факторы). Оценка также может включать в себя такие функции, как ядерные оценки и другие специальные статистики. Дополнительная информация приведена в примечаниях к 1.36.
|
|
|
1.13 выборочная медиана: Значение -й порядковой статистики (1.9) при нечетном объеме выборки (см. ИСО 3534-2:2006, 1.2.26); значение суммы -й и -й порядковых статистик, деленной на два, при четном объеме выборки .
|
en
|
sample median
|
Пример - В примере, приведенном в 1.9, значение 8 представляет собой реализацию выборочной медианы. В этом случае (четный объем выборки равен 10) 5-е и 6-е значения составили 7 и 9, их среднее равно 8. На практике это заносят в отчет в виде "выборочная медиана равна 8", хотя, строго говоря, выборочная медиана является случайной величиной.
Примечание 1 - Для случайной выборки (1.6) объема случайные величины (2.10), которые расположены в неубывающем порядке от 1 до , выборочная медиана - это -я случайная величина в случае нечетного объема выборки. При четном объеме выборки выборочная медиана равна среднему арифметическому -й и -й случайных величин.
Примечание 2 - Упорядочивание случайных величин, для которых наблюдения отсутствуют, может казаться невозможным. Тем не менее в рамках работы с порядковыми статистиками данный анализ может быть произведен. На практике получают наблюдаемые значения и, сортируя эти значения, реализации порядковых статистик. Данные реализации могут быть проинтерпретированы исходя из структуры порядковых статистик случайной выборки.
Примечание 3 - Выборочная медиана является оценкой середины распределения, с каждой стороны от которой лежит половина выборки.
Примечание 4 - На практике выборочная медиана полезна как оценка, не чувствительная к наличию в выборке сильно удаленных крайних значений. Например, в обзорах в качестве "среднего дохода" и "средней цены на жилье" часто указывает медиану.
|
fr
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1.14 выборочный момент порядка ; : Сумма -х степеней случайных величин (2.10) случайной выборки (1.6), деленная на число наблюдений в выборке (1.3).
|
en
|
sample moment of order k
|
Примечание 1 - Для случайной выборки объема , т.е. для , выборочный момент порядка , - это
.
Примечание 2 - Кроме того, данное понятие можно характеризовать как начальный выборочный момент порядка .
Примечание 3 - Выборочный момент порядка 1, представленный в следующем определении, является выборочным средним (1.15).
Примечание 4 - Хотя определение дано для произвольного , на практике, как правило, рассматривают следующие значения : 1 [выборочное среднее (1.15)], 2 [связано с выборочной дисперсией (1.16) и выборочным стандартным отклонением (1.17)], 3 [связано с выборочным коэффициентом асимметрии (1.20)] и 4 [связано с выборочным коэффициентом эксцесса (1.21)].
Примечание 5 - Использование буквы "" в записи связано с тем, что с этой буквы начинается английская запись понятий "ожидаемое значение" ("expected value") и "ожидание" ("expectation").
|
fr
|
moment d’ordre k
|
1.15 выборочное среднее; среднее арифметическое: Сумма случайных величин (2.10) случайной выборки (1.6), деленная на число слагаемых в этой сумме.
|
en
|
sample mean (average, arithmetic mean)
|
Пример - В примере, приведенном в 1.9, значение выборочного среднего составляет 9,7, т.к. сумма наблюдаемых значений равна 97, а объем выборки равен 10.
Примечание 1 - Рассматриваемое как статистика выборочное среднее представляет собой функцию случайных величин из случайной выборки в смысле, указанном в примечании 3 к 1.8. Необходимо отличать функцию от численного значения выборочного среднего, вычисленного на основе наблюдаемых значений (1.4) случайной выборки.
Примечание 2 - Рассматриваемое как статистика выборочное среднее часто используют как оценку математического ожидания (2.35) генеральной совокупности. Часто используемым синонимом является арифметическое среднее.
Примечание 3 - Для случайной выборки объема , т.е. для , выборочное среднее - это
.
Примечание 4 - Выборочное среднее является моментом первого порядка.
Примечание 5 - Для выборки объема, равного двум, выборочное среднее, выборочная медиана (1.13) и середина размаха (1.11) совпадают.
|
fr
|
moyenne (moyenne, moyenne )
|
1.16 выборочная дисперсия; : Сумма квадратов отклонений случайных величин (2.10) случайной выборки (1.6) от их выборочного среднего (1.15), деленная на число слагаемых в этой сумме минус один.
|
en
|
sample variance
|
|
|
|
Пример - Для примера, приведенного в 1.9, значение выборочной дисперсии составляет 17,57. Сумма квадратов отклонений от выборочного среднего равна 158,10; данная сумма поделена на число 9, что составляет объем выборки 10 минус один.
Примечание 1 - Рассматриваемая как статистика (1.8) выборочная дисперсия является функцией случайных величин случайной выборки. Данную статистику (1.12) следует отличать от численного значения выборочной дисперсии, вычисленной на основе наблюдаемых значений (1.4) случайной выборки. Это численное значение называют эмпирической выборочной дисперсией или наблюдаемой выборочной дисперсией и обычно обозначают .
Примечание 2 - Для случайной выборки объема , т.е. для , с выборочным средним , выборочная дисперсия - это
.
Примечание 3 - Выборочная дисперсия - это статистика, которая "почти" совпадает со средним арифметическим квадратных отклонений случайных величин (2.10) от их выборочного среднего (так как сумму делят не на , а на ). Использование дает несмещенную оценку (1.34) дисперсии генеральной совокупности (2.36).
Примечание 4 - Величину называют числом степеней свободы (2.54).
Примечание 5 - Выборочная дисперсия является вторым выборочным моментом случайных величин нормализованной выборки (1.19).
|
fr
|
variance
|
1.17 выборочное стандартное отклонение; : Неотрицательное значение квадратного корня из выборочной дисперсии (1.16).
|
en
|
sample standard deviation
|
Пример - Для примера, приведенного в 1.9, значение выборочного стандартного отклонения составляет 4,192, т.к. полученная выборочная дисперсия составляет 17,57.
Примечание 1 - На практике выборочное стандартное отклонение используют для определения оценки стандартного отклонения (2.37). также является случайной величиной (2.10), а не значением, полученным по реализации случайной выборки (1.6).
Примечание 2 - Выборочное стандартное отклонение является мерой разброса распределения (2.11).
|
fr
|
-type
|
1.18 выборочный коэффициент вариации: Выборочное стандартное отклонение (1.17), деленное на выборочное среднее (1.15).
|
en
|
sample coefficient of variation
|
Примечание - Как и в случае коэффициента вариации (2.38), полезность этой статистики ограничена генеральными совокупностями, содержащими положительные значения. Величину выборочного коэффициента вариации обычно представляют в процентах. На практике выборочный коэффициент вариации, как правило, применяют, когда вариация возрастает пропорционально среднему.
|
fr
|
coefficient de variation
|
1.19 стандартизованная выборочная случайная величина: Разность случайной величины (2.10) и ее выборочного среднего (1.15), деленная на выборочное стандартное отклонение (1.17).
|
en
|
standardized sample random variable
|
Пример - Для примера, приведенного в 1.9, полученное выборочное среднее составляет 9,7, а полученное выборочное стандартное отклонение - 4,192; таким образом, полученные значения стандартизованной выборки составляют: -0,17; 0,79; -0,64; -0,88; 0,79; -0,64; 2,22; -0,88; 0,07; -0,64.
Примечание 1 - Стандартизованную выборочную случайную величину следует отличать от ее теоретического аналога - стандартизованной случайной величины (2.33). Целью стандартизации случайной величины является ее преобразование в случайную величину с нулевым математическим ожиданием и стандартным отклонением, равным единице; данное преобразование проводят для простоты интерпретации и сравнения данных.
Примечание 2 - Стандартизованные наблюдаемые значения имеют нулевое наблюдаемое среднее и наблюдаемое стандартное отклонение, равное единице.
|
fr
|
variable
|
1.20 выборочный коэффициент асимметрии: Среднее арифметическое стандартизованных выборочных случайных величин (1.19) случайной выборки (1.6) в третьей степени.
|
en
|
sample coefficient of skewness
|
Пример - Для примера, приведенного в 1.9, получен выборочный коэффициент асимметрии 0,97188. Для такого объема выборки (n=10) выборочный коэффициент асимметрии имеет высокую изменчивость, поэтому требует осторожности при использовании. Применение альтернативной формулы, представленной в примечании 1, дает значение 1,34983.
Примечание 1 - Определению соответствует следующая формула:
.
Некоторые программы статистической обработки данных с целью корректировки смещения (1.33) используют для вычисления выборочного коэффициента асимметрии следующую формулу:
,
где .
При больших объемах выборок разность значений этих двух оценок пренебрежимо мала. Отношение несмещенной оценки к смещенной для 10 составляет 1,389, для 100-1,031 и для 1000.
Примечание 2 - Асимметрия характеризует симметричность распределения. Близкие к нулю значения данной статистики указывают на то, что рассматриваемое распределение очень близко к симметричному, тогда как ненулевые значения соответствуют тому, что, вероятно, существуют случайные всплески значений по одну сторону от центра распределения. Асимметричность данных также отражает различие в значениях выборочного среднего (1.15) и выборочной медианы (1.13). Положительная асимметрия (правосторонняя асимметрия) данных указывает на возможное наличие нескольких экстремально больших значений. Подобным образом отрицательная асимметрия указывает на возможное наличие нескольких экстремально малых значений.
Примечание 3 - Выборочный коэффициент асимметрии является третьим выборочным моментом стандартизованной выборочной случайной величины (1.19).
|
fr
|
coefficient
|
1.21 выборочный коэффициент эксцесса; выборочный эксцесс: Среднее арифметическое стандартизованных выборочных случайных величин (1.19) случайной выборки (1.6).
|
en
|
sample coefficient of kurtosis
|
Пример - Для примера, приведенного в 1.9, получен выборочный коэффициент эксцесса 2,67419. Для выборки такого же объема, как и в данном примере, выборочный коэффициент эксцесса (n=10) имеет высокую изменчивость, поэтому при использовании требуется осторожность. Программные пакеты статистической обработки позволяют варьировать настройки при вычислении выборочного коэффициента эксцесса (см. примечание 3 к 2.40). При использовании альтернативной формулы, приведенной в примечании 1, вычисленное значение составляет 0,43605. Два полученных значения, 2,67419 и 0,43605, непосредственно не сопоставимы. Для их сравнения рассматривают разность 2,67419-3 (3 вычитают для сопоставления с эксцессом нормального распределения), которая равна -0,32581, эту величину можно сравнивать с 0,43605.
Примечание 1 - Определению соответствует следующая формула:
.
В некоторых программных пакетах статистической обработки данных с целью корректировки смещения (1.33) и определения отклонения от эксцесса нормального распределения выборочный коэффициент эксцесса вычисляют по следующей формуле:
,
где ;
Второй член формулы при достаточно больших приближается к значению 3. Иногда эксцессом считают выражение, приведенное в 2.40, минус 3 для сопоставления с эксцессом нормального распределения. Специалист, работающий с программами статистической обработки данных, может регулировать соответствующие настройки.
Примечание 2 - Эксцесс характеризует тяжесть хвостов унимодального распределения. Для нормального распределения (2.50) с учетом вариабельности выборки выборочный коэффициент эксцесса приблизительно равен 3. На практике эксцесс нормального распределения представляет собой эталонное или базовое значение. Распределения (2.11), у которых значение эксцесса менее 3, имеют более легкие хвосты, чем хвосты нормального распределения; распределения (2.11), у которых значение эксцесса более 3, имеют более тяжелые хвосты, чем у нормального распределения.
Примечание 3 - Для наблюдаемых значений эксцесса, значительно превосходящих 3, существует вероятность того, что хвосты рассматриваемого распределения значимо тяжелее, чем хвосты нормального распределения. Выборка может содержать наблюдения из другого источника или ошибочные записи.
Примечание 4 - Выборочный коэффициент эксцесса является 4-м выборочным моментом стандартизованных выборочных случайных величин.
|
fr
|
coefficient d’aplatissement
|
1.22 выборочная ковариация; : Сумма произведений отклонений пар случайных величин (2.10) случайной выборки (1.6) от их выборочных средних (1.15), деленная на число слагаемых минус единица.
|
en
|
sample covariance
|
Пример 1 - Наблюдаемые значения представляют собой десять групп упорядоченных чисел, по три числа в каждой группе. Для настоящего примера использованы только первые два числа группы (x, y).
Таблица 1 - Результаты наблюдений для примера 1
|
fr
|
covariance
|
i
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
|
x
|
38
|
41
|
24
|
60
|
41
|
51
|
58
|
50
|
65
|
33
|
|
|
y
|
73
|
74
|
43
|
107
|
65
|
73
|
99
|
72
|
100
|
48
|
|
|
z
|
34
|
31
|
40
|
28
|
35
|
28
|
32
|
27
|
27
|
31
|
|
|
|
|
|
Выборочное среднее для X составляет 46,1, а для Y составляет 75,4. Соответствующая выборочная ковариация равна:
[(38-46,1)·(73-75,4)+(41-46,1)·(74-75,4)+...+(33-46,1)·(48-75,4)]/9=257,178.
Пример 2 - В таблице, представленной в первом примере, рассматривают значения y и z. Выборочное среднее для Z составляет 31,3. Соответствующая выборочная ковариация равна:
[(73-75,4)·(34-31,3)+(74-75,4)·(74-31,3)+...+(48-75,4)·(31-31,3)]/9=-54,356.
Примечание 1 - Рассматриваемая как статистика (1.8) выборочная ковариация представляет собой функцию пар случайных величин случайной выборки объема в смысле примечания 3 к 1.6. Данную статистику (1.12) следует отличать от численного значения выборочной ковариации, вычисленной по наблюденным парам значений выборочных единиц (1.2) случайной выборки. Числовое значение, как правило, называют эмпирической выборочной ковариацией или наблюдаемой выборочной ковариацией.
Примечание 2 - В соответствии с определением выборочная ковариация имеет вид:
.
Примечание 3 - Деление на позволяет получить несмещенную оценку (1.34) ковариации (2.43) генеральной совокупности.
Примечание 4 - В примере, данные для которого представлены в таблице 1, приведены три переменные несмотря на то, что в определении говорится о парах переменных. На практике стандартными являются ситуации, в которых присутствует несколько переменных.
|
|
|
|
|
|
1.23 выборочный коэффициент корреляции; : Выборочная ковариация (1.22), деленная на произведение соответствующих выборочных стандартных отклонений (1.17).
|
en
|
sample correlation coefficient
|
Пример 1 - В примере 1, приведенном в 1.22, стандартное отклонение составляет 12,948 для X и 21,329 для Y. Поэтому полученный выборочный коэффициент корреляции (для X и Y) равен:
257,178/(12,948·21,329)=0,9312.
Пример 2 - В примере 2, приведенном в 1.22, стандартное отклонение составляет 21,329 для Y и 4,165 для Z. Поэтому выборочный коэффициент корреляции (для Y и Z) равен:
-54,356/(21,329·4,165)=-0,612.
Примечание 1 - В соответствии с определением выборочный коэффициент корреляции имеет следующий вид:
.
Данное выражение представляет собой отношение выборочной ковариации к квадратному корню из произведения стандартных отклонений. Иногда символ используют для обозначения выборочного коэффициента корреляции. Наблюдаемый выборочный коэффициент корреляции основан на реализациях , , ..., соответствующих случайных величин.
Примечание 2 - Наблюдаемый выборочный коэффициент корреляции может принимать значения в промежутке [-1, 1], при этом значения, близкие к 1, указывают на сильную положительную корреляцию, а значения, близкие к -1, - на сильную отрицательную корреляцию. Выборочный коэффициент корреляции показывает степень близости к линейной зависимости между переменными со значениями -1 или 1 в случае линейной зависимости, значения, близкие к 0, указывают на слабую линейную зависимость.
|
fr
|
coefficient de
|
1.24 стандартная ошибка; : Стандартное отклонение (2.37) оценки (1.12) .
|
en
|
standard error
|
|
fr
|
erreur type
|
Пример - Если выборочное среднее (1.15) является оценкой математического ожидания (2.35) генеральной совокупности и - стандартное отклонение одной случайной величины (2.10), то стандартная ошибка выборочного среднего равна | |