МИНИСТЕРСТВО
ПРИРОДНЫХ РЕСУРСОВ И ЭКОЛОГИИ Федеральная служба по гидрометеорологии и
мониторингу
МЕТОДЫ ПРОГНОЗИРОВАНИЯ ИЗМЕНЕНИЯ
СОДЕРЖАНИЯ Ростов-на-Дону 2011 Предисловие 1 РАЗРАБОТАНЫ Государственным учреждением Гидрохимический институт (ГУ ГХИ) 2 РАЗРАБОТЧИКИ О.А. Клименко, канд. хим. наук; В.Ф. Геков, канд. тех. наук; О.В. Сергеева; В.А. Максимова (ГУ «Нижегородский ЦГМС-Р») 3 СОГЛАСОВАНЫ с ГУ «НПО «Тайфун» 24.02.2011 и УМЗА Росгидромета 11.04.2011 4 УТВЕРЖДЕНЫ Заместителем Руководителя Росгидромета 12.04.2011 5 ЗАРЕГИСТРИРОВАНЫ ГУ «НПО «Тайфун» за номером РД 52.24.755-2011 от 22.04.2011 6 ВВЕДЕНЫ ВПЕРВЫЕ СОДЕРЖАНИЕ Р 52.24.755-2011 РЕКОМЕНДАЦИИ МЕТОДЫ ПРОГНОЗИРОВАНИЯ ИЗМЕНЕНИЯ
СОДЕРЖАНИЯ Дата введения - 2011-05-25 1 Область примененияНастоящие рекомендации распространяются на методы прогнозирования изменения содержания загрязняющих веществ в водных объектах во времени по результатам систематических гидрохимических наблюдений и предназначены для наблюдательных подразделений управлений и центров по гидрометеорологии и мониторингу окружающей среды Федеральной службы по гидрометеорологии и мониторингу окружающей среды, осуществляющих организацию и проведение наблюдений за состоянием поверхностных вод суши, а также оценку изменения качества воды водных объектов во времени. Настоящие рекомендации могут быть использованы и в других заинтересованных организациях и учреждениях Росгидромета. 2 Нормативные ссылкиВ настоящих рекомендациях имеются ссылки на следующие документы: РД 52.24.622-2001 Методические указания. Проведение расчетов фоновых концентраций химических веществ в воде водотоков Р 52.24.627-2007 Рекомендации. Усовершенствованные методы прогностических расчетов распространения по речной сети зон высокозагрязненных вод с учетом форм миграции наиболее опасных загрязняющих веществ. 3 Термины и определения3.1 В настоящих рекомендациях применены следующие термины с соответствующими определениями: 3.1.1
3.1.2
3.1.3
3.1.4
3.1.5 ингредиент: Вещество или показатель, входящие в состав наблюденных характеристик водного объекта. 3.1.6
3.1.7
3.1.8
3.1.9 створ водотока (реки): Условное поперечное сечение водотока, используемое для оценок и прогноза качества воды. 3.2 В настоящих рекомендациях приняты следующие сокращения: БПК5 - биохимическое потребление растворенного кислорода содержащимися в воде органическими веществами в течение пяти суток; ГСН - государственная сеть наблюдений; ГУ УГМС - государственное учреждение «Управление по гидрометеорологии и мониторингу окружающей среды»; ГУ ЦГМС - государственное учреждение «Центр по гидрометеорологии и мониторингу окружающей среды»; ГХЦГ - гексахлорциклогексан; ДДТ - дихлордифенилтрихлорэтан; ЗВ - загрязняющее вещество; КПХ - каталог постоянных характеристик; ПДК - предельно допустимая концентрация; ПК - персональный компьютер; ПКН - перечень координатных номеров; СПАВ - синтетические поверхностно активные вещества; ХПК - химическое потребление кислорода. 4 Общие положения4.1 В настоявших рекомендациях рассмотрены методы прогнозирования изменения содержания ЗВ во времени на основе накопленной ретроспективной информации о режиме химических веществ и показателей качества воды водного объекта в местах (точках) систематических гидрохимических наблюдений. Ранее опубликованные работы [1], [2], и Р 52.24.627, посвященные методам оперативного прогнозирования изменения химического состава воды в водных объектах, были направлены, главным образом, на прогнозирование появления возможных опасных уровней загрязнения воды на контролируемых участках водных объектов в связи со стационарным и нестационарным поступлением ЗВ со сточными водами и водами притоков. 4.2 Используя результаты ретроспективных и текущих систематических гидрохимических наблюдений в створах, вертикалях и горизонтах, контролируемых ГУ УГМС (ГУ ЦГМС), на основе анализа закономерностей изменения содержания ЗВ во времени выбирают методы прогнозирования, а также заблаговременность прогноза изменения содержания этих веществ. 4.3 Для осуществления прогнозирования изменения во времени содержания ЗВ в водных объектах по результатам систематических наблюдений рекомендуется привлекать максимум накопленной ретроспективной и текущей информации по гидрохимическим и гидрологическим показателям. 4.4 С помощью разработанного программного комплекса, являющегося неотъемлемым приложением к данным рекомендациям, имеющуюся информацию о результатах наблюдения на водном объекте переносят в специализированную базу данных, на основе которой разрабатывают прогнозы изменения во времени значений отдельных интересуемых химических веществ и показателей качества воды. 4.5 Целью прогнозирования является определение на расчетный период (сутки, декада, месяц, год) ожидаемых осредненных концентраций заданных химических веществ с указанием возможного доверительного интервала их варьирования. 4.6 Результат прогноза следует считать неоправдавшимся, если по результатам наблюдения за расчетный период будет получена осредненная концентрация рассматриваемого вещества, выходящая за пределы указанного в результате прогноза доверительного интервала ее варьирования. В конце года или другого специально оцениваемого периода оправдываемость совокупности составленных за этот период прогнозов η, %, может быть рассчитана по формуле где nпр - число оправдавшихся прогнозов; Nпр - общее число прогнозов. Расчеты по формуле (1) целесообразно проводить за периоды с общим числом прогнозов десять и более. 4.7 По материалам и алгоритмам, приведенным в разделах 5 - 7, разработан программный комплекс для ПК - «ГХМ-прогноз», который является неотъемлемой частью настоящих рекомендаций. В приложении А представлена инструкция для пользователей данного программного комплекса. В приложении Б приведены примеры прогнозирования изменения содержания ЗВ в водных объектах во времени. 5 Организация специализированной базы данных для проведения прогнозирования изменения содержания ЗВ в водных объектах во времени5.1 Общие замечания5.1.1 База данных - это совокупность сведений относящихся к определенной задаче, организованная таким образом, чтобы обеспечить удобное представление этой совокупности, как в целом, так и любой ее части. Создаваемая для решения задач прогнозирования изменения содержания химических веществ в водных объектах по результатам систематических гидрохимических и гидрологических наблюдении специализированная база данных представляет собой множество взаимосвязанных таблиц, каждая из которых содержит информацию об объектах определенного типа. 5.1.2 Для выполнения прогнозирования с помощью программных средств, всю совокупность требуемой информации можно разделить на следующие виды: - справочная информация - это виды информации, которые редко изменяются (а если изменяются, то только в сторону добавления и расширения характеристик), и используются в основном для краткого представления сведений как некоторых цифровых кодов; - основные данные - измеренные значения физико-химических и химических свойств воды водного объекта, на основе которых и осуществляется прогнозирование; - вспомогательные данные - данные, описывающие и идентифицирующие основной вид информации, например, по географическому положению. Представление данных в задачах прогнозирования как базы данных позволяет систематизировать информацию по ее назначению, обеспечивать подготовку и надежное хранение структурированной информации в соответствии с текущими задачами. 5.2 Требования к содержанию и структуре специализированных баз данных5.2.1 В настоящее время в качестве системы управления, хранения и обработки гидрохимических данных в ГУ УГМС (ГУ ЦГМС) применяется программный комплекс «ГидрохимПК» (далее «ГидрохимПК»). База данных в этом комплексе имеет специальную структуру и недоступна для непосредственного просмотра в обычном текстовом редакторе. В связи с этим для обмена информации с другими базами такого же типа разработана стандартизованная структура текстового файла для данных и линейная структура для КПХ. Дополнительно в данном комплексе для функционирования базы данных применяется еще два текстовых файла, являющихся справочниками кодов ингредиентов и признаков качества измерений. Файл базовых данных в «ГидрохимПК» сформирован по пробам воды, которые характеризуются местом и временем отбора пробы, причем время отбора указано с точностью до минуты. Такая структура файла с указанием точного времени проведенного отбора проб воды существенно затрудняет дополнение первоначально зарегистрированных результатов наблюдения новыми значениями ингредиентов. Кроме того, при представлении данных, скомпонованных в виде проб воды, автоматизированное восполнение пробелов в наблюдениях становится невозможным. Учитывая, что для задач прогнозирования время измерения значений ингредиентов можно указывать не точнее, чем текущие сутки, и при обработке данных имеет значение только временной ряд ингредиента без разделения на пробы, целесообразно работать с упрощенной структурой данных, представленной в более простой форме - в виде строк, где приводятся значения ингредиента и характеризующие его параметры. 5.2.2 В целом разрабатываемые специализированные базы данных, предназначены для целей сохранения на диске подготовленных для прогнозирования результатов наблюдений в виде следующих текстовых файлов: - справочник кодов ингредиентов; - справочник характеристик качества измерений; - справочник признаков значений; - перечень координатных номеров (ПКН); - результаты гидрохимических наблюдений. Результаты гидрохимических наблюдений для использования в прогнозировании могут быть подготовлены в четырех видах: а) как выборка из «ГидрохимПК» в формате файла обмена; б) в виде специально подготовленных в «Microsoft Excel» (входящего в состав MS Office) таблиц с ежедневными расходами или значениями температуры речной воды (если таковые имеются) по данным наблюдений в ближайших створах гидрологических наблюдений (в створах гидропостов), в формате «*.xls»; в) в виде специально подготовленных в «Microsoft Excel» таблиц с результатами систематических гидрохимических наблюдений в формате «*.xls»; г) подготовленные выборки исходных данных в рассматриваемой внутренней базе данных программы прогнозирования с расширением «*.dan». 5.2.3 Подготовленные для выполнения прогнозирования данные рекомендуется хранить в формате с расширением «*.dan». Следует отметить, что используемые данные могут быть сформированы из данных, полученных в близлежащих створах, контролируемых с различной частотой отбора проб воды, но при условии использования методов химического анализа с равноточной чувствительностью. 5.2.4 Используемый в специализированной базе данных справочник кодов ингредиентов по содержанию и кодировке аналогичен справочнику кодов ингредиентов в «ГидрохимПК». Однако, такой справочник в «ГидрохимПК» представлен в кодировке 866 DOS Cyrillic, для рассматриваемой же системы прогностических оценок - в кодировке 1251 Cyrillic Windows. Имя файла справочника кодов ингредиентов - «kod_ingr.win». Содержание файла справочника кодов ингредиентов приведено в таблице 1. Таблица 1 - Справочник кодов ингредиентов, используемых в специализированной базе данных результатов гидрохимических наблюдений
Имя файла справочника характеристик качества измерений - «kach.win». Содержание файла справочника характеристик качества измерений, приведено в таблице 2. Таблица 2 - Характеристики качества измерений
5.2.6 Включенный в специализированную базу данных справочник признаков представляет собой перечень характеристик, учитывающих степень пригодности исходных данных для прогнозирования, а также их коды. Имя файла справочника признаков значений - «prizn.win». Состав справочника приведен в таблице 3. Таблица 3 - Характеристика признака значения ингредиента
5.2.7 Файл перечня координатных номеров должен содержать описания, характеризующие створы отбора проб воды в водном объекте и соответствующие им координатные номера. Следует отметить, что массивы данных измерений концентраций веществ, температуры и расхода воды могут быть получены разными ведомствами, имеющими свои системы характеристик мест наблюдения. Это не позволяет применять каталоги поисковых характеристик (КПХ), которые используют в настоящее время в базе данных в системе Росгидромета. Файл перечня координатных номеров готовят в любом текстовом редакторе Windows и затем первый раз загружают в программный комплекс. Файлу перечня координатных номеров присваивают расширение вида *.pkn. Примечание - Для правильного составления файла перечня координатных номеров достаточно привести на первом месте в строке координатный номер и отделить от текста, характеризующего вертикаль отбора пробы, пробелом. Текст же в строке файла не должен превышать 80 символов. Индексы при координатных номерах ГСН обозначают следующее: р - поверхностный горизонт; s - средний по глубине горизонт; d - придонный горизонт. Пример файла перечня координатных номеров створов наблюдения, выполняемых разными ведомствами, приведен в таблице 4. Таблица 4 - Перечень координатных номеров створов, включенных в специализированную базу данных
5.2.8 Данные гидрохимических наблюдений - это данные, на основе которых осуществляется прогнозирование. Эти данные могут быть представлены в различных форматах, в зависимости от условий их подготовки. Наличие нескольких форматов понимаемых программой исходных данных увеличивает удобство использования программного комплекса и расширяет область его применимости. 6 Методика прогнозирования изменения содержания ЗВ в водных объектах во времени по результатам систематических гидрохимических наблюдений6.1 Выборка из системы «ГидрохимПК» в формате файла обменаВ системе Росгидромета основным форматом для данных о загрязнении поверхностных вод суши является файл с расширением [*.dat] для обмена данными в «ГидрохимПК». Для подготовки данных, используемых в прогнозировании, осуществляется их выборка из «ГидрохимПК» по правилам, указанным в описании пользования этой системой. Полученный файл может быть загружен в программу прогнозирования. При этом произойдет изменение формата данных и дополнение их недостающими характеристиками (признаками значений по умолчанию). 6.2 Специально подготовленные таблицы в «Excel»Ежедневные данные, полученные любым ведомством, могут быть подготовлены для ввода в специализированную базу в виде таблиц Excel. Этот формат применяется для быстроты ввода, контроля полноты данных, а также удобства работы оператора, вводящего данные. В рассматриваемом программном комплексе также предусмотрено автоматическое приведение указанного формата к основному и дополнение его новой недостающей информацией. Образец структуры информации в виде таблиц Excel для расходов речной воды приведен в приложении В, для гидрохимической информации такой образец в виде файла «Образец занесения гидрохимических данных в Excel» прилагается к программному обеспечению. 6.3 Формат гидрохимических данных в программе прогнозированияРассматриваемый формат файла формируется при выборках из внутренней базы данных программы. Структура файла следующая: - тип файла - текстовый; - каждое значение ингредиента представляется отдельной строкой; - каждый элемент строки отделяется, по крайней мере, одним пробелом от последующего; - значение и строка ингредиента в структуре текстового файла характеризуется координатным номером (координатный номер описывается в файле перечня координатных номеров); - код ингредиента устанавливается в соответствии с «kod ingr.win»; - дата отбора пробы воды, содержащей данный ингредиент; представляет собой вещественное число, в целой части которого содержится количество суток, прошедших с 30 декабря 1899 г., а дробная часть - доля текущих суток; данный формат типовой для Windows; - значение ингредиента - строка ингредиента в структуре текстового файла, идентифицируется кодом ингредиента (код в соответствии со справочником кодов ингредиентов); - каждое значение ингредиента характеризуется качеством измерений; - каждое значение ингредиента характеризуется его признаком для целей прогнозирования. 7 Теоретические основы проведения прогнозирования изменения содержания ЗВ в водных объектах во времени по результатам ретроспективных и текущих наблюдений7.1 Общие замечания7.1.1 Вид результата и задаваемые сроки заблаговременности расчета ожидаемых по прогнозу значений ингредиента зависят от полноты полученной исходной информации об изменении этого ингредиента во времени. Если в наличии имеются результаты ежедневных наблюдений, то возможно прогнозирование суточных, среднедекадных, среднемесячных, среднесезонных и среднегодовых значений контролируемых ингредиентов. При наличии многолетних ежемесячных наблюдений (в том числе с учетом восстановленных данных) возможно прогнозирование среднесезонных, среднегодовых и ориентировочный прогноз ожидаемых среднемесячных значений ингредиентов. При наличии многолетних сезонных наблюдений (не более четырех - пяти раз в год) возможен только ориентировочный прогноз среднегодовых значений ингредиента и весьма ориентировочный прогноз ожидаемых его значений для тех календарных месяцев, в которых имеется непрерывный (по годам) временной ряд данных. По полученным разрозненным прогнозным месячным значениям возможен весьма ориентировочный прогноз ожидаемых среднесезонных значений. При наличии результатов ежедневных наблюдений (с учетом восстановленных данных) для прогнозирования среднемесячных данных можно использовать как модальные, так и медианные (данные с обеспеченностью Р = 50 %) значения ингредиента, полученные в каждом привлекаемом для расчета календарном месяце. В случае меньшего (малого) количества исходных данных для указанной цели рекомендуется использовать только медианные месячные значения. Если для экстраполяции берется исходный временной ряд, в котором в каждом месяце число данных равно трем или двум, то для прогнозирования используют среднеарифметические месячные данные. При наличии не более одного наблюдения в месяц (с учетом восстановленных рядов месячных данных) для составления ориентировочных прогнозов разовые наблюдения в месяце условно принимаются за среднемесячные. 7.1.2 В тех случаях, когда в одном или в нескольких близкорасположенных створах систематических наблюдений имеются часто и редко контролируемые ингредиенты, то в целях расширения возможностей прогнозирования рекомендуется проведение корреляционного анализа для определения наличия и тесноты статистический связей между значениями часто и редко контролируемых ингредиентов. При наличии достоверных статистических связей между указанными компонентами имеется возможность проводить прогнозирование изменения во времени значений редко измеряемых ингредиентов с той же заблаговременностью, что и часто измеряемых. 7.1.3 В качестве погрешности результата прогноза (возможного доверительного интервала варьирования ожидаемого по прогнозу значения ингредиента) рекомендуется: - при прогнозировании среднедекадных, среднемесячных и среднегодовых значений ингредиента использовать полученные путем экстраполяции выбранным методом прогноза на заданный срок обеспеченные на 20 % и 80 % его значения (соответственно в каждой декаде или месяце должно быть не менее четырех измерений); - при прогнозировании суточных значений ингредиента использовать погрешность его значений, полученную по выбранному для экстраполяции уравнению регрессии при доверительной вероятности Р = 0,95; - при любых видах прогнозирования при отсутствии достоверной статистической связи между значениями ингредиента и временем измерения (или значениями другого часто измеряемого ингредиента) и наличии в рассматриваемом ряду менее четырех его значений использовать крайние интервалы варьирования значений ингредиента. 7.1.4 Для прогнозирования весьма желательно использовать не один, а несколько методов экстраполяции, каждый из которых достаточно объективно аппроксимирует на ретроспективных данных изменение значений рассматриваемого ингредиента во времени на интересуемую дату расчета. При этом в качестве окончательного результата прогноза представляют непротиворечивые по результатам визуального контроля осредненные данные, рассчитанные по нескольким использованным методам прогнозирования. 7.2 Корректировка исходных данных7.2.1 Выделение и изъятие аномальных и ошибочных значений ингредиентов. Восполнение пробелов в результатах наблюдений7.2.1.1 Корректировка первичных данных является очень важным и ответственным этапом при подготовке исходной информации для прогнозирования. Основная цель ее заключается в том, чтобы исключить и не включать в прогноз и расчеты по восполнению пробелов данных ошибочные и нехарактерные значения контролируемых веществ и показателей химического состава воды водного объекта. 7.2.1.2 Для корректировки исходной информации выполняется визуальный просмотр временных рядов данных, представленных в виде таблиц или точечных графиков. Нехарактерные данные выделяются («флагируются») путем присвоения кодового признака в соответствии с характеристиками наблюденных значений ингредиента, приведенными в таблице 3. 7.2.1.3 Если сомнительное значение ингредиента во временном ряду данных занимает место до или после отсутствующего результата наблюдений, то это значение целесообразно изъять из ряда данных, поскольку в процессе восстановления данных будут получены некорректные восстановленные значения ингредиента. 7.2.1.4 Восполнение пробелов в наблюденных значениях ингредиентов необходимо: - для возможности достаточно обоснованно применять при прогнозировании адаптивные методы экстраполяции возможных изменений значений ингредиентов; - для возможности более корректно рассчитывать и использовать в оценках качества воды такие статистические характеристики как средняя, мода и медиана. 7.2.1.5 После изъятия из временного ряда нехарактерных значений рассматриваемого вещества можно провести восполнение пробелов в результатах наблюдений. Для начала работы по восстановлению данных составляют (программными средствами) и просматривают таблицу со сроками и количеством пропущенных данных. На следующем этапе устанавливают, какой временной ряд данных целесообразно использовать для прогнозирования: в виде среднесуточных, среднедекадных, среднемесячных, среднесезонных или среднегодовых значений. Далее решают следующие задачи: - выбирают интервалы времени внутри конкретного года или многолетия (ряд лет), в которых будет выполняться восстановление данных; - определяют вначале ориентировочно, а затем на основании табличных данных минимально и максимально допустимый во времени интервал пропусков данных и устанавливают временной шаг для восстановления данных. При суточных наблюдениях временной шаг можно принять равным одним суткам, при примерно декадных наблюдениях - 10 сут, при месячных - 30 сут; - исходя из графика изменения концентрации вещества во времени, устанавливают количество данных до и после пропуска для проведения интерполяционных расчетов с использованием различных способов линеаризации временного ряда данных с помощью статистических зависимостей типа «концентрация - время». Лучшую из таких статистических связей автоматически (программными средствами) выбирают и используют для восстановления пропущенных данных. Далее на графике просматривают восстановленные данные (отмеченные красным цветом) и подтверждают или отменяют проведенное восстановление. Если необходимо, восстановление данных повторяют несколько раз, изменив или оставив тот же временной шаг и количество учитываемых данных до и после пропуска наблюдений. Сформированные (откорректированные) временные ряды данных по отдельным ингредиентам желательно запомнить в виде новых отдельных файлов с расширением «*.dan». При проведении восстановления данных программными средствами рекомендуется учитывать следующее: - для ежедневных данных восстановление теряет смысл при пропусках подряд более декады; при наличии таких пропусков нужно переходить на среднедекадный шаг восстановления данных и прогнозирования (тем не менее, по инициативе оператора в таблице исходных данных восстановление таких пропусков на основе экспертных оценок может быть выполнено «вручную»); - восстановление программными средствами подекадного ряда данных целесообразно, если в период половодья подряд имеются пропуски не более двух, а в остальной период не более трех декад; при наличии пропусков большей продолжительности целесообразен переход к восстановлению и прогнозированию среднемесячных данных (тем не менее, по инициативе оператора возможно восстановление таких пропусков «вручную» на основе экспертных оценок); - восстановление программными средствами помесячного ряда данных целесообразно, если в период половодья подряд имеются пропуски не более одного, а в остальной период не более трех месяцев; при наличии пропусков большей длительности целесообразен переход на восстановление и прогнозирование среднегодовых данных (по инициативе оператора возможно восстановление указанных пропусков «вручную» на основе экспертных оценок). 7.3 Рекомендуемые методы прогнозирования7.3.1 Метод прогнозирования по результатам анализа тенденций (трендов) изменения значений ингредиента во времени7.3.1.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения интересуемого створа систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (включая его код), для которого будет выполняться прогностический расчет; в) временной ряд значений ингредиента (данные могут быть представлены в виде суточных, среднедекадных, среднемесячных или среднегодовых значений) с указанием в соответствии с усреднением данных даты съемки в годовом цикле, месяца или года, к которому относится значение ингредиента в ряду исходных данных; Примечание - Если задачей является определение статистической связи между значениями двух ингредиентов, то в роли функции выступает редко измеряемый ингредиент, в роли аргумента - часто измеряемый ингредиент. г) заданный срок, на который требуется составить прогноз. Примечание - Если для прогнозирования используется статистическая связь между ингредиентами, то в качестве дополнительной информации может быть указано прогнозное значение часто измеряемого ингредиента. В основу метода положен корреляционный анализ зависимости между значениями рассматриваемого ингредиента и значениями временных характеристик (конкретные годы, календарные месяцы, декады или сутки). Примечание - В статистических связях во временном ряду данных в качестве временных характеристик используют: в декадах - значения середины календарной декады, в месяцах - значения середины календарного месяца. 7.3.1.2 Выполняют поиск уравнения регрессии, которое наиболее представительно характеризует линеаризированную статистическую связь между коррелируемыми признаками (между значениями ингредиента и значениями времени или между значениями часто и редко измеряемых ингредиентов), с использованием 16 видов уравнений [2], [3] и РД 52.24.622:
7.3.1.3 Статистическую связь принимают значимой, если она удовлетворяет параметрам, приведенным в таблице 5. Таблица 5 - Критерии оценки качества статистических связей
В таблицу 5 включены параметры: n - число пар значений зависимой и независимой переменных, использованных для установления статистической связи; σ - среднее квадратическое отклонение, определяемое для анализируемого ряда значений ингредиента по формуле (3) - средняя квадратичная погрешность проверочных расчетов значений ингредиента по найденному уравнению регрессии, определяемая по формуле где С(p)i - значение ингредиента, полученное по уравнению регрессии на ту дату, когда была зафиксирована величина Сi. Коэффициент корреляции r при линейной связи между параметрами Сi и Тi определяют по формуле где Сi, Ti - i-e значения коррелируемых ингредиентов; Сср, Тср - среднеарифметические значения этих ингредиентов. Если при линеаризации статистической связи значения ингредиентов Ci и Тi брались в измененном виде (например: lgCi; ), то в формуле (5) их i-e значения следует брать в таком же измененном виде. Для выполнения прогнозирования выбирают то уравнение, при расчетах по которому будет получено наименьшее отклонение расчетных данных от измеренных в действительности. 7.3.1.4 Возможную погрешность прогнозных значений ингредиента по найденному уравнению регрессии вычисляют по формуле где tSt - коэффициент Стьюдента при Р = 0,95. При использовании данного метода прогнозирования следует обращать внимание на следующее: - для построения тренда изменения концентраций вещества во времени (на основе осредненных или единичных значений) оператором произвольно выбирается такой исходный предпрогнозный период, в пределах которого имеет место относительно небольшая амплитуда изменения значений ингредиента с однозначной тенденцией изменения концентрации, характеризующей либо её постепенное возрастание, либо снижение; - указанные периоды для каждого ингредиента специфичны и должны быть заранее определены в пределах годового цикла или многолетия на основе анализа изменчивости концентрации конкретного вещества (при использовании ряда, состоящего из месячных данных, рассматриваемый метод целесообразно применять в пределах годового цикла с учетом особенностей изменения содержания рассматриваемого вещества, например, до прохождения пика половодья или после пика половодья; до или после окончания ледостава); - оператором произвольно назначается метод прогнозирования среднемесячных значений ингредиента либо с использованием временных рядов данных только по интересуемому календарному месяцу, либо по выбранному временному периоду всего ряда месячных данных (для прогнозирования можно использовать оба метода поочередно). 7.3.2 Методы адаптивного прогнозирования7.3.2.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения интересуемого створа систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (включая его код), для которого будет проводиться прогнозирование; в) временной ряд значений ингредиента (данные могут быть представлены в виде суточных, среднедекадных, среднемесячных или среднегодовых значений) с указанием календарной даты суток, календарной даты середины декады, месяца в годовом цикле или года, к которому относится значение ингредиента в ряду исходных данных; г) заданный срок, на который требуется составить прогноз. Каждый из временных рядов измеренных значений ингредиента можно представить в виде суммы детерминированного временного ряда (тренда) и случайной составляющей временного ряда с нулевым математическим ожиданием. Для разложения исходного временного ряда на составляющие предпочтителен такой эффективный и наиболее часто применяемый метод как экспоненциальное сглаживание [4]. В основе этого метода лежит расчет экспоненциальных средних. Чем более глубокое сглаживание производят, тем более гладкая долгодействующая закономерность динамики ряда выделяется в тренд, но при этом и большая часть вариаций исходного ряда включается в случайную составляющую. Соответственно, для более глубокого сглаживания необходима и большая длина предыстории исходного временного ряда [4]. Выделяемый тренд, экстраполяцией которого осуществляется прогнозирование на небольшое количество интервалов измерений, представляет собой достаточно гладкую функцию времени и с приемлемой точностью может быть представлен полиномом. Для осуществления прогнозирования с упреждением на малое число интервалов измерений с удовлетворительной оправдываемостью выделяемый тренд может быть аппроксимирован полиномами до 2-й степени. В связи с этим для прогнозирования изменений значений контролируемых ингредиентов во времени были использованы методы, основанные на экспоненциальном сглаживании исходных временных рядов с экстраполяцией полиномами не выше второй степени. Р. Брауном [4] разработана процедура адаптации коэффициентов полиномов при каждом получении новой фактической точки временного ряда. При этом за начало отсчета времени принимают текущий момент составления прогноза. Прогнозируемое на число периодов времени измерения Т значение временного ряда X определяют: - для полиномиальной модели нулевого порядка в соответствии с выражением Х(Т) = В1; (7) - первого порядка Х(Т) = В1 + В2Т; (8) - второго порядка Х(Т) = В1 + В2Т + 0,5В3Т(Т - 1). (9) Адаптацию коэффициентов полиномиальных моделей В1, В2 и В3, а также пересчет начала отсчета для получения при прогнозировании очередного значения временного ряда осуществляют следующим образом: - для модели нулевого порядка В1 = В1с + αЕt; (10) - для модели первого порядка В1 = В1с + В2с + α(2 - α)Еt, (11) В2 = В2с + α2Еt; (12) - для модели второго порядка B1 = B1c + B2c + (3α - 3α2 + α3)Et, (13) В2 = B2c + B3c + (3α2 - α3)Еt, (14) B3 = B3c + α3Et; (15) где В1, В2, В3 - «новые» значения коэффициентов; B1c; B2c; B3c - «старые» значения коэффициентов; Еt - ошибка прогноза, при получении очередной точки временного ряда на 1 шаг вперед (Т = 1); α - константа сглаживания. Для быстрой подстройки коэффициентов модели прогнозирования, в моменты резких изменений среднего уровня временного ряда используют модификацию Тригга-Лича [4], заключающуюся в подсчете величины следящего контрольного сигнала. Следящий контрольный сигнал К представляет собой сумму сглаженных ошибок прогнозирования D1 деленную на сумму сглаженных модулей ошибок прогнозирования D2: K = |D1/D2|, (16) D1 = (1 - γ)D1 + γEt, (17) D2 = (l - γ)D2 + γ|Et|; (18) где γ - постоянная сглаживания (γ = 0,35). В рассматриваемом случае обновление коэффициентов полиномиальных моделей выполняют в соответствии с выражениями: - для моделей нулевого порядка В1 = В1с + КЕt, (19) - для моделей первого порядка В1 = В2с + В2,с + КЕt, (20) В2 = В2с + α2Еt; (21) - для моделей второго порядка B1 = B1c + B1c + KEt, (22) В2 = В2c + В3с + α2(3 - α)Et, (23) B3 = B3c + α3Et. (24) Величина следящего контрольного сигнала при резких (внезапных) значительных изменениях среднего уровня ряда становится близка к единице и при обновлении коэффициента В1 максимально учитывается ошибка прогноза на один шаг - Еt. К положительным свойствам реализации данного метода прогнозирования на один или несколько шагов вперед можно отнести следующее: в основе метода лежит простая, логичная и легко понимаемая концепция, оптимальное значение единственного параметра α можно быстро найти эмпирическим путем (по результатам оценочных прогнозов на различных водных объектах оптимальный результат чаще всего получался при значениях α = 0,7 и γ = 0,35), коэффициенты полиномов оцениваются совместно таким образом, чтобы уменьшить автокорреляцию в остатках. Анализируя результаты апробации разработанного программного комплекса на основе различных видов исходной ретроспективной информации, можно констатировать, что для снижения погрешности результатов прогнозирования нередко (особенно в пределах периодов, когда меняется направленность изменения концентраций ЗВ) оказывается целесообразным снижение численного значения параметра α до появления устойчивых более низких значений погрешности прогноза, не противоречащих изменчивости и дисперсии данных в исходном временном ряду (анализ погрешностей выполняют визуально по результатам прогноза, которые при использовании программных средств появляются на графике рассматриваемого временного ряда). 7.3.2.2 Для ингредиента, выбранного для прогнозирования, по данным начального временного ряда программными средствами находят начальные значения коэффициентов выбранной полиномиальной модели методом наименьших квадратов. После получения очередного значения ингредиента, коэффициенты выбранной полиномиальной модели программными средствами пересчитывают (адаптируют) и, считая момент времени последнего измерения за начало отсчета, осуществляют прогноз значения ингредиента на заданный период. 7.3.2.3 Доверительный интервал результатов прогноза получают следующим образом: а) рассчитывают среднее квадратическое отклонение наблюденных данных от расчетных S'св, полученных для каждого элемента рассматриваемого динамического ряда по формуле (4); б) в случае использования полиномиальной модели Брауна нулевого порядка дисперсия результатов прогноза определяют по выражению в) в случае использования модели первого порядка дисперсия результатов прогноза составит D1 = [1 + 1,25α(2 - α) + α2(2 - α)2τ](S'св)2; (26) г) для модели второго порядка - D2 = (1 + 2α1 + 3α12τ + 3α13τ2)(S'cв)2. (27) В формулах (25) - (27): α - постоянная сглаживания; τ - время упреждения (число шагов); α1 = α[3 - α(3 - α)]. (28) Доверительный интервал результата прогноза определяется как ; i = 0, 1, 2 (29) где tSt - коэффициент Стьюдента при Р = 0,95 (таблица 6); Таблица 6 - Значения коэффициента Стьюдента tSt при односторонней доверительной вероятности Р = 0,95
Адаптивный метод нулевого порядка рекомендуется использовать в тех случаях, когда изменение значений ингредиента в пределах рассматриваемого периода имеет горизонтальную направленность (достоверная статистическая связь изменения значений ингредиента во времени, как правило, отсутствует). Уровень такой направленности во времени может претерпевать некоторые изменения (например, резкий переход значений временного ряда на новый горизонтальный уровень без изменения какой-либо устойчивой вертикальной динамики тенденции). Адаптивный метод первого порядка рекомендуется использовать в тех случаях, когда угол направленности тенденции линейного изменения значений ингредиента во времени меняется медленно (нет больших отклонений от характерной направленности значений временного ряда в пределах выбранного периода). Характеру изменения значений ингредиента к концу периода придается более высокое значение путем присвоения более высоких значений весовых коэффициентов перед соответствующими слагаемыми в полиномиальной связи. Обычно этот метод можно использовать совместно с методом построения тренда изменения концентраций вещества во времени. Адаптивный метод второго порядка рекомендуется использовать в тех случаях, когда имеет место высокие темп смены направленности тенденции изменения значений ингредиента во времени (часто встречаются большие отклонения от общей направленности значений временного ряда в пределах выбранного периода). Результат прогноза чаще всего отражает максимально возможный рост или снижение значений ингредиента на заданную дату прогнозирования. 7.3.3 Метод прогнозирования по тренду с учетом сезонной - составляющей7.3.3.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (включая его код), для которого будет осуществляться прогнозирование; в) временной ряд значений ингредиента (данные должны быть представлены в виде суточных или среднедекадных значений) с указанием календарной даты суток или декады (середины соответствующей декады) в годовом цикле; г) заданный срок, на который требуется составить прогноз. Использование данного метода прогнозирования возможно только при наличии сведений о ежедневных или среднедекадных данных (в том числе восстановленных) за период не менее полных трех лет. При выделении сезонной составляющей рекомендуется брать периодичность сезонов - один год. Для исходного временного ряда в сутках это составляет 365 значений ингредиента на один временной период, в декадах - 36. 7.3.3.2 Предварительно до выполнения прогнозирования строят точечный график «значение ингредиента - время». По графику визуально выбирают временной период продолжительностью не менее трех последних лет, включающий все результаты текущих наблюдений. 7.3.3.3 Для определения сезонной составляющей на основе исходного временного ряда значений ингредиента сначала определяют типовую сезонную составляющую на 1 год, а затем на ее основе сезонную составляющую пролонгируют на весь выбранный срок наблюдений. Данную процедуру выполняют следующим образом. На основе всех значений выбранного временного ряда вычисляют среднее арифметическое значение ингредиента. Затем формируют массивы значений ингредиента для типового сезона, начиная с первой точки (значение ингредиента в ней соответствует определенной дате годового цикла). Массив для первой точки формируют из значений ингредиента на рассматриваемую дату за все годы выбранного срока наблюдений с шагом, равным одному периоду (1 году). По построенному массиву определяют среднюю величину этого массива и из нее вычитают среднее значение ингредиента всего исходного временного ряда. Так определяют первую точку выделяемой типовой сезонной составляющей. Далее аналогичным образом определяют значения для всех точек в годовом цикле. В результате расчета получают все значения типовой сезонной составляющей в годовом цикле. Для получения сезонной составляющей всего исходного временного ряда точки типового сезона повторяют сдвигом типового сезона на его период (1 год), сдвиг повторяют до тех пор, пока сезонная составляющая не заполнит весь исходный временной период. 7.3.3.4 В целях определения временного ряда «остатков» из каждого значения исходного временного ряда вычитают соответствующее ему рассчитанное значение сезонной составляющей. Для получения всех характеристик исходного временного ряда, которые можно использовать для прогнозирования, дополнительно следует разложить временной ряд «остатков» на тренд и случайный временной ряд, имеющий нормальное распределение с нулевым значением средней. При этом тренд можно выделить как выбором оптимальной кривой на основе метода наименьших квадратов, так и одним из методов адаптивного прогнозирования. 7.3.3.5 В результате рассмотренной выше процедуры исходный временной ряд разделяется на три составляющих: сезонную составляющую, тренд и случайный временной ряд остатков. Непосредственно прогнозирование выполняют пролонгированием сезонной составляющей и тренда на заданный период (шаг) прогнозирования изменения значения ингредиента. Ожидаемое по прогнозу значение ингредиента определяют как сумму рассчитанных значений по сезонной составляющей и по тренду. В качестве возможной погрешности прогноза берут границы варьирования значений временного ряда остатков. 7.3.3.6 Значимость сезонной составляющей в изменении значений интересуемого ингредиента (и, соответственно, необходимости выделения сезонной составляющей для повышения точности прогноза) оценивают следующим образом. По данным исходного временного ряда выделяют тренд и дисперсию отклонений от него значений временного ряда (в общем случае нелинейного). Затем определяют тренд временного ряда «остатков» и дисперсию отклонений от него значений временного ряда «остатков» (также в общем случае нелинейного). Значимость вклада сезонной составляющей оценивают путем проверки гипотезы о равенстве двух дисперсий, опираясь на совместный закон распределения оценок двух дисперсий, которым является F-распределение, называемое распределением Фишера-Снедекора, при доверительной вероятности Р = 90 %: (30) где - дисперсия отклонений исходных (наблюденных) данных от полученных по уравнению тренда временного ряда этих данных; - дисперсия значений временного ряда «остатков» с учетом выделения сезонной составляющей. Полученное значение F-критерия сравнивают с табличным при Р = 0,90 (уровень значимости q = 0,1) и при условном обеспеченном минимуме числа исходных данных (величина степеней свободы), равном 100. Для указанных условий табличное значение F-критерия равно 1,26. Если рассчитанное значение F-критерия оказывается выше 1,26, то принимают условие, что сезонная составляющая имеет существенное влияние на изменение значений рассматриваемого ингредиента во времени и ее надо учитывать при прогнозировании. Анализ хода изменения сезонной составляющей и остатков за весь период наблюдений позволяет определить наиболее вероятное изменение концентрации ингредиента на интересуемом шаге прогнозирования. При произвольном выборе оператором метода аппроксимации изменения значений остатков во времени следует учитывать характер их изменчивости (визуально по точечному графику) и особенность обобщения данных по тому или иному выбираемому методу их аппроксимации (см. описание используемых методов прогнозирования в 7.3.2.1, 7.3.2.2). 8 Алгоритмы прогнозирования изменения содержания ЗВ в водных объектах по результатам систематических гидрохимических наблюдений8.1 Прогнозирование изменения суточных значений ЗВ и показателей химического состава воды водного объекта8.1.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (включая его код), для которого будет составляться прогноз; в) наличие временного ряда результатов ежесуточных наблюдений (включая восстановленные данные) по интересуемому ингредиенту за период не менее трех лет. г) заданный срок, на который требуется провести прогноз. Для дополнительного варианта прогнозирования, кроме указанного в трех первых пунктах, требуется наличие установленной достоверной статистической связи между интересуемым редко определяемым ингредиентом (зависимая переменная) и одним из ингредиентов, по которому имеется ежесуточный ряд наблюдений (независимая переменная). Данный вид расчета используют как отдельную задачу в 8.4, 8.5. 8.1.2 Прогнозирование следует начинать с построения и анализа точечного графика «значение ингредиента - время». Если изменение значений ингредиента во времени имеет заметные сезонные колебания, то для прогнозирования следует использовать метод экстраполяции данных с выделением и учетом сезонной составляющей (переход к 8.1.3). В противном случае переходят к 8.1.4. 8.1.3 Процедуру выделения сезонной составляющей выполняют в соответствии с указаниями в 7.3.3 и далее осуществляют переход к 8.1.5. Если по критерию (30) сезонность изменения значений признана несущественной, то осуществляют переход к выбору метода прогнозирования без учета сезонной составляющей (переход к 8.1.4). 8.1.4 Выбор одного из методов прогнозирования значений ингредиента оператор выполняет произвольно (вручную) с учетом рекомендаций по использованию каждого из них (см. 7.3.1, 7.3.2). 8.1.5 Результат прогнозирования на конкретную дату в виде ожидаемого значения ингредиента и доверительного интервала его варьирования заносят в итоговую сводку результатов прогноза, которые могут быть представлены (распечатаны) как окончательный результат. В противном случае, если предполагается использовать несколько методов прогнозирования, полученный результат запоминают с целью выполнения в дальнейшем его осреднения совместно с другими результатами прогноза (неудачный вариант прогноза оставляют без внимания и не запоминают для последующего осреднения). 8.1.6 Если прогнозирование выполнено по ряду методов с соответствующим запоминанием, то выполняют осреднение результатов расчета (путем вычисления среднеарифметического значения) и представление (распечатку) окончательного результата. В противном случае осуществляют переход к 8.1.4. 8.2 Прогнозирование изменения декадных значений ЗВ и показателей химического состава воды водного объекта8.2.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (в том числе его код), для которого будет выполняться прогнозирование; в) наличие временного ряда результатов ежедекадных наблюдений (включая восстановленные данные) по заданному ингредиенту за период не менее трех лет. г) заданный срок, на который требуется получить прогноз. Для дополнительного варианта прогнозирования, кроме указанного в двух первых пунктах, требуется наличие установленной достоверной статистической связи между заданным редко определяемым ингредиентом (зависимая переменная) и одним из ингредиентов, по которому имеется ежедекадный ряд наблюдений (независимая переменная). Данный вид расчета рассмотрен как отдельная задача в 8.4, 8.5. 8.2.2 Расчет медианных значений ингредиента для каждой декады анализируемого временного ряда данных осуществляют по формулам: m50% = 0,5(n + 1), (31) С50% = С(m50% - Δm) - ΔmΔC, (32) где m50% - порядковый номер величины Сi в ранжированном убывающем ряду данных в рассматриваемой декаде; n - число значений Сi, взятых для расчета C50%; Δm - дробная часть значения m50% (Δm = 0,5); ΔC - разница между значениями Ci, которые соответствуют номерам (m50% - Δm) и (m50% - Δm + 1). 8.2.3 Расчет значений ингредиента 20 %-й обеспеченности С20% выполняют по формулам: m20% = 0,2(n + 1,9), (33) С20% = С(m20% - Δm) - ΔmΔC, (34) где m20% - порядковый номер величины Сi в ранжированном убывающем ряду; n - число значений Ci, взятых для расчета С20%; Δm - дробная часть значения m20% (например, при m20% = 2,25 Δm = 0,25); ΔC - разница между значениями Ci, которые соответствуют номерам (m20% - Δm) и (m20% - Δm + 1); 8.2.4 Значения концентрации вещества 80 %-й обеспеченности C80% рассчитывают по формулам: m80% = 0,80(n + 0,78), (35) С80% = С(m80% - Δm) - ΔmΔC, (36) где m80% - порядковый номер величины Сi в ранжированном убывающем ряду; ΔC - разница между значениями Сi, которые соответствуют номерам (m80% - Δm) и (m80% - Δm + 1). 8.2.5 Процедура прогнозирования значений ингредиента по получившемуся временному ряду среднедекадных (медианных) и обеспеченных на 20 % и 80 % значений ингредиента не отличается от прогнозирования среднесуточных значений. В частности, на основе временного ряда из среднедекадных (медианных) значений ингредиента за выбранный период времени выполняют ту же последовательность шагов, что указана в 8.1.1 - 8.1.6. При отсутствии сезонной составляющей среднедекадные (медианные) и обеспеченные значения ингредиента экстраполируют (прогнозируют) так, как указано в 8.1.4 - 8.1.6. 8.3 Прогнозирование изменения среднемесячных и среднегодовых значений ЗВ и показателей химического состава воды водного объекта8.3.1 В качестве исходной информации для решения задачи требуется: а) наличие кода (координатного номера) местоположения систематических гидрохимических наблюдений (в рамках используемой базы данных); б) наименование ингредиента (в том числе его код), для которого будет выполняться прогнозирование; в) наличие временного ряда исходных результатов наблюдений (включая восстановленные данные). г) заданный срок, на который требуется получить прогноз (число шагов от конца временного ряда помесячных или годовых данных). Для дополнительного варианта прогнозирования, кроме указанного в трех первых пунктах, требуется наличие установленной достоверной статистической связи между заданным редко определяемым ингредиентом (зависимая переменная) и одним из ингредиентов, по которому имеется ежесуточный ряд наблюдений (независимая переменная). Данный вид расчета рассмотрен как отдельная задача в 8.4 и 8.5. В рассматриваемом методе прогнозирования среднемесячные и среднегодовые значения ингредиента рекомендуется по возможности (при достаточном количестве исходных данных) определять и представлять в виде двух вариантов: отдельно в виде модальных и отдельно в виде медианных значений, а доверительный интервал их варьирования и в том, и другом случае - в виде обеспеченных на 20 % и 80 % значений ингредиента. 8.3.2 По имеющейся (в том числе восстановленной) информации для каждого календарного месяца в соответствующем году рассчитывают отдельно модальные, медианные и обеспеченные на 20 % и 80 % значения рассматриваемого ингредиента. 8.3.3 Прогнозирование на основе использования модальных месячных и годовых значений ингредиента возможно только в том случае, если имеются результаты (в т.ч. восстановленные) ежесуточных наблюдений. Для данной цели по результатам наблюдений предварительно рассчитывают модальные значения для каждого календарного месяца в соответствующем году и по модальным месячным значениям - среднегодовые (медианные) данные за каждый конкретный год. Указанные рассчитанные характеристики сводят в таблицу для последующих этапов прогнозирования (пример программного представления рассчитанных характеристик показан в таблице 7). Таблица 7 - Исходные для прогнозирования обобщенные значения ингредиента
Примечание - В таблице в числителе указано число имеющихся значений ингредиента в соответствующем месяце года, в знаменателе - осредненное значение ингредиента (в зависимости от поставленной задачи и полноты информации это может быть модальное, медианное, среднеарифметическое или единичное значение ингредиента). Исходную информацию в таблице 7 независимо от ее полноты приводят помесячно. При наличии в результатах какого-либо месяца менее 28 данных расчет модальных значений в этом месяце проводиться не будет (ячейки останутся пустыми). Чтобы избежать этого, нужно либо вернуться в раздел редактирование данных и восстановить недостающие суточные значения (что более предпочтительно), либо восстановить модальные месячные значения, используя ряд уже известных модальных месячных значений в рассматриваемой таблице (см. 7.2.1.5). 8.3.3.1 Расчет модальных и обеспеченных месячных и годовых значений ингредиента выполняют следующим образом: а) вариационный ряд значений интересуемого ингредиента в рассматриваемом месяце разбивают на классы; шаг класса Δх определяют по формуле Стерджесса (37) где Сmax, Cmin - соответственно максимальное и минимальное значения (концентрации) ингредиента в вариационном ряду; N - число данных (членов) в этом ряду; б) для каждого класса определяют число попавших в него значений (концентраций) вариационного ряда (частоты класса); в) класс, в котором имеется наибольшее количество частот называется модальным. Для расчета моды используют: - значение (концентрация) ингредиента в начале модального класса - частоты в классе, предшествующем модальному классу, p1; - частоты в модальном классе р2; - частоты в классе, следующим за модальным, р3; значение моды определяют по формуле (38) Примечание - Если в рассматриваемый год попадает месяц не с ежедневными данными, то расчет моды для него не производят. г) расчет значений ингредиента 20 %-й обеспеченности С20% выполняют по формулам (33) и (34); д) значения концентрации вещества 80 %-й обеспеченности С80% рассчитывают по формулам (35) и (36). 8.3.3.2 Если в каком-либо отдельном месяце данные отсутствуют (мода не может быть рассчитана), то эти пропуски восстанавливают. Число пропусков в весенний период не должно быть более одного месяца, в остальной период - не более двух месяцев. 8.3.3.3 По ежемесячным модальным значениям рассчитывают среднегодовые (медианные) данные в отдельные рассматриваемые годы наблюдений по формулам (31), (32). 8.3.3.4 Для каждого года наблюдений по месячным данным 20 %-й и 80 %-й обеспеченности рассчитывают средние (медианные) годовые значения той же обеспеченности по формулам, аналогичным формулам (31), (32). 8.3.3.5 На основе получившихся временных рядов статистических характеристик за каждый год наблюдений рассчитывают ожидаемое по прогнозу в соответствии с заданной задачей модальное значение ингредиента в конкретном заданном календарном месяце или модальное годовое значение ингредиента с соответствующими для них доверительными интервалами варьирования. Для указанных методов прогнозирования вначале строят точечный график «значение ингредиента - время» и анализируют характер изменения во времени рассматриваемых модальных значений ингредиента. Затем выбирают и используют для экстраполяции один или несколько (последовательно) наиболее подходящих методов прогнозирования (см. 7.3.1, 7.3.2). 8.3.4 Расчет месячных и годовых медианных значений ингредиента, а также доверительных интервалов их варьирования проводят в следующей последовательности. 8.3.4.1 В зависимости от количества измеренных значений ингредиента в рассматриваемом месяце рассчитывают либо медианное, либо среднее арифметическое значение ингредиента: если число значений в месяце более трех, то определяют медианное месячное значение ингредиента по формулам, аналогичным (31), (32), в противном случае - среднее арифметическое значение по формуле (39) где Хср - среднемесячное значение ингредиента; Xi - i-e значение ингредиента; n - число значений Xi, взятых для определения Хср. В случае наличия в месяце всего одного значения ингредиента это значение «идеализируют» и принимают за среднемесячное. 8.3.4.2 По полученным месячным значениям в каждом календарном году рассчитывают среднегодовые значения, в качестве такого значения в каждом году берут медиану из ряда рассчитанных месячных значений ингредиента. Расчет медианы выполняют по формулам, аналогичным формулам (31), (32). 8.3.4.3 По результатам расчетов составляют исходную для прогнозирования таблицу в виде таблицы 7. Если в таблице имеются пропуски месячных данных их восстанавливают. 8.3.4.4 Пользуясь массивами временных данных (рядов), подготовленных в виде таблицы 7, выполняют прогнозирование: а) ожидаемого среднемесячного значения ингредиента в заданном календарном месяце в очередном году (или на более дальнюю перспективу) по данным этого календарного месяца в рассматриваемом многолетии; б) ожидаемого в заданном конкретном месяце среднемесячного значения ингредиента в очередном году (или на более дальнюю перспективу) по данным всех или выбранной части ряда среднемесячных значений за предыдущий период наблюдений; в) ожидаемого среднегодового значения ингредиента в очередном году (или на более дальнюю перспективу) по среднегодовым данным, полученным за предыдущий период наблюдений. Примечание - Если требуется провести прогнозирование среднесезонных значений ингредиента в заданном сезоне, то из таблицы 7 удаляются его значения за все месяцы, кроме месяцев в интересуемом сезоне. В результате вместо среднегодовых значений будут рассчитаны среднесезонные значения и выполнен прогноз среднесезонных значений ингредиента на заданную перспективу. Любую из перечисленных задач прогнозирования выполняют по одному произвольно выбранному методу расчета (или путем последовательного использования нескольких методов с последующим осреднением результатов прогнозирования). Особенности использования отдельных методов изложены в 7.3.1, 7.3.2. 8.3.4.5 Для получения доверительного интервала варьирования рассчитанных по прогнозу среднемесячных или среднегодовых значений ингредиента используют следующие варианты. В случае прогнозирования с использованием метода наименьших квадратов и наличии найденной достоверной статистической связи доверительный интервал результата прогноза принимается равным погрешности расчетов по найденному уравнению регрессии с доверительной вероятностью Р = 0,95 (см. 7.3.1). В противном случае (при отсутствии достоверной статистической связи) доверительный интервал прогнозных значений ингредиента принимают равным его значениям 20 %-ой и 80 %-ой обеспеченности, рассчитанным по данным использованного для прогнозирования ряда среднемесячных или среднегодовых значений (см. формулы (33) - (36)). Если для прогнозирования использовался один из адаптивных методов, то доверительный интервал результата прогноза принимают равным: - средним (медианным) значениям среди рассчитанных для каждого месяца или года отклонений концентраций ингредиента 20 %-й и 80 %-й обеспеченности от моды или медианы (в зависимости от рассматриваемой задачи) в используемом для прогноза ряду данных; - погрешности адаптивного прогноза при Р = 0,95 (см. формулу (29)) только для месячных или годовых данных, если обеспеченные на 20 % и 80 % значения по ретроспективной информации по месяцам не определялись (например, в связи с недостаточным количеством исходных данных). При использовании в качестве результата прогноза среднеарифметического значения ингредиента (по месячному или годовому ряду данных) и при отсутствии достоверной статистической связи типа «значение ингредиента - время» в качестве доверительного интервала варьирования концентраций ЗВ используют весь интервал изменения его значений от минимальной среднемесячной или среднегодовой концентрации ЗВ Сmin до максимальной среднемесячной или среднегодовой концентрации Сmax. 8.4 Прогнозирование с использованием парной статистической связи значений ингредиентов8.4.1 В качестве исходной информации для решения задачи требуется: а) наличие кода интересуемого створа местоположения систематических гидрохимических наблюдений (в рамках используемой базы данных) за часто измеряемым ингредиентом, выбранным в качестве независимой переменной; б) наличие кода (координатного номера) местоположения интересуемого створа систематических гидрохимических наблюдений (в рамках используемой базы данных) за редко измеряемым ингредиентом, выбранным в качестве зависимой переменной; в) наименование ингредиента (в том числе его кода), выбранного в качестве независимой переменной; г) наименование ингредиента (в том числе его кода), выбранного в качестве зависимой переменной; д) наличие временного ряда результатов ежедневных наблюдений за ингредиентом, выбранным в качестве независимой переменной; е) наличие временного ряда результатов наблюдений за ингредиентом, выбранным в качестве зависимой переменной; ж) заданный срок, на который требуется получить прогноз. 8.4.2 Используя разработанный программный комплекс, для рассматриваемого метода прогнозирования осуществляют следующий ряд процедур. 8.4.2.1 Предварительно по любому из вышерассмотренных методов выполняют прогнозирование часто измеряемого ингредиента, выбранного в качестве независимой переменной, на заданную дату. Полученные результаты в виде ожидаемого по прогнозу значения ингредиента (независимая переменная) и его доверительного интервала варьирования запоминают для последующей процедуры прогнозирования. 8.4.2.2 Составляют по совпадающим датам измерений временной ряд парных данных независимой и зависимой переменных. 8.4.2.3 По временному ряду парных данных в виде приведенных значений (отношение измеренного значения к его среднему значению) выполняют построение точечного графика изменения зависимой и независимой переменных во времени. 8.4.2.4 По точечному графику визуально определяют и удаляют явно нехарактерные пары данных (например, когда имеется ошибочнее значение по одному из ингредиентов в паре), а также определяют начало временного ряда, с которого целесообразно оценивать статистическую связь между значениями часто и редко измеряемым ингредиентами. 8.4.2.5 После выполнения процедуры, указанной в 8.4.2.4, по выбранному временному ряду парных данных по методу наименьших квадратов с использованием всего ряда предложенных к использованию уравнений линеаризованной связи определяют наилучшее уравнение статистической связи между зависимой и независимой переменными (см. данную процедуру в 7.3.1). 8.4.2.6 По рассчитанному уравнению регрессии по ранее полученному прогнозному значению независимой переменной на заданную дату выполняют расчет ожидаемого значения зависимой переменной. 8.4.2.7 По установленному уравнению регрессии по ранее полученным значениям доверительного интервала независимой переменной на заданную для прогноза дату вычисляют доверительный интервал возможного варьирования значений зависимой переменной по формулам: а) верхнее значение интервала - Cpв = Cp + ΔSв, (40) где Ср - прогнозное значение зависимой переменной; (41) Св - полученное по прогнозу максимальное значение зависимой переменной с использованием верхнего или нижнего предела доверительного интервала изменения значений независимой переменной; Sсв - погрешность определения значений зависимой переменной по полученному уравнению статистической связи между зависимой и независимой переменными, определяемая по формуле, аналогичной формуле (6); в) нижнее значение интервала - Cрн = Cр - ΔSH, (42) где (43) Сн - полученное по прогнозу минимальное значение зависимой переменной с использованием верхнего или нижнего предела доверительного интервала изменения значений независимой переменной. 9 Представление в возможное использование результатов прогноза9.1 Результат прогноза изменения концентраций интересуемого ЗВ на заданный срок в рассматриваемом створе систематических гидрохимических наблюдений водного объекта представляют в виде ожидаемого среднего значения этого ЗВ, в роли которого в зависимости от полноты исходной информации выступает его единичное, среднеарифметическое, медианное или модальное значение. Кроме этого, указывают погрешность результата прогноза в виде возможного доверительного интервала варьирования концентраций ЗВ в заданный для прогнозирования период года (день, сезон, декада, месяц или год). Для ориентации в степени ухудшения или улучшения ожидаемого по результатам прогноза качества воды представляемые значения по рассматриваемому ЗВ указывают также в виде кратности превышения действующих ПДК или специально установленных региональных нормативов концентраций. 9.2 Если оценка ожидаемого изменения концентраций ЗВ на заданный срок проводилась несколькими методами прогнозирования, каждый из которых признан достаточно приемлемым для поставленной задачи, то в качестве окончательного результата представляют среднее значение ЗВ и доверительный диапазон его варьирования, полученные по результатам использованных методов прогнозирования. 9.3 Результаты прогноза ожидаемых изменений концентраций ЗВ, прежде всего, могут быть использованы для следующих целей: - информационного обеспечения заинтересованных организаций (особенно связанных с планирования водоохранных мероприятий) и населения об ожидаемом изменении качества речной воды в створах систематических гидрохимических наблюдений по интересуемым ЗВ; - корректировки сроков отбора проб воды, в том числе назначения и проведения дополнительного или повторного отбора проб воды в случае ранее полученного сомнительного результата; - корректировки частоты и сроков отбора проб воды с учетом характера изменения выделенной сезонной составляющей (повышение частоты наблюдений в периоды существенных изменений концентрации ЗВ); - корректировки методов обработки информации для оценок состояния водного объекта (например, для выделения характерных многолетий для расчета в них осредненных и обеспеченных концентраций ЗВ). 9.4 Если для какого-либо ЗВ выявлено наличие сезонной составляющей, то при оценках существенности и характера изменения концентраций этого ЗВ во времени следует анализировать весь имеющийся временной ряд равноточных данных, поскольку по срокам в разные годы начало и конец сезонных изменений значении ЗВ могут не совпадать. 9.5 Если неоднократно не удается получить достоверные результаты прогноза, то это может являться следствием следующих причин: - резко изменились (изменяются) условия формирования в речной воде концентрации рассматриваемого ЗВ или показателя химического состава воды; - частота отбора проб воды не адекватно учитывает изменчивость концентраций ЗВ в водном объекте во времени (при этом не следует исключать возможное влияние на качество результатов прогноза отсутствие учета при отборе проб воды внутрисуточных колебаний значений ЗВ). Приложение А
|
1997 |
||||||||||||
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
605 |
575 |
596 |
1260 |
2310 |
974 |
911 |
749 |
626 |
671 |
1100 |
1030 |
2 |
603 |
573 |
596 |
1270 |
2270 |
968 |
881 |
755 |
617 |
671 |
1100 |
1010 |
3 |
600 |
578 |
590 |
1310 |
2146 |
956 |
872 |
749 |
611 |
611 |
1080 |
992 |
4 |
596 |
573 |
590 |
1350 |
2200 |
950 |
863 |
740 |
611 |
689 |
1070 |
972 |
5 |
602 |
573 |
590 |
1430 |
2160 |
950 |
872 |
752 |
605 |
704 |
1050 |
959 |
6 |
597 |
573 |
600 |
1540 |
2060 |
953 |
872 |
743 |
596 |
713 |
1040 |
945 |
7 |
593 |
564 |
606 |
1690 |
1950 |
956 |
872 |
737 |
596 |
728 |
1010 |
918 |
8 |
594 |
557 |
616 |
2140 |
1920 |
956 |
872 |
728 |
593 |
734 |
1010 |
905 |
9 |
599 |
559 |
616 |
2280 |
1910 |
956 |
866 |
719 |
599 |
740 |
1000 |
891 |
10 |
599 |
550 |
626 |
2360 |
1910 |
962 |
854 |
713 |
596 |
752 |
1040 |
870 |
11 |
599 |
545 |
645 |
2540 |
1850 |
974 |
842 |
701 |
605 |
767 |
1050 |
857 |
12 |
599 |
543 |
668 |
2740 |
1790 |
974 |
842 |
698 |
608 |
779 |
1060 |
849 |
13 |
605 |
541 |
680 |
2820 |
1750 |
971 |
833 |
692 |
608 |
794 |
1070 |
836 |
И |
605 |
541 |
698 |
2720 |
1670 |
962 |
830 |
692 |
611 |
803 |
1090 |
792 |
15 |
605 |
543 |
710 |
2680 |
1610 |
956 |
515 |
689 |
611 |
866 |
1110 |
786 |
16 |
605 |
543 |
728 |
2640 |
1510 |
950 |
803 |
683 |
614 |
920 |
1120 |
791 |
17 |
616 |
545 |
799 |
2640 |
1400 |
944 |
788 |
683 |
614 |
941 |
1140 |
795 |
18 |
616 |
554 |
818 |
2630 |
1350 |
950 |
782 |
665 |
617 |
965 |
1190 |
787 |
19 |
616 |
554 |
844 |
2630 |
1300 |
956 |
770 |
659 |
617 |
998 |
1240 |
784 |
20 |
616 |
561 |
878 |
2630 |
1200 |
962 |
761 |
677 |
623 |
1010 |
1260 |
790 |
21 |
616 |
573 |
925 |
2620 |
1120 |
962 |
752 |
683 |
629 |
1030 |
1240 |
787 |
22 |
616 |
580 |
972 |
2610 |
1080 |
956 |
746 |
677 |
632 |
1030 |
1190 |
787 |
23 |
616 |
580 |
1030 |
2600 |
1060 |
956 |
737 |
665 |
635 |
1040 |
1160 |
781 |
24 |
610 |
580 |
1060 |
2590 |
1030 |
953 |
734 |
659 |
641 |
1040 |
1110 |
781 |
25 |
610 |
590 |
1090 |
2540 |
1010 |
947 |
743 |
656 |
644 |
1050 |
1090 |
770 |
26 |
621 |
590 |
1190 |
2470 |
998 |
935 |
743 |
653 |
656 |
1060 |
1090 |
773 |
27 |
626 |
590 |
1210 |
2440 |
989 |
923 |
740 |
650 |
662 |
1100 |
1090 |
773 |
28 |
615 |
596 |
1240 |
2400 |
980 |
920 |
737 |
644 |
665 |
1110 |
1090 |
756 |
29 |
571 |
1260 |
2370 |
974 |
920 |
737 |
635 |
674 |
1110 |
1060 |
741 |
|
30 |
573 |
1270 |
2350 |
968 |
917 |
734 |
632 |
674 |
1110 |
1060 |
730 |
|
31 |
573 |
1280 |
947 |
734 |
632 |
1100 |
718 |
|||||
1998 |
||||||||||||
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
718 |
781 |
659 |
2070 |
4430 |
1900 |
826 |
750 |
1550 |
958 |
1500 |
1210 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
[1] Тарасов М.Н., Клименко О.А., Семенов И.В. и др. Вопросы исследования и прогнозирования загрязненности рек // Гидрохимические материалы. - 1977. - Т. 67. - 114 с.
[2] Временные методические рекомендации по оперативному прогнозированию загрязненности рек. - Л.: Гидрометеоиздат, 1981. - 103 с.
[3] Плохинский Н.А. Биометрия. - М.: Изд-во МГУ, 1970. - 367 с.
[4] Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования. - М.: «Статистика», 1979. - 254 с.
Ключевые слова: методы, прогнозирование во времени, содержание загрязняющих веществ, водные объекты, результаты гидрохимических наблюдений, рекомендации
Ласт регистрации изменений
Номер изменения |
Номер страницы |
Номер документа (ОРН) |
Подпись |
Дата |
||||
измененной |
замененной |
новой |
аннулированной |
внесения изменений |
введения изменений |
|||