ПНСТ 441-2020
ПРЕДВАРИТЕЛЬНЫЙ НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ Информационные технологии УМНЫЙ ГОРОД Онтология верхнего уровня для показателей умного города Information technology. Smart city. An upper level ontology for smart city indicators
ОКС 13.020.20 35.240 Срок действия с 2021-01-01
ПредисловиеПредисловие
1 ПОДГОТОВЛЕН Акционерным обществом "Всероссийский научно-исследовательский институт сертификации" (АО "ВНИИС") и Акционерным обществом "Российская венчурная компания" (АО "РВК") на основе собственного перевода на русский язык англоязычной версии стандарта, указанного в пункте 4 2 ВНЕСЕН Техническим комитетом по стандартизации ТК 194 "Кибер-физические системы" 3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 18 августа 2020 г. N 50-пнст 4 Настоящий стандарт является модифицированным по отношению к международному стандарту ИСО/МЭК 21972:2020* "Информационные технологии. Онтология верхнего уровня для показателей умного города" (ISO/IEC 21972:2020 "Information technology - An upper level ontology for smart city indicators", MOD) путем изменения отдельных фраз (слов, значений показателей, ссылок), которые выделены в тексте курсивом**. Внесение указанных технических отклонений направлено на учет потребностей национальной экономики Российской Федерации. ________________ * Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. ** В оригинале обозначения и номера стандартов и нормативных документов в разделах "Предисловие", 2 "Нормативные ссылки", 3 "Термины и определения" и приложении ДА приводятся обычным шрифтом, отмеченные в разделе "Предисловие" знаком "**" и остальные по тексту документа выделены курсивом. - Примечания изготовителя базы данных.
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5). Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте, приведены в дополнительном приложении ДА 5 Некоторые элементы настоящего стандарта могут быть объектами патентных прав. Международная организация по стандартизации (ИСО) не несет ответственности за установление подлинности каких-либо или всех таких патентных прав
Правила применения настоящего стандарта и проведения его мониторинга установлены в ГОСТ Р 1.16-2011** (разделы 5 и 6). Федеральное агентство по техническому регулированию и метрологии собирает сведения о практическом применении настоящего стандарта. Данные сведения, а также замечания и предложения по содержанию стандарта можно направить не позднее чем за 4 мес до истечения срока его действия разработчику настоящего стандарта по адресу: 121205 Москва, Инновационный центр Сколково, ул.Нобеля, д.1, e-mail: info@tc194.ru и/или в Федеральное агентство по техническому регулированию и метрологии: 109074 Москва, Китайгородский проезд, д.7, стр.1. В случае отмены настоящего стандарта соответствующая информация будет опубликована в ежемесячном информационном указателе "Национальные стандарты" и также будет размещена на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)
ВведениеВведение
Как отмечал Уильям Кельвин, невозможно управлять тем, что не измеряется [1]. Решения умных городов должны приниматься на основе точно определенных и измеренных показателей. При использовании ИКТ в принятии решений умного города модели цифровых данных должны точно отражать то, что они представляют, и способ их измерения. Настоящий стандарт определяет модель данных для определений показателей города. Модель данных определена с использованием языка описания онтологии для семантической паутины (OWL). На рисунке 1 представлены два варианта предполагаемого использования настоящего стандарта.
Рисунок 1 - Варианты предлагаемого использования настоящего стандарта
На рисунке 1а) показано определение показателя, которое используется для автоматизации расчета значения показателя. Определение показателя и данные о городе вводятся в приложение расчета, независимое от показателя, которое использует указанное определение для выбора данных о городе, необходимых для расчета. Такой подход позволяет создать приложение для расчета показателей, которое не запрограммировано для определенного набора показателей. На рисунке 1b) показана система диагностики, которая использует определение показателя для определения причины отклонений значений показателя в зависимости от места или времени. Для определения причин отклонений в системе диагностики должна быть предоставлена информация, какие данные выбраны, и как они объединены. Тенденцией развития города является принятие решений на основе данных. ГОСТ Р ИСО 37120 предоставляет набор показателей для измерения эффективности городских услуг и качества жизни по 17 областям, включая образование, финансы, жилье, транспорт и окружающую среду. Определения показателей предоставляются на естественном языке, а не на формальном машиночитаемом языке. Определение интерпретируется пользователем на основе своего понимания языка и среды проживания (например, в зависимости от определения терминов конкретным городом). Так, термин "соотношение обучающихся и учителей" введен в [2]. Далее термин был расширен Всемирным банком путем указания того, что числителем является "число обучающихся", а знаменателем - "число учителей". Возникают вопросы, "обучающийся" имеет очную или заочную форму обучения? Включаются ли в понятие обучающийся с особыми потребностями и обучающиеся детского сада? Также сложно сравнить показатель для одного города во времени, если определение обучающегося меняется. Например, сегодня в систему образования входят обучающиеся с особыми потребностями, но 30 лет назад они, возможно, не были учтены. Без более точного определения терминов трудно сравнивать показатели по городам, где каждый город проводит собственную интерпретацию терминов, или по временной шкале при изменении определений. Определение и документирование показателей могут быть расширены, как это сделано в ГОСТ Р ИСО 37120 для определения соотношения обучающихся и учителей. Согласно ГОСТ Р ИСО 37120, соотношение обучающихся и учителей в сфере начального образования рассчитывается делением количества зачисленных в начальную школу обучающихся (числитель) на количество полных штатных единиц учителей начальной школы (знаменатель). В результате определяется количество обучающихся на одного учителя. Частные учебные заведения при расчете соотношения обучающихся и учителей не учитываются. Обучающиеся по очно-заочной форме учитываются как обучающиеся по очной форме, то есть обучающийся, который присутствует в учебном заведении полдня, учитывается как обучающийся полный день. Если город в отчете представляет данные в эквиваленте зачисленных на очное отделение (согласно которому двое обучающихся очно-заочного отделения приравниваются к одному учащемуся очного отделения), то это должно быть указано. К числу учителей и прочего преподавательского персонала (например, ассистентов учителей, консультантов по профориентации) не должны относиться администраторы или прочий не преподавательский персонал. Преподаватели и персонал детских садов или дошкольных образовательных учреждений не учитываются. Количество учителей рассчитывается с шагом в одну пятую; например, учителя, работающего один день в неделю, следует учитывать как 0,2 учителя, а учителя, работающего три дня в неделю, следует учитывать как 0,6 учителя. Указанное определение соотношения обучающихся и учителей однозначно решает некоторые вопросы, поднятые выше. Тем не менее, всегда будет разрыв между фактическим значением показателя города и используемыми для его измерения источниками данных и процессами. Это происходит, поскольку значение показателя записывается в машиночитаемой форме (например, в базе данных или в семантической паутине), а источники и процессы измерения находятся в наборах данных и документах, которые недоступны или доступны только для чтения человеком. Результатом является запись значений показателя без понимания того, что они на самом деле измеряют, и как были измерены. Целью настоящего стандарта является поддержка точной и однозначной спецификации определений показателей с использованием технологии онтологии [3], реализованной в семантической паутине [4]. Это обеспечит: - компьютерное представление точных определений, что уменьшит неоднозначность интерпретаций; - вывод показателей из области человеческого восприятия в компьютерную область, где для анализа и интерпретации данных могут использоваться технологии больших данных, программное обеспечение с открытым исходным кодом, мобильные приложения и т.д.; - семантическую совместимость, а именно возможность доступа, понимания, объединения и использования показателей из наборов данных, распространенных по семантической паутине; - публикацию определений показателей, значений показателей и их вспомогательных данных с использованием стандартов семантической паутины и онтологии; - разработку приложений расчета, независимых от показателей; - автоматическое обнаружение несогласованности данных показателя и основных причин отклонений. Без однозначной семантики определений показателей не может быть выполнен анализ согласованности. Без определения согласованности отсутствует возможность проверки любых сравнений на основе показателей. Настоящий стандарт представляет онтологию верхнего уровня для показателей (IULO). IULO предоставляет понятия и свойства для представления базовой структуры определений показателей (см. раздел 6). Настоящий стандарт не определяет понятия для отдельных секторов, таких как образование, финансы, жилье и т.д. IULO разработана для передачи значения данных. IULO не предоставляет понятия для описания метаданных показателей, например, достоверности и происхождения данных. IULO не заменяет существующие модели данных. Путем сопоставления локальной модели с IULO может быть достигнута семантическая совместимость данных. IULO позволяет представлять объединенный уровень показателя, например, для районов, деревень, городов, штатов/провинций и/или стран. IULO позволяет представлять любой показатель. Настоящий стандарт предназначен для организаций, которые определяют показатели, для организаций ИКТ, которые предоставляют услуги городам, округам и странам и управляют полученными данными, а также для разработчиков ИКТ и открытых данных.
1 Область применения1 Область применения
Настоящий стандарт определяет онтологию верхнего уровня для показателей (IULO), которая позволяет представлять определения показателей и данные для их получения. IULO включает: - классы (например, Indicator (показатель), Population (население), Cardinality (кардинальное число); - свойства, которые связывают классы (например, cardinality_of (кардинальное число), parameter_of_var (параметр переменной)).
2 Нормативные ссылки2 Нормативные ссылки
В настоящем стандарте использована нормативная ссылка на следующий стандарт: ГОСТ Р ИСО 37120 Устойчивое развитие сообщества. Показатели городских услуг и качества жизни Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю "Национальные стандарты", который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя "Национальные стандарты" за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящего стандарта в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.
3 Термины и определения3 Термины и определения
В настоящем стандарте применены термины по ГОСТ Р ИСО 37120, а также следующие термины с соответствующими определениями. 3.1 кардинальное число (cardinality): Количество элементов в наборе. 3.2 описательная логика; DL (description logic, DL): Семейство формальных языков представления знаний, которые имеют выразительные возможности, большие по сравнению с логикой высказываний, но меньшие по сравнению с логикой первого порядка. 3.3 манчестерский синтаксис (manchester syntax): Удобный компактный синтаксис для онтологий OWL 2. Примечание - Синтаксис основан на фрейме (в отличие от других синтаксисов для OWL 2, основанных на аксиомах). Коллекция информации о классе или свойстве представляется в одной большой синтаксической конструкции, в отличие от разделения на ряд атомарных блоков (как в описательной логике) или разделения на триплеты (как в графах RDF для OWL).
3.4 пространство имен (namespace): Коллекция имен, идентифицируемых ссылкой URI, которые используются в XML-документах в качестве имен элементов и имен атрибутов. 3.5 онтология (ontology): Формальное представление явлений области обсуждения с помощью базового словаря, включающего определения и аксиомы, которое делает предполагаемое значение однозначным и описывает явления и их взаимосвязи. 3.6 язык веб-онтологии OWL 2 (OWL 2 Web Ontology Language): Язык описания онтологии для семантической паутины (3.8) с формально определенным значением. Примечание - Онтологии OWL 2 определяют классы, свойства, индивидов и значения данных и хранятся в виде семантических веб-документов.
3.7
3.8 семантическая паутина (semantic web): Сеть связанных данных с точки зрения W3C. Примечание - Технологии семантической паутины обеспечивают создание хранилищ данных в сети, разработку словарей и правил для обработки данных.
3.9 единица измерения (unit of measure): Размерная характеристика величины, определенная и принятая соглашением и/или законом.
4 Сокращения и обозначения4 Сокращения и обозначения
В настоящем стандарте применены следующие сокращения: ИКТ - информационные и коммуникационные технологии (Information and Communications Technology, ICT); DL - описательная логика (Description Logic); OWL - язык описания онтологий для семантической паутины (Ontology Web Language); IULO - онтология верхнего уровня для показателей (Indicator Upper Level Ontology); RDF - среда описания ресурса (Resource Description Framework); STR - соотношение числа обучающихся и учителей (Student Teacher Ratio); W3C - Консорциум Всемирной паутины (The World Wide Web Consortium). На рисунках настоящего стандарта стрелки с закрытой стрелкой обозначают отношение подкласса (subClassOf). Стрелки с открытой стрелкой обозначают отношение свойства, и к нему прикреплено имя свойства. Префикс ":" перед именем класса или свойства означает пространство имен, к которому относится класс или свойство. Цвета классов (прямоугольников) и свойств (стрелок) используются для обозначения оригинальных пространств имен. В настоящем стандарте определены классы и свойства без префикса. В настоящем стандарте используются следующие префиксы пространства имен: - gcie: http://ontology.eil.utoronto.ca/GCI/Education/GCI-Education.owl# - geo: http://www.geonames.org/ - gis: http://www.opengis.net/ont/geosparql# - owl: http://www.w3.org/2002/07/owl# - rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns# - rdfs: http://www.w3.org/2000/01/rdf-schema# - sc: http://schema.org/ - xsd: http://www.w3.org/2001/XMLSchema#
5 Паттерн базовой онтологии показателей5 Паттерн базовой онтологии показателей
Определения показателей соответствуют паттерну базовой онтологии. На рисунке 2 представлена часть паттерна. Например, показатель по ГОСТ Р ИСО 37120 связывает единицу измерения, которая представляет собой отношение двух групп населения, года измерения и города. Показатель состоит из числителя и знаменателя, которые являются количественными значениями. Каждое количественное значение является величиной размера населения. (Кардинальное число может быть заменено другими величинами населения, например, средним значением возраста.) В рассматриваемом примере представители населения определяются другим классом и городом. В настоящем стандарте определены имена понятий без префиксов. Имена понятий с префиксами в настоящем стандарте импортированы. Префикс "ot" относится к OWL-Time, "sc" - к Schema.org.
Рисунок 2 - Паттерн онтологии показателей
Классы и свойства для определений показателей определены в следующих разделах.
6 Время 6 Время 6.1 Общие положения6.1 Общие положения
Данные показателя умного города необходимо понимать в контексте времени их генерации и/или публикации. Важно понимать не только время возникновения данных, но и наличие других событий до, после или в это время. Требуется представление времени, которое содержит временные точки, временные интервалы и взаимосвязи между ними. Таким образом, онтология времени должна быть в состоянии обеспечить ответы на такие вопросы, как: - в какое время произошло какое-либо событие или измерение? - какова была продолжительность события? - произошли ли до, после или в это время другие события? Существует несколько онтологий времени. Настоящий стандарт использует онтологию времени OWL-Time [5].
6.2 Основные классы и свойства6.2 Основные классы и свойства
Время возникновения событий является основой концептуальной модели. Могут возникнуть вопросы относительно временной взаимосвязи между измерениями. Важно понимать не только время возникновения данных, но и произошли ли до, после или в это время другие события. Например, был ли определен показатель "доля населения, имеющего постоянную работу" до или после чрезвычайной ситуации? Для ответа на подобный вопрос необходимо понятие времени, которое позволяет вводить понятия о временных точках, временных интервалах и взаимосвязях между ними. Классы OWL-Time включают три класса высокого уровня: - TemporalEntity (сущность времени). Определяет два типа времени Instant (момент времени) и Interval (интервал); - DateTimeDescription (описание даты и времени). Спецификация даты и времени с использованием набора свойств год, месяц, день, час и т.д.; - DurationDescription (описание продолжительности). Задает продолжительность в виде любой комбинации лет, недель, дней, часов, минут и секунд. Эквивалентен "TM_PeriodDuration" (длительность периода) по [6]. Класс TemporalEntity (сущность времени) имеет три подкласса: - Instant (момент времени). Представляет момент времени. Эквивалентен "TM_Instant" (момент времени) по ИСО 19108; - Interval (интервал). Представляет промежуток времени, у которого есть начало и конец. Эквивалентен "TM_Period" (период) по [6]. Если задано DurationDescription (описание продолжительности), тогда разница между началом и концом интервала должна быть равна DurationDescription (описание продолжительности); - Properlnterval (корректный интервал). Интервал, в котором время начала меньше времени окончания. Класс TemporalEntity (сущность времени) имеет время начала, время конца и длительность, которые обозначаются следующими свойствами: - hasBeginning (наличие начала): связывает TemporalEntity (сущность времени) (домен) с Instant (момент времени) (диапазон), который является началом TemporalEntity (сущность времени). Эквивалентно "Beginning" (начало) по [6]. - hasEnd (наличие конца): связывает TemporalEntity (сущность времени) (домен) с Instant (момент времени) (диапазон), который является концом TemporalEntity (сущность времени). Эквивалентно "Ending" (окончание) по [6]. - hasDurationDescription (наличие описания продолжительности): связывает TemporalEntity (сущность времени) (домен) с Interval (интервал) (диапазон), который является продолжительностью DurationDescription (описание продолжительности). Примечание - Свойства в RDF являются однонаправленными и связывают субъект с объектом. Домен свойства ограничивает субъект, а диапазон ограничивает объект.
Существует ряд свойств, относящихся к Properlnterval (корректный интервал), включая intervalOverlaps (перекрытие интервала), intervalAfter (последующий интервал), intervalContains (интервал включает) и т.д. Каждый класс времени в OWL-Time имеет эквивалент в [6], так как OWL_time и [6] используют временные отношения Аллена.
6.3 Графическое изображение6.3 Графическое изображение
На рисунке 3 представлены основные классы OWL-Time.
Рисунок 3 - Классы времени
На рисунке 4 представлены отношения TemporalEntity (сущность времени) с другими классами.
Рисунок 4 - Отношения класса TemporalEntity (сущность времени)
7 Величины и единицы измерения 7 Величины и единицы измерения 7.1 Общие положения7.1 Общие положения
Классы измерений основаны на онтологии измерений ОМ [7]. Целью онтологии измерений является предоставление базовой семантики числа, такой как величина и единица измерения. Важность показателей в онтологии измерений состоит в обеспечении сопоставимости единиц измерения. Например, в измерениях групп обучающихся и учителей могут сравниваться тысячи и миллионы.
7.2 Основные классы и свойства7.2 Основные классы и свойства
На рисунке 5 в верхнем ряду представлены основные классы онтологии измерений, которые включают: - Quantity (величина). Обозначает то, что измеряется, например, диаметр шара. Связывается с измеряемой вещью через свойство признака и значением величины через свойство значения, указываемого в Measure (измерение); - Unit_of_measure (единица измерения). Размерная характеристика величины, определенная и принятая соглашением и/или законом. Используется в качестве стандарта измерения одного и того же количества, где любое другое значение количества может быть выражено в виде числа, кратного единице измерения. Например, длина - это количество; метр представляет собой единицу длины с определенной заданной длиной. 10 метров означают длину в 10 раз больше длины, определенной заранее как "метр" [7]. - Measure (измерение). Обозначает значение измерения (через свойство numeric_value (численное значение)), которое связано с Quantity (величина) и с Unit_of_measure (единица измерения). Например, StudentTeacherRation (отношение обучающихся и учителей) - это подкласс Quantity (величина), значение которого является подклассом Measure (измерение). Единицы измерения Measure (измерение) - это "единица измерения численности населения", которая является экземпляром Unit_of_measure (единица измерения). Фактическое измеренное значение является свойством Student_Teacher_Ratio_Measure (измерение отношения обучающихся и учителей) подкласса Measure (измерение).
Рисунок 5 - Основные классы онтологии измерений
Класс Unit_of_measure (единица измерения) включает три подкласса (рисунок 6): - Singular_unit (одна единица). Например, метр; - Unit_multiple_or_submultiple (кратная или дольная единица). Определяет кратные или дольные единицы класса Singular_unit (одна единица). Например, если единица измерения представляет собой метр, то кратной будет километр, дольной - сантиметр. Unit_multiple_or_submultiple (кратная или дольная единица) ссылается на единицу измерения через свойство singular_unit (одна единица); - Compound_unit (составная единица). Определяет комбинацию Unit_of_measure (единица измерения). Например, скорость будет экземпляром Unit_division (единица как результат деления), где единица измерения (например, метр) или кратная единица времени (например, километр) будет делиться на время (например, час).
Рисунок 6 - Таксономия единиц измерения
Определение единицы измерения требует указания того, является ли шкала единицы номинальной, порядковой, интервальной или относительной (рисунок 7). Последние две шкалы также называют кардинальными шкалами. Примером шкалы является шкала температуры по Цельсию. Для относительных шкал должна быть определена реперная точка.
Рисунок 7 - Таксономия шкал измерения
7.3 Формальная спецификация7.3 Формальная спецификация
В таблице 1 представлена формальная спецификация классов онтологии измерений настоящего стандарта.
Таблица 1 - Классы онтологии измерений
8 Величины показателей и единицы измерения 8 Величины показателей и единицы измерения 8.1 Основные классы и свойства8.1 Основные классы и свойства
Показатель - это количественная величина. Показатель имеет связанные с ним город и период времени. Одним из примеров единицы измерения является размер населения. Population_cardinality_unit (единица кардинального числа населения) определяется как экземпляр Cardinality_unit (единица кардинального числа), который является подклассом Singular_unit (одна единица). На рисунке 8 представлена спецификация Cardinality_unit (единица кардинального числа).
Рисунок 8 - Спецификация Cardinality_unit (единица кардинального числа)
На рисунке 9 population_cardinality_unit (единица кардинального числа населения) изображен как экземпляр Cardinality_unit (единица кардинального числа), который является единицей измерения кардинального числа набора, устанавливаемого Population (население) (см. раздел 9), и обозначаемый символом "рс". Например, 1100 рс обозначает численность населения 1100. Настоящий стандарт использует префиксные нотации для масштабирования чисел путем определения единиц измерения: kilopc, megapc и gigapc, которые являются кратными для Population_cardinality_unit (единица кардинального числа населения). 1,1 kilopc обозначает 1100 рс.
Рисунок 9 - Определение population_cardinality_unit (единица кардинального числа населения)
Для измерения численности населения введена единица измерения population_ratio_unit (единица соотношения населения), определенная как экземпляр Unit_division (единица как результат деления). population_ratio_unit имеет два свойства: - numerator (числитель). Числитель, чей диапазон ограничен пределами population_cardinality_unit (единица кардинального числа населения); - denomirator (знаменатель). Знаменатель, чей диапазон ограничен пределами population_ cardinality_unit (единица кардинального числа населения). Соотношение населения - это соотношение двух кардинальных чисел населения (т.е. количества членов/элементов в каждой группе населения). На рисунке 10 показано определение population_ ratio_unit (единица соотношения населения).
Рисунок 10 - Определение population_ratio_unit (единица соотношения населения)
population_ratio_unit (единица соотношения населения) определяет единицу измерения для населения (рс) и соотношения населения (рс/рс).
8.2 Формальная спецификация8.2 Формальная спецификация
Настоящий подраздел формально представляет класс Indicator (показатель) в таблице 2 (с использованием манчестерского синтаксиса для описательной логики).
Таблица 2 - Класс Indicator (показатель)
Основные определения кардинального числа населения представлены в таблице 3.
Таблица 3 - Определения кардинального числа
С использованием population_cardinality_unit (единица кардинального числа населения) определяются различные типы простых и составных единиц измерения (таблицы 4, 5).
Таблица 4 - Единицы измерения
Таблица 5 - Классы единиц измерения
Единицы измерения для различных типов показателей представлены в таблице 6.
Таблица 6 - Единицы измерения для различных типов показателей
9 Статистика 9 Статистика 9.1 Общие положения9.1 Общие положения
Примером показателя является соотношение числа обучающихся и учителей (STR), которое основано на измерении количества обучающихся и учителей населения города. Данный показатель может быть рассмотрен как статистическое измерение в том смысле, что существует измеряемая популяция, а именно городское население, и подсчитывается число членов, которые удовлетворяют описанию обучающегося и учителя соответственно. Так как для расчета показателя требуется подсчет населения, то необходимы статистические показатели среднего значения, отклонения и других характеристик населения. Существуют различные словари/онтологии для представления и публикации наборов статистических данных. Настоящий стандарт определяет в качестве основы для онтологии статистики GovStat [8]. Онтология GovStat предоставляет классы и свойства для представления основных статистических концепций.
9.2 Основные понятия и свойства9.2 Основные понятия и свойства
На рисунке 11 представлено подмножество классов и свойств онтологии статистики. Основным классом является Population (население). Population связано с Parameter (параметр) (например, среднее значение, стандартное отклонение) свойством is_described_by (описывается через). Обратная связь с Population зависит от подкласса Parameter: - Cardinality_parameter (параметр кардинального числа), для ссылки на Population (население) используется свойство cardinality_of (кардинальное число); - Sum_parameter (сумма), для ссылки на Population (население) используется свойство sum_of (сумма); - Mean_parameter (среднее значение), для ссылки на Population (население) используется свойство mean_of (среднее значение). Parameter (параметр) связывается с переменной Variable (переменная) через свойство parameter_of_var (параметр переменной), которая задает свойство переменной/данных, которое должно быть суммировано, усреднено и т.д. по совокупности. Variable имеет свойство данных has_Name (наличие имени), которое определяет имя переменной/свойства. Имя указывается в виде строки, поскольку свойство не может быть значением другого свойства в версии OWL . В статистике почти всегда измеряется только часть населения. Часть представлена классом Sample (выборка), а измеряемый параметр представлен как подкласс Statistic (статистика). Переменная, для которой измеряется параметр, определяется классом Observation (наблюдение), на который Statistic ссылается через свойство is_composed_of (состоит). Фактическая переменная, которая является подклассом Variable (переменная), связана с Observation (наблюдение) через свойство is_a_characteristic_of (является характеристикой).
Рисунок 11 - Онтология статистики
9.3 Формальная спецификация9.3 Формальная спецификация
Основные классы статистики представлены в таблице 7. Префикс "geo" относится к пространству имен Geonames.
Таблица 7 - Основные классы статистики
В таблице 8 представлены свойства понятий статистики.
Таблица 8 - Свойства понятий статистики
10 Население 10 Население 10.1 Общие положения10.1 Общие положения
Измерение параметров населения лежит в основе городских показателей. Население может включать не только людей, а набор рассматриваемых вещей в статистическом смысле. По показателям образования население включает обучающихся и учителей. По показателям окружающей среды население может включать показания датчиков, снятые в разные моменты времени. По показателям пожарной безопасности население может включать события экстренного вызова. В последующих подразделах определена семантика населения, что позволяет моделирование определения показателя и его вспомогательных данных.
10.2 Основные понятия и свойства10.2 Основные понятия и свойства
10.2.1 Степень принадлежности Принадлежность представителя к Population (население) отмечается свойством defined_by (характеризуется), которое определяет необходимые и/или достаточные условия для принадлежности к населению (рисунок 12).
Рисунок 12 - Определение принадлежности к населению
На примере образования для определения группы обучающихся класс Population (население) связывается с классом gcie:Student (обучающийся) с использованием свойства defined_by (характеризуется). Определение gcie:Student (обучающийся) должно удовлетворять ГОСТ Р ИСО 37120 в части полноты условий принадлежности к Population (население). Примечание - Префикс gcie относится к онтологии обучения GCI [9].
На рисунке 13 показана часть числителя паттерна показателя (рисунок 2), относящаяся к обучающимся. Численность обучающихся определяется по классу gcie:Student (обучающийся). Описательная логика класса Student (обучающийся) определяет необходимые и достаточные условия принадлежности к группе Student (обучающийся). Например, одним из таких условий является наличие свойства has_enrollment (наличие регистрации), связанного с классом Enrollment (регистрация). В разделе 11 приведено определение класса gcie:Student (обучающийся).
Рисунок 13 - Часть числителя паттерна показателя, относящегося к выборке обучающихся
10.2.2 Пространственная протяженность Вторым требованием для представления населения является определение пространственной области нахождения населения. Область может охватывать как весь город, так и его часть. Изменения пространственной протяженности могут быть связаны с административными изменениями, такими как объединение городов и деревень, делением городов на несколько городов, а также могут быть вызваны решением измерения населения части города. При изменении пространственной протяженности города, должен быть создан новый экземпляр для представления новой версии города. Существует два подхода к определению пространственной протяженности населения. В первом подходе физическая область идентифицируется по названию места, известному как топоним, а во втором - по географическому пространству. Топонимы могут не только идентифицировать города, но и использоваться для определения любого типа места, включая деревни, кварталы, парки, здания, холмы, больницы и школы. При использовании топонимов есть дополнительное требование уникально идентифицировать место в связи с тем, что названия часто дублируются по миру. Для уникальной идентификации используются различные реестры. Например, в британском Управлении геодезии и картографии ведется реестр географических названий. Веб-сайт и пространство имен Geonames содержит более десяти миллионов географических названий, каждое из которых имеет уникальный IRI [10]. IRI реестра Управления геодезии и картографии связаны с IRI Geonames с помощью свойства OWL sameAs (тождественно), что позволяет использовать несколько IRI для ссылки на одно и то же место. Корневым классом онтологии географических имен является Feature (характеристика), который включает свойства: - featureCode (код свойства). Определяет типы мест, в том числе: - A: страна, регион и т.д.; - H: ручей, озеро и т.д.; - L: парки, площадь и т.д.; - P: город, деревня и т.д.; - R: дорога, железная дорога и т.д.; - S: пятно, здание, ферма и т.д.; - T: гора, холм, скала и т.д.; - U: подводное пространство; - V: лес, болото и т.д. Например, P.PPLA - это код функции для "места административного деления первого порядка". - parentCountry (страна). Определяет стандартный код ИСО для страны. - wgs84_pos:lat (широта) и wgs84_pos:long (долгота). Определяют широту и долготу места, используя свойства wgs84_pos (геопозиционирование). Параллельно с разработкой географических названий была разработана таксономия Schema.org для пометки содержимого веб-страницы соответствующими классами и свойствами, что облегчает индексацию содержимого поисковыми системами. Schema.org предоставляет широкий набор классов, связанных с местоположением, например, City (город), State (субъект федерации), Airport (аэропорт), Mountain (гора), которые могут быть использованы для расширения Features (характеристики). Вторым методом определения пространственной протяженности населения является указание геопространственного положения, например, путем указания многоугольника. Существует ряд геометрических онтологии, которые представляют геометрические классы, такие как Point (точка), Line (линия), Circle (круг) и Polygon (многоугольник), и связывают их с помощью таких свойств, как пересечения, перекрытия, включения и непересечения. Названия мест могут быть интегрированы с геопространственной информацией путем указания конкретного названия места экземпляру Polygon (многоугольник). Название места можно связать с геопространственным многоугольником, который ограничивает город. На рисунке 14 показана интеграция географического названия и геопространственной информации с классом Population (население). Свойство location_in (положение в) в Population позволяет указывать как IRI названия места, так и его пространственную геометрию.
Рисунок 14 - Интеграция пространственной протяженности
10.2.3 Временная протяженность Третьим требованием для представления населения является указание периода времени рассмотрения населения. Периоды, в течение которых измеряется население, могут варьироваться в зависимости от времени начала, времени окончания, продолжительности и степени детализации. Например, в показателе соотношения обучающихся и учителей численность обучающихся может быть посчитана в 2012 году, а численность учителей - в 2013 году. Или более конкретные даты начала и окончания могут быть указаны в одном году, например, с 1 февраля 2013 года по 28 марта 2013 года для обучающихся и с 15 сентября по 30 ноября для учителей. Важна возможность указать период времени на любом уровне детализации. Онтология OWL-Time удовлетворяет указанным требованиям и обеспечивает представление временных точек, интервалов и длительностей, а также их спецификацию на любом уровне детализации: год, месяц, неделя, день, час, минуты и секунды. Онтология OWL_Time предоставляет широкий набор временных связей, таких как "до", "наложения" и "во время", которые можно использовать для анализа временных точек и интервалов. Определение Population (население) расширяется добавлением свойства for_time_interval (для интервала времени). Диапазоном свойствам является DateTimelnterval (интервал даты и времени), который указывает начальную и конечную дату/время для Population. На рисунке 15 представлено указанное дополнение.
Рисунок 15 - Интеграция временной протяженности
10.2.4 Измеряемая переменная Четвертым требованием для представления населения является представление измеряемого параметра/статистики. Показатель соотношения обучающихся и учителей основан на измерении количества обучающихся и учителей в населении, обозначенном городом Placename (географическое название). Расчет показателя может быть рассмотрен как статистическое измерение в том смысле, что необходимо измерить численность населения и подсчитать количество членов, которые удовлетворяют описанию учащегося и учителя соответственно. В то время как соотношение обучающихся и учителей требует подсчет населения, другие показатели могут потребовать статистических показателей среднего значения, отклонения и других характеристик населения. На рисунке 16 показаны расширения, внесенные в онтологию статистики для учета измерения кардинального числа населения, а также суммы, среднего значения и стандартного отклонения свойства по представителям населения. Sum (сумма), Mean (среднее значение), Standard_deviation (стандартное отклонение) и Cardinality (кардинальное число) являются подклассами Parameter (параметр) и имеют обратную ссылку на Parameter (параметр) и прямую ссылку parameter_of_var (параметр переменной) на переменную Variable (переменная), которую они измеряют (за исключением Cardinality (кардинальное число)). - CardinalityParameter (параметр кардинального числа), связывается с использованием свойства cardinality_of (кардинальное число); - SumParameter (параметр суммы), связывается с использованием свойства sum_of (сумма); - MeanParameter (параметр среднего значения), связывается с использованием свойства mean_of (среднее значение); - Standard_deviation (стандартное отклонение), связывается с использованием свойства std_of (стандартное отклонение). Variable (переменная) содержит свойство has_Name (наличие имени), которое идентифицирует свойство, которое определяет принадлежность к Population (население). Из-за ограничений DL значение has_Name (наличие имени) является строкой, а не свойством.
Рисунок 16 - Расширения онтологии статистики
Parameter (параметр) связывается с переменной Variable (переменная) через свойство parameter_of_var (параметр переменной), которое задает свойство переменной/данных, которое должно быть суммировано, усреднено и т.д. по совокупности. Variable (переменная) имеет свойство данных has_Name (наличие имени), которое определяет имя переменной/свойства. Имя указывается в виде строки, поскольку свойство не может быть значением другого свойства в версии OWL . Каждый подкласс Parameter (параметр) наследует свойство parameter_of_var (параметр переменной), которое связывает его с переменной (свойством данных) членов совокупности, для которой выполняется вычисление (сумма, среднее и т.д.). На рисунке 17 показана интеграция суммирования параметров по населению для переменной.
Рисунок 17 - Интеграция суммирования параметров по населению
10.3 Формальная спецификация10.3 Формальная спецификация
В таблицах 9 и 10 представлено расширение основных статистических классов 9.2 с типами параметров и их измеряемыми переменными.
Таблица 9 - Расширение основных статистических классов
Таблица 10 - Свойства основных статистических классов
11 Пример 11 Пример 11.1 Описание11.1 Описание
На рисунке 18 изображена структура показателя "соотношение количества обучающихся и учителей". Student_teacher_ratio (соотношение количества обучающихся и учителей) является подклассом количества, и его значением является Student_teacher_ratio_measure (измерение соотношения количества обучающихся и учителей) с единицей измерения population_ratio_unit (единица соотношения населения). Числителем показателя является Student_population_size (размер населения обучающихся), знаменателем - Teacher_population_size (размер населения учителей), оба являются подклассами Cardinality (кардинальное число). Student_population (население обучающихся) определяется gcie:-Student (студент) через свойство defined_by (характеризуется) и расположен в sc:City (город). Student (студент) определяется как имеющий свойство gcie:has_Enrollment (наличие регистрации). Teacher_population (население учителей) определяется gcie:Teacher (учитель) и расположен в sc:City (город). Teacher (учитель) определяется как имеющий свойство gcie:has_Placement (наличие трудоустройства).
Рисунок 18 - Онтология верхнего уровня для показателя соотношения количества обучающихся и учителей
11.2 Спецификация11.2 Спецификация
В таблице 11 представлена спецификация показателя соотношения количества обучающихся и учителей.
Таблица 11 - Спецификация показателя соотношения количества обучающихся и учителей
Приложение ДА (справочное). Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандартеПриложение ДА
Сведения о соответствии ссылочных национальных стандартов международным стандартам, использованным в качестве ссылочных в примененном международном стандарте
Таблица ДА.1
БиблиографияБиблиография
|