Подсистема «Геобанк»
Система классификации и кодирования объектов должна быть достаточно полной и обеспечивать решение всех комплексов задач АИПС ГЭМ. Структура системы АИПС ГЭМ предполагает, что большинство задач решается на нескольких уровнях детальности. При этом, как известно, требуется различный уровень генерализации информации о состоянии геоэкологической среды и воздействующих на нее факторах, получаемой на пунктах наблюдений. Следовательно, система классификации и кодирования информации должна обеспечивать ввод и хранение данных в том виде, в каком они приведены в первоисточнике, а также в генерализованном представлении, необходимом для решения задач определенного типа.
Для решения большинства задач, связанных с диагностикой и прогнозированием состояния геоэкологической среды, необходимо установление однозначного соответствия между наборами показателей, свойств и состояния среды, координатным пространством и исследованием этих показателей. В связи с этим система АИПС ГЭМ должна иметь развитую систему классификации и кодирования объектов территориального деления, позволяющую осуществлять поиск, систематизацию и обработку характеризующих их данных применительно к различным масштабам исследований. При этом, необходимым условием автоматизации решения различных комплексов задач является наличие четких и однозначных правил классификации объектов, их композиции и декомпозиции.
Система классификации и кодирования должна удовлетворять и ряду других требований, имеющих общий характер. Таким образом, по степени сложности, задача создания эффективной словарной системы приближается к задаче создания всей системы организации структуры базы данных. Поэтому на стадии проектирования банка данных этой задаче должно уделяться соответствующее внимание.
В предлагаемой концепции ГЕОБАНКА используется иерархическая и многоаспектная системы классификации. Иерархическая система классификации применяется в тех случаях, когда множество объектов одного типа последовательно подразделяется на более простые объекты по разработанным правилам.
Многоаспектная система классификации предполагает деление множества объектов одновременно по нескольким независимым признакам.
Процесс создания словарной системы проходит в несколько стадий. Сначала определяются общие контуры этой системы, предварительный перечень классификаторов, осуществляется поиск приемов кодирования информации. По мере отработки перечня показателей, хранимых в базе данных, работы с реальными массивами данных, извлекаемых из первоисточников, неизбежны изменения и дополнения словарной системы. При этом важно, чтобы это не приводило к необходимости повторного ввода данных в новой форме.
Одно из главных назначений словарной системы состоит в документировании данных. Так как базы данных обслуживают многих пользователей, крайне необходимо, чтобы они правильно понимали, что представляет собой каждый показатель, и придерживались выработанных соглашений о системах их классификации и кодирования. Эти соглашения в виде определений, описаний, инструкций должны быть точными, недвусмысленными и согласованными.
Словарная система АИПС ГЭМ является проблемно-ориентированной, т.е. учитывает особенности решаемых задач, применяемых математических моделей природных объектов, методов получения информации в разные годы. Поэтому значительная часть классификаторов предназначена для использования в пределах системы. Это значительно упрощает, например, ввод в систему ретроспективной информации, представленной в первоисточниках в нетрадиционной форме. Кроме того, применение локальных классификаторов позволяет, как правило, сократить длину записей значений показателей и упростить их кодовые обозначения. Обмен информации с другими информационными системами в этом случае возможен через специальный интерфейс.
Система кодирования включает совокупность правил присвоения и записи кодовых обозначений информационных объектов и показателей. Система кодирования является комбинированной, основанной на совместном использовании порядковых и разрядных кодовых обозначений. При порядковой системе каждому элементу кодируемого множества присвоен номер по порядку без каких либо пропусков, что обеспечивает минимальную длину кода. Этот метод кодирования используется для относительно небольших и простых структур, имеющих строго упорядоченный перечень элементов. В некоторых случаях допускаются пропуски в порядковой нумерации, обеспечивающие необходимый резерв емкости классификатора.
Разрядная система применяется для кодирования нескольких различных совокупностей признаков при многоаспектной классификации.