Блог
Кувшинова Л.А., Кувшинова К.А., Иоффе Р. А., Куприянова И. И., Володина И. С.
Проблемы организации территориально распределенной автоматизированной системы сбора, учета, хранения и использования информации о геологических коллекциях
ПРОБЛЕМЫ ОРГАНИЗАЦИИ ТЕРРИТОРИАЛЬНО РАСПРЕДЕЛЕННОЙ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ СБОРА, УЧЕТА, ХРАНЕНИЯ И ИСПОЛЬЗОВАНИЯ ИНФОРМАЦИИ О ГЕОЛОГИЧЕСКИХ КОЛЛЕКЦИЯХ
Л. А. Кувшинова, К. А. Кувшинова, Р. А. Иоффе, И. И. Куприянова, И. С. Володина
ФГУП ВИМС, Москва, Россия
Современная эпоха, переходная от индустриального общества к информационному, ставит перед геологической наукой как одну из главных задач сохранение накопленного минерального разнообразия.
Геологические образцы являются единственным источником объективных и достоверных сведений о составе геологических тел, а также единственным предметом идентификации природных геологических объектов с информацией, полученной в ходе их изучения, которое практически бесконечно. Информационная ценность ее обусловлена, с одной стороны, значением информации и информационных технологий в современном обществе, с другой удорожанием и сокращением объемов полевых работ, трудностью и дороговизной сбора каменного материала, утратой доступа ко многим объектам, а также наличием образцов из большого числа месторождений, не имеющих формационных аналогов за рубежом.
Вместе с тем, геологическая информация, содержащаяся в каменном материале, не имея ярко выраженного коммерческого интереса, в значительной части не востребована из-за низкой степени систематизации самого каменного материала и всего информационного поля, с ним связанного, разрозненности хранилищ каменных и архивных материалов, отсутствия доступного аппарата поиска и получения информации и даже данных о ее наличии. В настоящий период, в связи со сменой экономических условий, происходит уничтожение каменного материала, содержание которого не обеспечено ни нормативными документами, ни средствами финансирования.
Сохранение информационного поля уникальных коллекций, представляющих все генетические и формационные типы промышленных месторождений России, ближнего зарубежья и ряда других стран и характеризующихся высокой степенью изученности каменного материала, является одной из наиболее актуальных проблем на данном этапе развития геологии и требует безотлагательного проведения инвентаризации каменного материала и всего информационного поля, с ним связанного, путем создания информационной системы.
Инвентаризация позволит не только сохранить уникальный каменный и связанный с ним информационный материалы, собранные специалистами в процессе участия в широкомасштабных геолого-разведочных работах в течение нескольких десятилетий, но и значительно расширить круг пользователей этим материалом, что обеспечит максимальную эффективность анализа накопленных данных.
Основные проблемы сбора и хранения информации
Основные проблемы создания информационной системы (ИС) каменного материала (КМ) связаны с особенностями информационной инфраструктуры накопленного материала, проблемой выбора компьютерных технологий и концепцией создания ИС.
а) Особенности информационной инфраструктуры каменного материала.
Разрозненность хранилищ каменных и архивных материалов, функционирующих в составе организаций различных ведомств подчиненности и разных форм собственности, приводит к высокой степени рассеянности каменного материала и связанного с ним информационного поля. Только незначительная часть коллекционного материала систематизирована на локальном уровне.
Информационное поле каменного материала представляет собой многоуровневую систему описания от макросистемы геологического объекта до микросистемы атомно-электронного строения минерала.
Информационный потенциал каменного материала безграничен. Кроме реально существующей информации, образцы каменного материала являются носителями виртуальной составляющей информации. Дальнейшее развитие позволит в будущем проводить более тонкое изучение структурных особенностей накопленного каменного материала и получать новую информацию, недоступную на сегодняшний день.
Информация слабо формализована: имеются существенные отличия в объемах изученности каменного материала и разный уровень систематики; ряд геологических понятий не является общепризнанным; геолого-генетические модели носят характер концепций, а информация, связанная с результатами экспериментальных исследований, не является по большому счету линейной.
В общем случае информационное поле каменного материала представляет собой территориально рассеянное, неупорядоченное, гетерогенное, разномасштабное, нелинейное с виртуальной составляющей множество данных. Оптимальным в этом случае является сбор информации в распределенную базу данных (БД) открытого типа.
б) Проблема выбора практичной среды БД.
При выборе системы управления базами данных (СУБД), представляющей собой сочетание языка программирования и разработанного инструментария, правильно было бы ориентироваться на продукт от первоклассного поставщика. Однако, такой подход требует больших затрат на начальном этапе работ и вряд ли является оправданным. Дело в том, что темпы реализации программного продукта значительно отстают от темпов развития компьютерных технологий. Поэтому естественное стремление поддерживать современный уровень разработок приводит к значительному удорожанию работ, требуя постоянной модернизации и адаптации решаемой задачи к новым стремительно меняющимся техническим и технологическим условиям. Более того, высокий уровень рассредоточенности и разнородности информационной инфраструктуры, связанной с КМ, и разный уровень компьютеризации на местах диктует выбирать СУБД из продуктов, предназначенных для персональных компьютеров (РС) типа dBase, MicrosoftAccess, VisualFoxpro. Однако СУБД, имеющие персональный уровень архитектуры, примерами которых являются VisualdBase и MicrosoftAccess, предназначены только для очень мелкомасштабных проектов и не должны работать с многопользовательскими приложениями. Если мы хотим собрать максимально возможный объем рассеянной информации (включая и виртуальную составляющую), следует ориентироваться на СУБД, имеющую мобильный уровень архитектуры с мощным языком программирования и форматом данных, совместимым с современными компьютерными технологиями. Они разрабатываются для удаленных пользователей, которые обычно не соединены с сетью. Мобильная СУБД дает доступ к локальной базе и позволяет изменять ее на портативном компьютере. Кроме того, мобильная СУБД предоставляет механизм синхронизации изменений удаленной базы данных с централизованной базой данных.
в) Концепция предлагаемого подхода.
Концепция основана на революционных изменениях, произошедших в уровне и качестве компьютеризации в последние годы. Широкая «демократизация» процесса доступа к персональным компьютерам приблизила экспертов (источники информации), владеющих эксклюзивным объемом информации, к электронным способам сбора и хранения информации, что дает возможность создавать автономные клиентские рабочие места (КРМ), проводить формализацию отдельных порций информации и, используя сетевые возможности, накапливать собираемую информацию в неограниченном объеме. Отдельные порции информации являются элементами кластера информации, скомпонованного в рамках автономного КРМ. Каждый элемент кластера имеет статус доступа к информации: в режиме ввода или только чтения. Такой подход позволяет сделать акцент на выборе формата данных, совместимого с современными технологиями, как наиболее консервативного элемента в процессе создания ИС, а проблему выбора уровня компьютерных технологий оставить до того времени, когда в этом возникнет необходимость.
Предложения по реализации
Анализ существующих технологий создания реляционных баз данных, особенностей геологической информации на природных носителях, уровня развития компьютерных технологий и требований, предъявляемых к ИС каменного материала, показал, что ориентироваться при решении данной проблемы следует на сетевой характер продукта при создании административной вертикали.
Высокий уровень рассеянности информации требует создания автономных КРМ, максимально приближенных к источникам информации, которые должны быть рассчитаны на стандартное оборудование и стандартное программное обеспечение и допускали бы сравнительно простое и дешевое наращивание возможностей.
Часть информационного поля каменного материала носит описательный характер и является общей для всех «источников информации» (названия месторождений, минералов, список авторов коллекций и т. п.). Первоначально создается управляющий блок – “администратор”, который содержит в виде справочников всю необходимую общую описательную информацию о каменном материале и выполняет ряд функций, в частности, создает и поддерживает модели ИС для различных «источников информации» и пользователей собранной информации.
Различный уровень систематики накопленной информации требует создания программного продукта на базе мобильной СУБД, что позволит избежать анархии в формах при сборе информации на местах, связанной с человеческим фактором и, в тоже время, достаточно гибко реагировать на изменения используемых стандартов в процессе итерации. В отличие от мобильных СУБД, персональные достаточно легко позволяют менять формы на местах сбора информации и неоправданно тяжело – проводить изменения в используемые стандарты.
Среди современных реляционных СУБД, получивших наибольшее распространение в качестве инструмента создания и поддержки информационных систем различного уровня СУБД, Visual FoxPro на мировом рынке знают как гибкое и мощное приложение разработки баз данных. Надежные инструментальные средства и объектно-ориентированный язык, специализированный для работы с данными, идеально подходят для создания современных масштабируемых многоуровневых корпоративных приложений, интегрируемых в архитектуру “клиент–сервер” и Internet.
В целом все КРМ должны быть объединены в корпоративную сеть создателей продукта. При необходимости часть КРМ объединяются в узлы корпоративной сети (по территориальному, ведомственному признакам, научному интересу, и т.д.).
Современное состояние компьютерных технологий, уровень материально-технической базы хранилищ КМ, современное представление о работе с крупными массивами информации, анализ опыта предыдущих работ (в частности, работ проводимых в ВИМСе в 90-е годы) по структурированию накопленной информации и созданию банков данных информационного поля каменного материала (как локального, так и корпоративного характера) и многолетние наработки, имеющиеся в нашем распоряжении, позволяют предложить итерационный кластерный подход к проблеме создания информационной системы, приводящий к масштабируемому решению.
Идея принципиально нового подхода к сбору и систематизации информации заключается в том, чтобы к формализации данных подойти итерационно, проводя формализацию отдельных порций данных.
Разработка программного продукта, начинаясь с формализации данных отдельно взятых «источников информации», владеющих определенным объемом эксклюзивной информации, осуществляется в рамках всего объема информации, известного разработчикам на текущий момент. Сбор информации проводится в определенном формате, структура которого динамически модифицируется по мере увеличения объема в зависимости от особенностей собираемой информации, т. е. не происходит навязывания формата клиентским рабочим местам. Структура БДкорректируется на основе всего объема данных, получаемого от источника информации.
На начальном этапе разработки система будет организована в виртуальную сеть, т. е. в отсутствии сетевого оборудования создается сетевое приложение.
Подобный подход обеспечит многопользовательский характер созданного продукта, предельно возможную полноту собранной информации и позволит проблему сбора информации решать независимо от решения проблемы финансирования дорогостоящего (сетевого) аппаратного, программного и обслуживающего обеспечения.
Реализация (схема)
Начата практическая реализация создания ИС сбора и хранения информации на базе информационного поля каменного материала бериллиевых месторождений. В настоящий момент создано два программных приложения: так называемый “Администратор” (управляющий блок) и Приложение-КРМ0, предназначенное для обслуживания модели КРМ. Часть информации для этих приложений была импортирована из ранее созданных файлов типа xls, содержащих таблицы образцов каменного материала бериллиевых месторождений с привязкой и другими параметрами.
Блок “Администратор” выполняет несколько функций.
а) Создает справочники двух типов, содержащие всю необходимую общую описательную информацию о каменном материале. Один тип справочников – общероссийские классификаторы и словари, используемые в отрасли (название месторождений, минералов и т. п.). Другой тип формируется на базе информации, исходящей от конкретного источника информации (авторы, привязка, параметры экспериментальных исследований и т. п.). Справочники формализуют информационное поле каменного материала, что дает возможность создать более тонкую запросную систему для обработки собираемой информации.
б) Создает модель автономного КРМ кластерного типа. Для создания модели необходимо зарегистрировать КРМ, указав имя (клиента), имя локального диска на РС клиента, название каталога (папки, директории), а также зафиксировать тип эксклюзивной информации, которой владеет данный «источник информации». На локальном диске клиента будет организована модель КРМ, а в каталоге будет формироваться (создаваться) файловая система базы данных.
Далее выполняется формирование кластера КРМ. Первоначально каждому элементу кластера присваивается статус доступа к информации. После чего определяется круг необходимой справочной информации (название месторождений, минералов и т.п.) для данного клиента.
в) Выполняет обмен информации между “Администратором” и Приложением, обслуживающим модели КРМ. Обмен возможен любым способом: от простого переноса информации с использованием электронных носителей до обмена по локальным и глобальным сетям.
Второе Приложение создано для обслуживания модели КРМ. Вся сформированная в “Администраторе” информация переписывается на РС клиента.
Для элементов кластера со статусом «ввод» выполняется ввод информации по КМ. Используя текстовое описание образца, создается третий тип справочников, который формирует непосредственно сам клиент. Накопленную клиентом информацию можно передать “Администратору”, который, собирая информацию от различных клиентов, формирует виртуальный сервер.
На создание начального КРМ требуется работа одного программиста с «источником информации» (в течение нескольких месяцев). Многие рабочие места по структуре информационного поля однотипны. Однотипные КРМ создаются путем тиражирования с незначительными коррекциями ранее созданной программы. Каждый “источник информации” осуществляет наполнение своей собственной ИС.
Таким образом, решается задача сбора информации непосредственно от “источника информации”. В этом случае результаты многолетних экспериментальных исследований будут корректно и квалифицированно обработаны и собраны непосредственно исполнителем с учетом поправок на модернизацию экспериментальной базы, смены коллекции стандартных образцов и т. п., что обеспечит высокий уровень надежности и достоверности собираемых данных. Создание клиентских рабочих мест приводит к авторизации информации, т. к. информация для ввода и корректировки предоставляется только клиенту рабочего места, который и является “источником информации”.
Таким образом, “Администратор” создает модель и поддерживает ИС. “Источник информации” вводит и корректирует свои данные. Аккумуляцией всей необходимой информации в модель ИС для решения конкретной геологической задачи занимается непосредственно пользователь этой информации. Собранная таким образом информация может быть в оперативном режиме импортируема в любую современную компьютерную технологию.
Так как на начальном этапе данной разработки накопление информации выполняется одним “источником информации”, то работа возможна как на простом РС, так и в любой корпоративной сети при создании некоторых интерфейсов. Архитектура РС должна поддерживать системы на платформе Windows.
Выводы
- Идея организации виртуальной сети позволяет создать распределенную базу данных совместного доступа экономически оправданным способом: при минимальных финансовых вложениях на начальном этапе работы и любыми порциями, а результат получать в оперативном режиме.
- Итерационный подход к сбору информации позволяет увеличивать степень формализации информации.
- Подобный подход дает возможность:
а) собрать весь объем информации, имеющийся у «источника информации». При этом ввод данных максимально приближен к «источнику информации», который не лишается права на свою интеллектуальную собственность.
б) создать пользовательскую модель ИС любой степени наполненности и форматом данных, совместимым с любой современной компьютерной технологией.
- Масштабируемое решение, используемое для систематизации накопленной информации, обеспечивает созданному продукту отсутствие ограничений роста объема информации и функциональных возможностей, т. к. постановказадачи в этом случае имеет плавающий характер (фиксируется на текущий момент времени). Все этообеспечивает эволюционность ИС при использовании стандартного аппаратного и программного обеспечения.
- Предлагаемая гибкая форма банка удобна для работы с разнородными объектами, которые изучены и описаны с разной степенью детальности. Кроме того, существенным преимуществом этой системы является обработка по объектам разной природы, требующим разной рубрикации при формировании базы данных, например, месторождения разных генетических типов – магматогенных, гидротермальных, осадочных и т. д. Не нужно проводить громоздкой унификации терминов.
- Данный подход дает возможность выполнить систематизацию и формализацию не только музейных, но и рабочих коллекций.
- КРМ, создаваемые на стандартном аппаратном и программном обеспечении, позволяют выполнять сбор информации в камеральных условиях.