Построение распределенной информационной системы на базе протокола Z39.50 (ISO 23950) для БД CDS/ISIS

 

О.Л. Жижимов., Н.А.Мазов,

Объединенный институт. геологии, геофизики и минералогии Сибирского Отделения РАН

 

В настоящем докладе описывается один из возможных способов построения информационной системы доступа к библиографическим базам данных (на примере CDS/ISIS), распределенным по мини-серверам, на основе протокола Z39.50. Описываемая система частично реализована на сети NT-серверов ОИГГиМ СО РАН и находится в настоящее время в режиме опытно-промышленной эксплуатации,(http://geolibr.uiggm.nsc.ru, z3950: geolibr.uiggm.nsc.ru:210).

Толчком для создания подобного программного комплекса в ОИГГиМ СО РАН явилась задача организации унифицированного сетевого доступа к библиографическим базам данных Института, находящихся под управлением интегрированной информационно-поисковой системы CDS/ISIS /M версии 3.0 [1, 2, 3] (далее - ISIS), имеющейся также в библиотеках академических институтов СО РАН, в ГПНТБ СО РАН, с использованием возможностей сети Internet и сервиса World Wide Web, предоставляемого этой сетью. При этом принимались во внимание следующие необходимые условия:

Эти условия определяют требования к информационной системе, предназначенной для обеспечения доступа к библиографическим базам данных через Internet с использованием широко распространенных Web-броузеров типа Netscape или MS Internet Explorer:

Общая схема информационной системы

Согласно опыту, полученному в ОИГГиМ СО РАН в результате разработки и эксплуатации собственной системы доступа к библиографическим базам данных [4], и требованиям, предъявляемым к подобной системе, распределенная информационная система представляется в виде 3-4 уровневой структуры с разграничением функций на каждом уровне и фиксацией протоколов межуровневого потока данных. Разграничение на логически замкнутые функциональные уровни необходимо для возможности их реализации на разных физических серверах и добавления в дальнейшем новых возможностей.

Уровень 1: Собственно данные представляют собой обычные файлы данных в формате, необходимом для работы сервера БД. В случае CDS/ISIS данные хранятся в виде набора файлов в отдельном каталоге для каждой БД в кодировке, принятой в MS-DOS. Кроме собственно данных каталог может включать информацию о предопределенных форматах для отображения данных и файл заголовка для расширенного названия БД.

Уровень 2: Сервер баз данных реализует основные функции выборки информации из БД. Для публичной информационной системы эти функции сводятся к следующим

Сервер БД должен обрабатывать следующие запросы:

Таблица 1

Информационный

запрос на информацию о конкретной базе данных

Словарный

запрос на список ключевых слов с параметрами

Форматный

запрос на предоставление списка предопределенных форматов вывода данных

Основной

запрос на предоставление данных в требуемом формате с параметрами

Служебный

запрос на номер версии сервера БД

 

Сервер баз функционирует в многозадачной операционной системе в виде сервисной службы (Windows NT) или даймона (UNIX). Обмен информацией с уровнем 1 происходит через файловую систему (локальную или сетевую), с уровнем 3 – по протоколам TCP через фиксированный программный порт. В последнем случае для лучшей межплатформенной совместимости данные передаются только в текстовом виде.

Технически сервер БД состоит из двух частей: собственно сервера баз данных ISIS с функциями доступа к данным и сервисной службы, задача которой – обеспечение интерфейсов между операционной системой, потоками данных между уровнем 3 и собственно сервером БД. Эта сервисная служба также должна информировать сервер WWW о своем состоянии и конфигурации локальных баз данных. Конфигурационные метаданные передаются на SQL-сервер уровня 3 по отдельному каналу. Инициатором передачи выступает служба уровня 2.

Уровень 3: Сервер WWW с модулем управления серверами БД предназначен для обработки запросов пользователей, формирования запросов к серверам БД и возврата клиентам полученной информации по протоколу HTTP и спецификациям HTML. Оптимальным вариантом является Windows NT 4.0 + IIS 4.0 с поддержкой JAVA и ASP (Active Server Pages) ввиду тесной интеграции IIS с операционной системой и возможностью организации многопоточной обработки данных сравнительно простыми и дешевыми средствами. Управляющий модуль (диспетчер БД) может быть реализован в виде динамической библиотеки и (или) набора объектов ASP. В эксплуатируемом сегодня варианте (MS IIS 4.0) модуль представляет собой DLL, использующую интерфейс ISAPI. При этом диспетчер БД выполняет следующие функции:

Для эффективной работы по сбору информации о конфигурации всех серверов уровня 2 на уровне 3 используется SQL-сервер (в разрабатываемом варианте MS SQL 6.5). Наличие дополнительного сервера позволяет упростить обратную связь с уровнем 2 и использовать готовые решения. SQL-сервер также хранит всю статистику работы системы.

Для организации полнофункциональной системы достаточно перечисленных трех уровней. Однако при построении территориально распределенной системы с ярко выраженными районами и ненадежными линиями связи между ними желательно локализовать все три уровня в каждом районе с интеграцией последних на уровне 4.

Уровень 4: Диспетчер домена информационной системы представляет собой сервер WWW, функционально идентичный серверу уровня 3, но наделенный дополнительной функцией хранения информации о всей информационной системе в целом. В идеальном случае каждый из серверов уровня 3 должен быть готов взять на себя роль диспетчера домена. Основная задача диспетчера домена – получить информацию о конфигурации с каждого сервера уровня 3 и растиражировать ее по всем серверам.

Таким образом, общая схема распределенной информационной системы состоит из четырех логических уровней.

 Литература

 Шрайнберг Я.Л. Международная ассоциация пользователей CDS/ISIS: реальное взаимодействие и реальная польза для библиотек. В “Матер. междунар. конф. Крым-95”, 1, 1995, 28.

  1. Маршак Б.И., Гарбарчик В.А. ГПНТБ России – региональный центр ЮНЕСКО по распространению системы CDS/ISIS. В “Матер. междунар. конф. Крым-95”, 1, 1995, 58.
  2. Кириллова О.В., Мазов Н.А. Современные технологии в библиотеке академического института. В “Матер. междунар. конф. Крым-95”, 1, 1995, 218.
  3. Мазов Н.А., Жижимов О.Л. Организация доступа к базам данных CDS/ISIS-М из Internet. В “Матер. 3 междунар. конф. Крым-96”, 2, 1996, 177.