28
IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных Информация, которой можно доверять Программное обеспечение IBM Information Management

IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

Информация, которой можно доверять

Программное обеспечение IBM

Information Management

Page 2: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение
Page 3: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 3

Содержание

3 Интеграция информации и поддержка

коллективной деятельности

4 Оптимизация разработки с помощью

унифицированных метаданных IBM InfoSphere

Information Server

5 Три подхода к интеграции информации

7 Поддержка несколько пользовательских ролей

посредством унифицированных метаданных

9 Лучшая в отрасли архитектура метаданных

обеспечивает гибкую интеграцию с высокой

степенью масштабируемости

11 Интегрированные модули IBM InfoSphere

Information Server

11 Отраслевые модели данных IBM (IBM Industry Data

Models) и модуль IBM Rational Data Architect

13 IBM InfoSphere Business Glossary

15 IBM InfoSphere Information Analyzer

17 IBM InfoSphere FastTrack

17 IBM InfoSphere DataStage и InfoSphere QualityStage

20 IBM InfoSphere Information Services Director

22 IBM InfoSphere Import Export Manager

22 IBM InfoSphere Metadata Workbench

24 Развертывание IBM InfoSphere Information Server

на основе архитектуры унифицированных

метаданных

26 IBM InfoSphere Information Server помогает органи-

зациям использовать возможности работы с мета-

данными в интересах интеграционных проектов

Интеграция информации и поддержка коллективной деятельностиИнтеграция информации – это чрезвычайно сложная

задача, решение которой затрагивает все аспекты

функционирования предприятия. Это решающий

фактор, определяющий успех или неудачу бизнеса,

а во многих случаях – и само выживание бизнеса.

Сегодня организации сталкиваются с целым рядом

трудностей, которые так или иначе связаны с обра-

боткой информации. К ним относятся различные и

во многих случаях неизвестные проблемы качества

данных, разногласия относительно смысла и контек-

ста информации, необходимость проведения несколь-

ких сложных преобразований и использования суще-

ствующих процессов интеграции вместо повторной

разработки с нуля. Кроме того, организации стра-

дают от непрерывного увеличения количества

данных, сужения окон обработки. Они все острее

нуждаются в качественном мониторинге и поддержа-

нии безопасности, чтобы гарантировать соответствие

внутригосударственным и международным законам.

Ситуация дополнительно усложняется вследствие

того, что для решения проблем интеграции многие

организации внедрили огромное количество разно-

родных инструментов. Совместное развертывание

этих инструментов в рамках единого, зрелого и

управляемого процесса имеет критически важное

значение для успеха бизнеса. Тем не менее организа-

ции часто тратят больше времени на интеграцию

приобретаемых ими технологий и на формирование

новых процессов для использования этих фрагменти-

рованных решений, чем на интеграцию своих соб-

ственных данных, что позволило бы справиться с

реальными проблемами, стоящими перед бизнесом.

Page 4: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

4 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

архитектура которой основана на сервисах и едином

репозитории активных метаданных. Эта платформа

позволяет организациям сконцентрировать свои

усилия на интеграции данных с целью повышения

их ценности для бизнеса, а не заниматься интегра-

цией продуктов от нескольких поставщиков, при

разработке которых никогда не ставилась задача

их совместного использования.

Платформа унифицированных метаданных IBM®

InfoSphere™ Information Server позволяет компаниям

открыть для себя три ключевых фактора успеха, необ-

ходимые для истинной интеграции информации:

• групповая деятельность;

• доверие;

• соответствие нормативным требованиям.

Чтобы воспользоваться этими возможностями, пред-

приятию необходимо применить комплексный

подход к организации жизненного цикла разработки

системы. При этом предприятие должно учитывать

не только технологии, но и людей, а также ассоции-

рованные с ними процессы. Для того чтобы полу-

чить детальную картину деятельности организации

и поставлять достоверную информацию по требова-

нию, необходимы возможности для получения и

совместного использования всего комплекса дело-

вых, технических и операционных метаданных,

которые генерируются различными сообществами.

Запатентованный репозиторий метаданных и серви-

сов платформы IBM InfoSphere Information Server

предназначен для поддержки стратегии унифика-

ции метаданных, которая помогает оптимизировать

коммуникации и коллективную деятельность, а

Поддержка процесса интеграции вручную снижает

эффективность не только разработки, но и коллек-

тивной деятельности. В рамках типового интеграци-

онного процесса моделирование данных начинается

с формирования целевой модели данных.

Полученные в результате этого структуры данных

отсылаются бизнес-аналитикам и аналитикам

данных, которые вручную определяют специфика-

ции для отображения источника на назначение

(source-to-target), исходя при этом из своего понима-

нии профиля данных, которое иногда является

правильным, а иногда – неверным.

Как правило, вышеупомянутая спецификация ото-

бражения хранится в электронной таблице

Microsoft® Excel®, которая распечатывается и отсыла-

ется разработчику для ручного преобразования в

ETL-задание (extract, transform, load – извлечение,

преобразование, загрузка). Отсутствие автоматиза-

ции и аудиторских контрольных журналов в этих

трудоемких процессах замедляет выполнение про-

екта, повышает вероятность ошибок и сводит к

минимуму возможность повторного использования

компонента другими сотрудниками или в рамках

новых проектов.

Оптимизация разработки с помощью унифицированных метаданных IBM InfoSphere Information ServerБазируясь на своем многолетнем опыте, полученном

при проведении нескольких тысяч проектов у раз-

личных клиентов, корпорация IBM устранила эти

«врожденные» препятствия. Для интеграции инфор-

мации IBM создала унифицированную платформу,

Page 5: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 5

успешной попытки интеграции репозитория метадан-

ных с целью создания истинной платформы для кор-

поративной инфраструктуры.

Интеграция репозитория метаданных является

значительно более сложной и трудной задачей,

поскольку она заставляет собирать информацию,

рассредоточенную между несколькими процессами.

Такой подход консолидирует информацию в едином

репозитории, а затем снова открывает ее многочис-

ленным пользовательским ролям, чтобы пользователи

и процессы смогли более эффективно с ней работать.

Это действительно весьма трудная задача, однако

способность к немедленному обмену информацией

не только между несколькими пользовательскими

ролями и задачами, но и между несколькими интегра-

ционными процессами и проектами позволяет компа-

нии извлечь максимум из своих инвестиций и повы-

сить общую эффективность своего процесса разра-

ботки. Платформа IBM InfoSphere Information Server

призвана поддержать такую результативную интегра-

цию: она позволяет организации сконцентрировать

свои усилия на преодолении сложных бизнес-проблем

вместо того, чтобы заниматься интеграцией отдель-

ных технологий профилирования, очистки, извлече-

ния, преобразования и загрузки данных.

IBM InfoSphere Information Server представляет

собой унифицированный набор модулей, призван-

ных оптимизировать процесс построения приложе-

ния для интеграции данных (см. рис. 1). Платформа

IBM InfoSphere Information Server предлагает всеобъ-

емлющую интегрированную архитектуру, в основе

которой лежит единый репозиторий совместно

используемых метаданных, что позволяет

также рационализировать выполнение корпоратив-

ных проектов. Продукт IBM InfoSphere Information

Server позволяет организациям беспрепятственно

сохранять, улучшать и распространять метаданные,

которые генерируются как естественный результат

процесса интеграции данных. Это позволяет автома-

тически поддерживать согласованность между про-

ектами и между подразделениями.

Три подхода к интеграции информации

Многие поставщики программных продуктов реали-

зовали элементарную интеграцию между различ-

ными инструментами, которая позволяет демон-

стрировать информацию из одного продукта в

интерфейсе другого продукта в режиме «только для

чтения». Этот подход создает ложное впечатление о

якобы имеющим место активном обмене метадан-

ными между разнородными инструментами с совер-

шенно различными серверными архитектурами и

механизмами хранения метаданных.

В действительности эта поверхностная интеграция

интерфейсов не обеспечивает по-настоящему коллек-

тивную разработку и не позволяют извлечь ценные

данные, которые помогали бы получить максимальные

преимущества на всем протяжении жизненного цикла

интеграции. Некоторые поставщики программного

обеспечения пытались добиться более глубокого

уровня интеграции с помощью т.н. механизмов инте-

грации (integration engine), т.е. посредством консолида-

ция нескольких интеграционных процессов в единый

механизм обработки, способный к масштабированию в

соответствии с расширением охвата проекта и увели-

чением объема данных. Тем не менее вплоть до недав-

него времени ни один поставщик не смог предпринять

Page 6: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

6 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

правила, которые устраняют риск использования

или распространения некачественных данных.

2. Очистка данных. Платформа IBM InfoSphere

Information Server поддерживает единообразие и

качество информации с помощью таких процедур

обработки данных, как стандартизация, валида-

ция, согласование и слияние. Эта платформа помо-

гает компании создать единое, всеобъемлющее

и точное представление информации посредством

сопоставления записей внутри источников

данных и между ними, а также создания условий

для сохранения только одного варианта записи

в случае поступления аналогичной информации

из нескольких источников.

3. Преобразование данных в информацию. IBM

InfoSphere Information Server преобразует и обога-

щает информацию, чтобы гарантировать надлежа-

щий контекст для новых вариантов ее использова-

ния. Кроме того, платформа IBM InfoSphere

Information Server поддерживает функции

беспрепятственно обмениваться информацией

между задачами проекта по интеграции данных.

Организации могут использовать единые правила

для получения, валидации и бизнес-обработки

информации в нескольких проектах. Это улучшает

согласованность, усиливает контроль над данными

и повышает общую эффективность.

IBM InfoSphere Information Server позволяет органи-

зациям осуществлять пять ключевых функций

интеграции:

1. Понимание данных. IBM InfoSphere Information

Server способен автоматически обнаруживать, моде-

лировать, определять и задавать контент и струк-

туру информации, а также понимать и анализиро-

вать смысл, взаимосвязи и происхождение информа-

ции. Указанные возможности позволяют организа-

ции лучше представлять себе источники данных и

отношения между ними, а также задавать бизнес-

Рис. 1. IBM InfoSphere Information Server – гибкая платформа для интеграции данных, обеспечивающая доставку достоверной информации

по требованию для ключевых бизнес-инициатив

IBM InfoSphere Information Server

Унифицированное развертывание

Понимание Очистка

Обнаружение данных,

определение данных,

моделирование данных,

управление структурой

информации и контентом

Стандартизация,

слияние и

корректировка

информации

Преобразование Доставка

Объединение и

реструктуризация

информации для

новых вариантов

ее использования

Синхронизация,

виртуализация и

перемещение

информации для

поточной доставки

Унифицированное развертывание

Параллельная обработка

Широкие возможности доступа к приложениям, данным и контенту

Page 7: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 7

преобразования и перемещения больших объемов

сложных данных. Эти функции могут использо-

ваться в автономных ETL-сценариях (извлечь/

преобразовать/загрузить) или в механизмах обра-

ботки данных в реальном времени в интересах

приложений или процессов.

4. Доставка требуемой информации в надлежащее время. IBM InfoSphere Information Server обеспе-

чивает виртуализацию, синхронизацию и

доставку информации людям, процессам и прило-

жениям, которые в ней нуждаются. Она также

поддерживает важнейшие сервис-ориентирован-

ные архитектуры (SOA), позволяя развертывать

правила преобразования информации в виде сер-

висов многократного использования в интересах

нескольких приложений предприятия.

5. Осуществление управления унифицирован-ными метаданными. Платформа IBM InfoSphere

Information Server основана на унифицированной

инфраструктуре метаданных. Она обеспечивает

общее понимание различными пользователями,

которые участвуют в проекте по интеграции

данных, вопросов, связанных с бизнесом, опера-

ционной деятельностью и технологиями. Такая

общая управляемая инфраструктура сокращает

сроки разработки и обеспечивает необходимую

устойчивость, что повышает доверие к информа-

ции, а также устраняет необходимость в «ручной»

координации проекта.

Поддержка несколько пользовательских ролей посредством унифицированных метаданных

Для выполнения порученных ей задач каждая поль-

зовательская роль нуждается в доступе к определен-

ным метаданным. Кроме того, эти же пользователи

должны иметь возможности для беспрепятственного

и непосредственного обмена информацией с дру-

гими пользователям, исполняющими иные роли.

Оптимизация взаимодействия между несколькими

пользователями с разными ролями жизненно важна

для успеха любого интеграционного проекта.

Как правило, метаданные по пользовательским ролям

могут быть разделены на следующие категории:

• Менеджеры проектов несут полную ответствен-

ность за проект, включая обучение, развертывание,

управление, распределение ресурсов, координа-

цию и отслеживание хода выполнения.

• Администраторы следят за ключевыми областями

реализации системы. Администраторы баз данных

(DBA) отвечают за ввод в действие, установку, кон-

фигурирование, развертывание и применение базы

данных, а также за моделирование данных. Систем-

ные администраторы и администраторы программ-

ного обеспечения отвечают за аппаратные и про-

граммные средства проекта, конфигурирование,

техническое обслуживание и развертывание,

а также управление пользователями системы

и ассоциированные с ними роли безопасности.

• Бизнес-аналитики обеспечивают надежную

основу и контекст бизнес-среды, который должен

гарантировать, что реализованная интеграция

отвечает всем требованиям и удовлетворяет все

потребности бизнеса. Специалисты по предметной

области интерпретируют бизнес-требования

конечных пользователей и помогают сотрудникам

проекта расположить эти требования по приорите-

там, определить бизнес-термины для контекста,

документировать бизнес-логику преобразования

и разработать критерии верификации проекта.

• Менеджеры по управлению данными обладают

глубокими знаниями в области бизнеса и техники,

которые необходимы для ликвидации разрывов

между бизнесом и ИТ. Менеджеры по управлению

данными администрируют логические ресурсы

данных и координируют такие аспекты, как опре-

деления и псевдонимы данных, контроль качества,

мероприятия по усовершенствованию, авториза-

ция доступа, планирование данных по конкрет-

ным предметным областям.

• Архитекторы помогают гарантировать соблюдение

корпоративных стандартов и их единообразное

применение в масштабе предприятия и всех его

проектов. Специалисты по информационным архи-

тектурам управляют процессом с целью стандарти-

зации мероприятий, связанных с созданием, обслу-

живанием, совершенствованием и распределением

метаданных. Кроме того, они взаимодействуют с

Page 8: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

8 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

никами проекта, а также осуществляют сопровожде-

ние информации о сервисах и реестра сервисов.

Большинство вышеупомянутых пользовательских

ролей вовлечено в каждый проект по интеграции

данных (в некоторых случаях один пользователь

может исполнять несколько ролей). Каждый пользова-

тель генерирует ответственные метаданные как есте-

ственное следствие выполняемой им конкретной

задачи. Во многих случаях эти задачи выполня-

ются параллельно. Каждый модуль IBM InfoSphere

Information Server ориентирован на определенное

подмножество пользователей и порученные этому

подмножеству задачи, поэтому любой пользователь

работает только с метаданными, относящимся к

выполняемому им заданию (см. рис. 2).

разработчиками с целью пропаганды наилучших

методов интеграции данных в группах разработки.

• Разработчики интеграционных артефактов соз-

дают процессы и задания для управления манипу-

лированием данных. Например, эти разработчики

проектируют и разрабатывают приложения для

очистки сложных данных. Разработчики средств

для интеграции данных создают и тестируют ETL-

приложения с целью поддержки решений для

интеграции и очистки данных, а разработчики

SOA-средств развертывают сервисы данных и

гарантируют, что существующие сервисы поддер-

живают многократное использование и будут соот-

ветствовать соглашениям об уровне сервиса (SLA).

Кроме того, SOA-разработчики создают документа-

цию по сервисам для использования другими участ-

Рис. 2. Метаданные, генерируемые и потребляемые в процессе интеграции, основаны на ролях и на задачах

Бизнес-пользователи

Специалисты по предметным

областям

Архитекторы

Улучшение коллективной деятельности и согласованияОснованные на ролях инструменты с интегрированными метаданными

Аналитики данных

Разработчики Администра-торы баз данных

Управление унифицированными метаданными

Бизнес-метаданные, технические метаданные,

операционные метаданные

• Упрощение интеграции

• Содействие управлению изменениями

и повторному использованию

• Повышение достоверности

информации и уверенность в ней

• Улучшение соответствия стандартам

Page 9: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 9

Лучшая в отрасли архитектура метаданных обеспечивает гибкую интеграцию с высокой степенью масштабируемости

История разработки нынешних инновационных

технологических решений IBM восходит к широко

известным системам для мэйнфреймов и к техноло-

гиям для интеграции корпоративных приложений,

таким как MQ Series. В 1990-х годах корпорация IBM

выпустила свой консолидированный сервер приложе-

ний под названием IBM WebSphere® и в настоящее

время остается лидером рынка, по оценке Магичес-

кого квадранта компании Gartner за 2 квартал 2007 г.

решений в категории «Инфраструктура приложений»1.

Нынешняя флагманская платформа для унифициро-

ванной интеграции данных под названием IBM

InfoSphere Information Server была выпущена в ноябре

2006 г. Корпорация IBM сохраняет позиции «провидца»

среди ведущих поставщиков интеграционных техно-

логий, согласно Магическому квадранту компании

Gartner за 2007 г. в категории «Инструменты для

интеграции данных»2. Объединив базовые компо-

ненты для интеграции данных (репозитории, меха-

низмы и интерфейсы) в рамках единой платформы

(см. рис. 3), корпорация IBM создала комплексное

решение для интеграции информации, а также обе-

спечила заказчикам защиту их предшествующих

инвестиций в технологии.

IBM InfoSphere Information Server поддерживает три

базовых типа метаданных: бизнес-метаданные, техни-

ческие метаданные и операционные метаданные.

Бизнес-метаданные – имеют критическое значение

в качестве источника необходимого контекста для

интеграционного проекта. Это помогает определять

термины на повседневном языке, не принимая во

внимание техническую реализацию. Например, язык

для описания клиентов и их категоризация может

существенно зависеть от специфики бизнеса и зна-

чительно различаться даже между подразделениями

одной компании.

Технические метаданные – часто используются

сотрудниками технической направленности, такими

как разработчики. В состав этих данных входят

такие элементы, как определения типов таблиц и

данных. Эти объекты интенсивно используются в

процессе проектирования и разработки приложений.

Рис. 3. Архитектура управления унифицированными метаданными IBM InfoSphere Information Server представляет собой единый репозиторий

активных метаданных, обеспечивающий гибкую интеграцию с высокой степенью масштабируемости

Унифицированное развертывание

Бизнес-данные Технические данные

Активный, централизованно

управляемый репозиторий с

безопасным доступом через

уровень сервисов

Определение отношений, управ-

ление расширяемостью и связы-

вание сторонних метаданных

Операционные данные

Совместное использование и

доставка релевантной информации

в масштабе всей организации

Управление унифицированными метаданными

Хранение Совершенствование Обмен

Page 10: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

10 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

Операционные метаданные – это метаданные,

генерируемые и регистрируемые в ходе исполнения

процесса. Они позволяют администраторам управ-

лять системой и гарантировать ее бесперебойное

функционирование, а также выявлять проблемы в

процессах.

Унификация метаданных указанных типов создает

сквозные отношения, что позволяет пользователям

понимать не только, где хранится информация и что

происходит с ней по мере ее перемещения по органи-

зации, но и бизнес-контекст этой информации.

Репозиторий унифицированных метаданных IBM

InfoSphere Information Server предоставляет архи-

тектуру для поддержки трех ключевых задач, свя-

занных с информацией: хранение, совершенствова-

ние и обмен.

1. Хранение. Фундаментом унифицированных

метаданных является единый активный репозито-

рий, обеспечивающий общее понимание между

бизнес-областями и техническими областями.

При использовании такого общего репозитория

естественным следствием станет создание и

сопровождение метаданных, благодаря чему адми-

нистраторы освобождаются от выполнения вруч-

ную операций по консолидации метаданных и

управлению ими. Кроме того, совместное исполь-

зование активных метаданных позволяет разра-

ботчикам действовать более продуктивно, улуч-

шает наблюдаемость и управляемость информаци-

онных активов организации, поддерживает кол-

лективную деятельность.

Доступ к метаданным осуществляется через вну-

тренний уровень сервисов, что облегчает реализа-

цию таких функций, как планирование, поддержа-

ние безопасности, регистрация и обработка

ошибок, отчетность, анализ, поиск. Благодаря

консолидации указанных задач в виде общих сер-

висов платформа IBM InfoSphere Information Server

предлагает готовые к применению мощные

возможности для масштабирования, интеграции и

поддержания безопасности. Применение указан-

ных сервисов в качестве компонентов сервера при-

ложений помогает обеспечить целостность данных

и кода, централизовать задачи по конфигурирова-

нию, обеспечению безопасности и поддержанию

производительности, а также снизить совокупную

стоимость владения.

2. Совершенствование. Метаданные, хранящиеся

в общем репозитории, могут быть улучшены

посредством их связывания со сторонними

метаданными, которые являются непосред-

ственными участниками интеграционного

потока, такими как метаданные инструментов

интеллектуального бизнес-анализа и моделиро-

вания данных. Эти метаданные могут быть

импортированы в репозиторий, после чего

между ними и платформой IBM InfoSphere

Information Server могут быть созданы связи

и отношения для расширения понимания мета-

данных между организационными процессами.

Кроме того, пользователи могут контролиро-

вать расширение метаданных с целью иденти-

фикации уникальных бизнес-метаданных, кото-

рые необходимо отслеживать.

3. Обмен. Механизм доставки и обмена необходим

для предоставления метаданных различным

пользовательским ролям, вовлеченным в инте-

грационные проекты. С этой целью в состав IBM

InfoSphere Information Server включены управля-

емые задачами модули, а также уровень консоли-

дированной отчетности, который охватывает все

модули и позволяет генерировать отчеты о мета-

данных. Доступ к таким отчетам осуществля-

ется через общую Web-консоль. Задания по гене-

рации отчетов могут быть включены в график

для автоматического исполнения, контроль

доступа к отчетам может осуществлять с точно-

стью до отдельного пользователя. В интересах

ретроспективного анализа поддерживается соз-

дание версий отчетов в форматах PDF, HTML,

RTF и TXT.

Page 11: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 11

Интегрированные модули IBM InfoSphere Information ServerПлатформа IBM InfoSphere Information Server

состоит из нескольких модулей, которые могут быть

развернуты вместе или раздельно в рамках интегра-

ционного фреймворка предприятия. В следующих

разделах описываются вышеуказанные модули, а

также метаданные, которые они генерируют, потреб-

ляют и совместно используют.

Отраслевые модели данных IBM (IBM Industry Data Models) и модуль IBM Rational Data Architect

Отраслевые модели данных IBM могут быть

полезны бизнес-пользователям и ИТ-специалистам.

Эти модели помогают организациям внедрять

ключевые бизнес-инициативы стратегического

характера, причем быстрее, надежнее и с большей

степенью уверенности в успехе. Отраслевые модели

данных IBM, созданные с использованием опыта,

полученного при выполнении контрактов для более

чем 400 клиентов, и квалификации, приобретенной

за более чем 10 лет разработки, обеспечивают уни-

кальную поддержку для шести крупных вертикаль-

ных рынков (см. рис. 4).

В состав отраслевых моделей данных IBM входят

глоссарии терминов и концепций, а также модели

физических данных. Эта информация, хранящаяся

в каком-либо инструменте для моделирования

данных, например, IBM Rational® Data Architect,

может быть использована совместно с IBM InfoSphere

Information Server для улучшения согласования

Рис. 4. Отраслевые модели данных IBM, основанные на многолетнем опыте, охватывают все важнейшие вертикальные рынки

• Анализ рентабельности

• Маркетинг отношений

• Управление рисками

• Управление активами и

ответственностью

• Соответствие нормативным

требованиям

Платформа IBM InfoSphere Information Server и отраслевые модели данных IBM

Банки(Banking data

warehouse)

• Ориентация на клиента

• Претензии

• Управление посредниками

• Соответствие нормативным

требованиям

• Управление рисками

Страхование(Insurance information

warehouse)

• Управление рисками

• Управление активами и

ответственностью

• Соответствие нормативным

требованиям

Финансовые рынки(Financial markets data

warehouse)

• Ориентация на клиента

• Управление сбытом

• Управление операциями магазина и

товарами

• Управление цепочками поставок

• Соответствие нормативным

требованиям

Розничная торговля(Retail data warehouse)

• Претензии

• Управление медицинским

учреждением

• Управление поставщиками и сетями

• Продажи, маркетинг и подписка на

услуги

• Управление финансами

Здравоохранение(Health plan data

warehouse)

• Предотвращение оттока абонентов

• Управление отношениями и

сегментация

• Продажи и маркетинг

• Качество обслуживания и управ-

ление продуктом на протяжении

жизненного цикла

• Профиль использования

Телекоммуникации(Telecommunications

data warehouse)

Page 12: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

12 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

между бизнес-пользователями и ИТ-специалистами,

а также для ускорения реализации проекта.

IBM Rational Data Architect – это лишь один из веду-

щих инструментов для моделирования данных,

интегрированных с платформой IBM InfoSphere

Information Server. По отношению к функциям IBM

InfoSphere Information Server по управлению унифи-

цированными метаданными модуль Rational Data

Architect действует как моделирующий шлюз, через

который осуществляется обмен метаданными глос-

сария и физическими метаданными (см. рис. 5).

После этого указанные метаданные предоставля-

ются для использования всеми модулями IBM

InfoSphere Information Server по мере необходимости.

Продукт Rational Data Architect поддерживает три типа

моделей, которые позволяют организациям разрабаты-

вать концепции на различных уровнях абстракции.

Пользователи могут легко переключаться между этими

тремя типами, поддерживая при этом определенные

отношения для обеспечения согласованности:

• Модель глоссария описывает используемую

внутри организации терминологию бизнеса, а

также иерархии и отношения, порождаемые этой

терминологией.

• Модель логических данных описывает абстрактные

объекты, о которых организация желала бы собирать

данные, а также отношения между этими объектами.

• Модель физических данных – зависящая от при-

меняемой базы данных модель, представляющая

объекты реляционных данных и их отношения.

Организация может использовать эту модель для

генерации утверждений на т.н. языке определения

данных (DDL), которые затем могут быть развер-

нуты на сервере базы данных.

Рис. 5. Модуль Rational Data Architect позволяет организации публиковать на платформе IBM InfoSphere Information Server различные

метаданные, такие как бизнес-глоссарии и модели физических данных

IBM Rational Data Architect

Модель глоссарияIBM InfoSphere

Business

Glossary

Понимание

Модель логических данных

Модель физических данных

Очистка

Преобразование

Доставка

Модели

физических

данных

Page 13: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 13

Тесная интеграция между отраслевыми моделями

данных IBM, модулем Rational Data Architect и

платформой IBM InfoSphere Information Server

позволяет организациям применять ориенти-

рованные на определенную отрасль бизнес-

метаданные и технические метаданные. Это помо-

жет ускорить выполнение различных проектов по

интеграции данных, например инициатив по

управлению т.н. основными данными (master data)

или по созданию информационных хранилищ.

Так, отраслевые модели данных и физические

схемы Rational Data Architect могут быть совместно

использованы в масштабе всей платформы IBM

InfoSphere Information Server, включая такие ее

модули, как InfoSphere Information Analyzer,

InfoSphere FastTrack, InfoSphere DataStage® и

InfoSphere QualityStage®. Кроме того, бизнес-

определения или определения глоссария из отрас-

левых моделей данных и модуля Rational Data

Architect могут применяться для популяризации

модуля InfoSphere Business Glossary с целью кол-

лективного использования общих определений

в масштабе всего предприятия.

IBM InfoSphere Business Glossary

Бизнес-глоссарий (который иногда называют слова-

рем) содержит определения терминов, используе-

мых организацией для поддержки своих бизнес-

инициатив. Глоссарий определяет язык предприя-

тия, а также – с помощью различных расширений –

язык проектов, являясь основой для совместной

деятельности разнородных групп, вовлеченных в

интеграционные мероприятия. Без официального

глоссария, обеспечивающего регистрацию этого

ценного корпоративного актива и централизован-

ное управление им, организация рискует потерять

эту критически важную информацию, например

когда ее сотрудники покидают служебную террито-

рию в конце каждого рабочего дня.

Модуль IBM InfoSphere Business Glossary позволяет

аналитикам данных, бизнес-аналитикам и специа-

листам по предметным областям создать насыщен-

ный глоссарий посредством связывания бизнес-

концепций с техническими метаданными и демон-

страции этих связей в масштабе всего предприя-

тия с помощью простых в применении интерфей-

сов. Модуль InfoSphere Business Glossary облегчает

создание официальных терминов и определение

отношений между ними с помощью иерархии

категорий. Организация может поручить своим

менеджерам по управлению данными работать

с этой информацией с целью поддержки, которая

требует подотчетности и ответственности по

определенным областям, активам и отношениям.

Пользователи InfoSphere Business Glossary имеют

прямой доступ к контактной информации соответ-

ствующих менеджеров по управлению данными

(включая имя, номер телефона и адрес электронной

почты), поэтому они всегда знают, к какому сотруд-

нику следует обращаться при возникновении

вопроса или требования относительно какого-

либо бизнес-термина.

InfoSphere Business Glossary предоставляет три

интерфейса, предназначенных для определенных

пользовательских аудиторий:

1. Модуль Business Glossary. Модуль Business

Glossary, предназначенный для менеджеров по

управлению данными, позволяет специалистам

в предметной области создавать информационно

насыщенные, детальные определения терминов

и категории для представления отношений между

этими терминами. При необходимости описания

специфических для конкретной организации

свойств в релевантных терминах пользователи

могут добавлять специальные атрибуты, расширя-

ющие значение элементов в глоссарии.

Page 14: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

14 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

Кроме того, бизнес-аналитики могут использовать

этот интерфейс для связывания технических арте-

фактов, таких как таблицы и столбцы базы данных,

с соответствующими бизнес-терминами. Такое свя-

зывание позволяет гарантировать, что специфиче-

ские артефакты данных объединены со своим

бизнес-контекстом и поддерживают двухсторонние

коммуникации. Это позволяет бизнес-пользовате-

лям осуществлять углубленный анализ по какому-

либо термину для поиска релевантных источников

технических данных, а техническим пользовате-

лям, работающим с источником данных или с

ETL-заданием, понимать бизнес-контекст исполь-

зуемых объектов.

2. Браузер Business Glossary. Браузер Business

Glossary, предназначенный для бизнес-пользователя,

представляет собой интуитивно понятный интер-

фейс «только для чтения», не требующий обучения

пользователя (см. рис. 6). Бизнес-пользователи могут

осуществлять поиск в словаре, исследовать его кон-

тент и принятую в нем классификацию активов

данных, выявлять менеджеров по управлению дан-

ными, отвечающих за определенные активы, а также

предоставлять непосредственную обратную связь

по бизнес-информации.

3. Инструмент Business Glossary Anywhere. Инструмент Business Glossary Anywhere позволяет

любому сотруднику организации просматривать

контент общего глоссария и вносить свой вклад в

принятие стандартизированного языка в масштабе

всего предприятия. Этот инструмент может быть

вызван непосредственно из любого приложения.

Это позволяет пользователю осуществлять поиск

любого термина без потери контекста приложения,

которое он использует в текущий момент времени.

Однократный щелчок мыши вызывает на экран

небольшое окно с информацией об ассоцииро-

ванных метаданных в бизнес-глоссарии, включая

информацию о менеджере по управлению данными,

в ведении которого находится соответствующий

термин.

Помимо использования модуля InfoSphere Business

Glossary для создания и редактирования контента

своего глоссария, организация может импортиро-

вать метаданные из других источников, таких как

инструмент IBM Rational Data Architect или файлы

.csv и XML. Эти дополнительные механизмы помо-

гают наполнить бизнес-глоссарий и обойтись

без ручного ввода метаданных, что обеспечивает

согласованность бизнес-терминов и уменьшает

вероятность введения ошибок. Кроме того, орга-

низации могут использовать отраслевые модели

данных IBM с целью наполнения глоссария

InfoSphere Business Glossary стандартными

отраслевыми терминами.

Рис. 6. Модуль InfoSphere Business Glossary позволяет облегчить

бизнес-коммуникации и ИТ-коммуникации посредством создания и

применения общего словаря

Page 15: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 15

Коллективное применение модуля InfoSphere

Business Glossary – в сочетании с возможностями

инструмента Rational Data Architect по работе с

глоссариями и насыщенным бизнес-контентом из

отраслевых моделей данных IBM – предоставляет

всеобъемлющее решение для построения корпора-

тивного глоссария. Однако не меньшую значи-

мость, чем создание и применение глоссария, имеет

способность представить соответствующий кон-

тент различным пользователям в масштабе всей

организации. Надлежащее понимание бизнес-

контекста позволяет организации создавать более

совершенные приложения для удовлетворения

потребностей своего бизнеса. По существу, кон-

тент модуля InfoSphere Business Glossary представ-

ляется другим модулям платформы IBM InfoSphere

Information Server, включая модули InfoSphere

Information Analyzer и InfoSphere FastTrack.

Пользователи этих приложений обладают необхо-

димыми знаниями об организации, благодаря чему

способны заполнить промежуток между бизнес-

метаданными и техническим метаданными, а

также установить отношения, определяющие соот-

ветствующие связи. Термины глоссария InfoSphere

Business Glossary доступны непосредственно каж-

дому из указанных модулей, что позволяет пользо-

вателям – в рамках порученных им задач и процес-

сов по интеграции данных – определять дополни-

тельные отношения и создавать расширенный кон-

тент для общего глоссария.

IBM InfoSphere Information Analyzer

С течением времени данные, которые хранятся в

унаследованных системах и корпоративных прило-

жениях, могут утерять большую часть своей ценно-

сти вследствие изменений, произошедших в мета-

данных, порядке применения данных и общих зна-

ниях об этих данных. Несмотря на то, что такие

данные по-прежнему способны надлежащим обра-

зом служить исходной цели, во многих случаях с

течением времени и при изменении требований они

оказываются негодными для использования в

других приложениях.

Модуль IBM InfoSphere Information Analyzer предо-

ставляет возможности для профилирования данных,

уменьшающие затраты и риски проекта посредством

выявления проблем на ранних стадиях и монито-

ринга изменений в структуре данных и в контенте.

Методы профилирования данных концентрируются

на контенте данных: они исследуют значения в

каждом столбце, извлекают дополнительную инфор-

мацию из этих значений, а затем используют эту

информацию для оценки структурной целостности

источников данных и отношений между ними.

Модуль InfoSphere Information Analyzer обеспечивает

всеобъемлющее представление информационных

активов организации посредством воспроизводи-

мого и подтверждаемого процесса.

Инструмент InfoSphere Information Analyzer начинает

свою работу с регистрации существующих определе-

ний для схем, таблиц, файлов и столбцов, а затем

делает эту информацию доступной для остальных

компонентов платформы IBM InfoSphere Information

Server (см. рис. 7). Функция анализа столбцов

детально исследует отдельные значения, что позво-

ляет инструменту генерировать соответствующие

метаданные и выявлять истинные физические харак-

теристики данных. Кроме того, процедуры анализа

первичных и внешних ключей, а также средства меж-

доменного анализа выделяют дублирующиеся

данные, поврежденные ключи, отсутствующие или

недействительные отношения между данными в

таблицах. Другими словами, они идентифицируют

проблемы, которые могут отрицательно повлиять на

бизнес-обработку, мероприятия по миграции данных

или загрузку критических данных в производствен-

ные системы или хранилища данных. С помощью

этих результатов аналитики могут обогащать мета-

данные посредством следующих мероприятий: созда-

ние аннотаций для совместного использования всеми

модулями платформы IBM InfoSphere Information

Server, оценка различий между заданными и выведен-

ными метаданными, выявление неполных или недей-

ствительных значений, генерация ссылок и отображе-

ние таблиц для использования в модулях IBM

Page 16: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

16 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

InfoSphere DataStage или IBM InfoSphere QualityStage,

связывание физических данных с семантическими

терминами, введенными в модуль InfoSphere Business

Glossary.

Инструмент InfoSphere Information Analyzer играет

в процессе интеграции весьма ответственную роль.

Профилирование данных помогает аналитику полу-

чить полную информацию об источниках данных

до начала проектирования детальных специфика-

ций для отображения. Чтобы облегчить получение

наиболее полных и точных спецификаций отобра-

жения, результаты профилирования, полученные с

помощью инструмента InfoSphere Information

Analyzer, доступны непосредственно из модуля

InfoSphere FastTrack, в котором производится зада-

ние и регистрация спецификаций. Затем эти специ-

фикации используются как входные требования

для модулей InfoSphere DataStage и InfoSphere

QualityStage, точнее – для их ETL-заданий и зада-

ний по очистке, которые поддерживают разрабаты-

ваемое бизнес-приложение. Чем больше информа-

ции об истинных структурах данных и о контенте

будет иметь аналитик, тем более точные требова-

ния он сможет сформировать для нижестоящих

разработчиков.

Рис. 7. Инструмент IBM InfoSphere Information Analyzer способен выполнять анализ столбцов с целью генерации выведенных метаданных и

выявления истинных физических характеристик данных

Page 17: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 17

IBM InfoSphere FastTrack

В ходе своих интеграционных проектов организации

часто тратят значительную часть от общего времени

разработки на преодоление различий в языках,

навыках и методах работы, разъяснение бизнес-

требований и на синхронизацию результатов приме-

нения различных инструментов. Модуль IBM

InfoSphere FastTrack призван сломать эти барьеры

и тем самым обеспечить максимальную эффектив-

ность коллективной деятельности, повысить степень

автоматизации и гарантировать успешное и своевре-

менное выполнение проектов.

IBM InfoSphere FastTrack создает интегрированную

среду, охватывающую бизнес-аналитиков, разработ-

чиков и специалистов по моделированию данных,

которая ускоряет совместную разработку с учетом

многочисленных пользовательских ролей, продуктов

и регионов. Этот инструмент предназначен для

автоматизации мероприятий в масштабе нескольких

задач по интеграции данных с учетом потребностей

бизнеса и соблюдением требований по происхожде-

нию и документированию.

IBM InfoSphere FastTrack регистрирует и хранит

критически важные метаданные о ключевых бизнес-

требованиях с целью оптимизации процесса разра-

ботки приложений. С помощью инструмента

InfoSphere Information Analyzer аналитики данных и

специалисты по предметным областям профили-

руют данные из нескольких источников, чтобы

понять, какие типы правил преобразования должны

быть применены в процессе миграции.

Созданные в ходе профилирования метаданные

доступны непосредственно в инструменте IBM

InfoSphere FastTrack. Они включают информацию о

типах выведенных данных, длинах данных, значе-

ниях данных, первичных/внешних ключах, а также

обо всех специфических примечаниях, введенных

аналитиком данных (см. рис. 8). Используя эту

информацию профилирования, аналитики создают

спецификации отображения источника на

назначение (source-to-target), которые описывают

порядок извлечения, объединения и преобразования

информации в соответствии с требованиями биз-

неса. Метаданные источника и назначения могут

быть получены непосредственно, а также импорти-

рованы из отраслевых моделей данных IBM или из

инструмента Rational Data Architect.

Кроме того, модуль IBM InfoSphere FastTrack позво-

ляет организациям подключить уровень бизнес-

семантики и тем самым помочь своим аналитикам

в создании и определении отношений между бизнес-

терминологией и уровнем физического представле-

ния. Аналитики могут воспользоваться контентом

InfoSphere Business Glossary или создать и опублико-

вать новые бизнес-термины, подлежащие включению

в проектную документацию. После создания специ-

фикации отображения любые последующие обновле-

ния для структуры модели назначения также вклю-

чаются в состав этой спецификации. После этого

аналитик может создать задания для модулей

InfoSphere DataStage и InfoSphere QualityStage, а

затем передать их разработчику для рассмотрения

и дополнения в интересах производственного

развертывания.

IBM InfoSphere DataStage и InfoSphere QualityStage

Модуль InfoSphere DataStage призван обеспечивать

уровень функциональности, гибкости и масштаби-

руемости, необходимый для выполнения преобразо-

вания данных в интересах инициатив по интегра-

ции сложных данных. Модуль InfoSphere DataStage

способен управлять несколькими процессами инте-

грации, что позволяет ему непосредственно подклю-

чаться к корпоративным приложениям как к источ-

никам или как к назначениям метаданных.

Преобразования могут осуществляться в пакетном

режиме, в реальном времени, в близком к реальному

времени или в рамках сервис-ориентированной

архитектуры.

InfoSphere DataStage использует способности плат-

формы IBM InfoSphere Information Server к парал-

лельному исполнению для удовлетворения наиболее

Page 18: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

18 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

напряженных требований организации к объему

данных и характеристикам преобразования. Этот

продукт был сертифицирован сторонним аудитором

тестирования, аккредитованным при Совете по

оценке производительности при обработке транзак-

ций (Transaction Processing Performance Council), на

близкое к линейному масштабирование по мере

добавления новых аппаратных средств к среде обра-

ботки3.Помимо исполнения на платформах UNIX®,

Microsoft Windows® и Linux®, продукт InfoSphere

DataStage исполняется в нативном режиме в Linux-

среде на мэйнфреймах IBM S/390® и IBM System z™,

что позволяет организациям полностью использо-

вать свои предшествующие ИТ-инвестиции.

ETL-задания модуля InfoSphere DataStage включают в

себя технические метаданные проекта, описывающие

поток работ и применяемую логику преобразования.

Операционные метаданные (метаданные времени

исполнения) и метаданные параметров также реги-

стрируются в ходе выполнения заданий. Платформа

IBM InfoSphere Information Server обладает уникаль-

ными способностями по связыванию проекта с опера-

ционными метаданными для получения полного

Рис. 8. Инструмент IBM InfoSphere FastTrack создает интегрированную среду, включающую в себя бизнес-аналитиков, разработчиков и

специалистов по моделированию данных

Page 19: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 19

представления о том, что фактически происходит

при выполнении определенного задания в производ-

ственной среде в заданный момент времени. Это

имеет большое значение для поддержки сложных

интеграционных сред и поиска неисправностей в них,

а также для поддержки нормативной отчетности по

отслеживанию происхождения данных.

IBM InfoSphere QualityStage – это дополнение к

InfoSphere DataStage, позволяющее разработчикам

создавать поточные процессы очистки данных в виде

компонентов непосредственно в ETL-среде продукта

DataStage (см. рис. 9). Используя этапы (stage) и кон-

структивные компоненты (design component), разра-

ботчик сможет быстро и легко обрабатывать большие

объемы данных с одновременной очисткой и объеди-

нением источников данных по мере необходимости.

Такие возможности продукта InfoSphere

QualityStage, как вероятностное сопоставление

данных и стратегии динамического взвешивания,

обеспечивают создание высококачественных и

точных данных посредством единообразного связы-

вания и консолидации базовой бизнес-информации –

Рис. 9. Модули InfoSphere DataStage и InfoSphere QualityStage позволяют разработчикам создавать поточные процессы очистки данных

Page 20: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

20 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

такой как клиент, местоположение и продукт – в

масштабе всего предприятия. Это помогает органи-

зации уменьшить продолжительность и стоимость

реализации ориентированных на определенные

области стратегических проектов за счет улучшения

понимания своих основных данных. Бизнес-правила,

задаваемые для объединения и консолидации запи-

сей, хранятся в репозитории метаданных и исполь-

зуются совместно с другими модулями платформы

IBM InfoSphere Information Server с целью достиже-

ния полной наблюдаемости и контролируемости

процессов очистки и консолидации данных.

Благодаря хранению ETL-метаданных, метаданных

очистки, проектировочных метаданных и операци-

онных метаданных в общем репозитории InfoSphere

Information Server организация способна отслежи-

вать происхождение информации на протяжении

всего процесса интеграции. Это укрепляет доверие к

приложению конечного пользователя, а также помо-

гает удовлетворить нормативным требованиям,

касающимся отслеживания и доказательств

происхождения.

Поскольку перемещение данных для централизо-

ванного хранения не всегда возможно, разработ-

чики могут воспользоваться модулем IBM

InfoSphere Federation Server для выполнения запро-

сов к разнородным источникам данных. Этот

модуль позволяет организациям виртуализировать

свои данные и предоставлять информацию в необ-

ходимой для приложений и пользователей форме,

одновременно скрывая сложность первичных

источников этой информации. Такие федерирован-

ные запросы могут быть представлены непосред-

ственно в потоке ETL-задания, что позволяет рас-

ширить возможности соединения и упростить

дизайн преобразования.

Помимо поддержки традиционной пакетной обра-

ботки данных и федерированных запросов, плат-

форма IBM InfoSphere Information Server также под-

держивает такие функции, как CDC (Changed Data

Capture – фиксация изменений данных) и репли-

кация. Во многих случаях организациям необходимо

обрабатывать данные сразу же после их изменения,

без каких-либо задержек. Модуль InfoSphere

DataStage способен с помощью технологии CDC,

основанной на использовании журнала регистрации,

извлекать информацию из модуля InfoSphere Change

Data Capture и тем самым обеспечивать масштабиру-

емую, высокопроизводительную и гетерогенную

интеграцию данных без какого-либо воздействия на

системы-источники. Эта опция для задействования

интеграции данных в реальном времени позволяет

клиентам своевременно получать необходимую

информацию для принятия решений в темпе

функционирования бизнеса.

Продукты серии InfoSphere Change Data Capture for

Replication разработаны для применения в гомоген-

ных средах, которым требуется мощное решение для

распределения данных, интеграции данных и обе-

спечения доступности данных с целью поддержания

единообразного представления информации между

системами. Высокопроизводительная и масштабиру-

емая репликация гарантирует синхронизацию пер-

вичных и вторичных систем в режиме реального

времени.

IBM InfoSphere Information Services Director

Публикация единообразных сервисов многократ-

ного использования облегчает получение бизнес-

процессами необходимой информации из любой

точки гетерогенного ИТ-ландшафта. С помощью

модуля InfoSphere Information Services Director разра-

ботчики могут представить логику продуктов

InfoSphere DataStage, InfoSphere QualityStage,

InfoSphere Federation Server, InfoSphere Classic

Federation Server for z/OS® и IBM DB2® в виде серви-

сов, развертываемых и совместно используемых в

масштабе предприятия для интеграции приложений

и процессов. Продукт IBM InfoSphere Information

Services Director выравнивает нагрузки по обработке

запросов на указанные сервисы между несколькими

узлами IBM InfoSphere Information Server, что позво-

ляет гарантировать устойчивость к ошибкам и высо-

кую степень доступности.

Page 21: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 21

Инструмент InfoSphere Information Services Director

«упаковывает» логику информационной интеграции в

виде сервисов, изолирующих разработчиков от источ-

ников данных, и позволяет вызывать эти сервисы с

помощью таких технологий, как Enterprise JavaBeans™,

Java™ Message Service (JMS), Web-сервисы, Really

Simple Syndication (RSS) и Representational State

Transfer (REST) (см. рис. 10).

Информация о дизайне приложений InfoSphere

Information Services Director и о развертывании при-

ложений в процессе исполнения хранится в общем

репозитории метаданных продукта IBM InfoSphere

Information Server. Этот метаданные поддерживают

несколько важных сервисов:

• Инфраструктурные сервисы, включая сервисы

регистрации в журналах, обеспечения безопасно-

сти, каталогизации информации о сервисах, вырав-

нивания нагрузки и обеспечения доступности.

• Обработка поставщиков информации для таких

поставщиков, как IBM DB2, InfoSphere Federation

Server, InfoSphere Classic Federation Server for z/OS,

InfoSphere DataStage, InfoSphere QualityStage,

InfoSphere Master Data Management (MDM)

Server и Oracle.

Рис. 10. Инструмент InfoSphere Information Services Director помогает выравнять нагрузки по обработке запросов на сервисы между

несколькими узлами IBM InfoSphere Information Server

IBM DB2

InfoSphere Information Services Director Server

InfoSphere Information Services Director Serveces

Сервис проектирования

Сервис выравнивания нагрузки

Сервис администрирования

Сервисы коллективного пользованияСервис регистрации

Сервис отчетности

Сервис обеспечения безопасности

EJB JMS RSS REST

Сервисы метаданных

Бизнес-данные, технические данные,

операционные данные

Агент InfoSphere information Services Director

SOA-обработчики

Web-сервисы

SOA-среда SOA-среда

InfoSphere

DataStage

InfoSphere

QualityStage

Federation IBM DB2 InfoSphere

DataStage

InfoSphere

QualityStage

Federation

Page 22: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

22 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

• Связывание сервисов позволяющее потребителям

получать доступ к информационным сервисам с

помощью различных технологий для поддержки

взаимодействия программ (binding).

SOA-среда отделяет сервис от обеспечивающего

процесса, благодаря чему пользователям не прихо-

дится разбираться во всех сложностях, сопрово-

ждающих исполнение этого процесса. Платформа

IBM InfoSphere Information Server позволяет

Web-разработчикам создавать сервисы, а также

«заглядывать внутрь» для устранения проблем,

поскольку сопровождение метаданных осущест-

вляется в одной общей зоне. Созданные таким

образом сервисы могут быть представлены для

общего доступа в Web-консоли платформы IBM

InfoSphere Information Server, а также в других

продуктах IBM, таких как InfoSphere Service

Registry Repository.

IBM Import Export Manager

Организации редко обладают набором продуктов

лишь от одного поставщика. Поэтому важно обеспе-

чить наблюдаемость для продуктов других постав-

щиков и поддержать импорт сторонних метаданных,

связанных с процессом интеграции информации.

IBM InfoSphere Information Server обеспечивает реги-

страцию значимых метаданных из результатов

бизнес-анализа, моделей данных и исходных баз

данных с целью создания всеобъемлющего представ-

ления об отношениях метаданных.

В состав описываемой платформы входит модуль

управления экспортом/импортом, который позво-

ляет пользователям импортировать структуры

отчетов бизнес-анализа, моделей физических

данных и моделей глоссария из инструментов

моделирования данных и из схем реляционных

баз данных. Взаимосвязи между процессами IBM

InfoSphere Information Server и сторонними мета-

данными описываются и представляются для

исследования и доступа. Это позволяет организа-

циям выполнять такие критически важные задачи,

как анализ взаимовлияния между инструментами,

с целью понимания того, каким образом определен-

ное изменение затрагивает другие области интегра-

ционной среды.

Пользователи могут импортировать метаданные из

широкого спектра сторонних программных инстру-

ментов и реляционных источников данных в репози-

торий IBM InfoSphere Information Server (см. рис. 11).

Так, например, для импорта отчета Cognos доста-

точно ввести URL-адрес инструмента Cognos Content

Manager и название нужного пакета. Импорт схемы

базы данных или XML-файла осуществляется в соот-

ветствии с подобной процедурой.

Рис. 11. Организации могут использовать IBM InfoSphere Information

Server для импорта сторонних метаданных из внешних отчетов

бизнес-анализа, моделей данных и баз данных

IBM InfoSphere Metadata Workbench

Инструмент IBM InfoSphere Metadata Workbench

упрощает отчетность, управление и анализ по моду-

лям IBM InfoSphere Information Server. Он предостав-

ляет разработчикам и администраторам Web-

интерфейс для просмотра и исследования точек

соприкосновения метаданных платформы IBM

InfoSphere Information Server и сторонних метадан-

ных в интересах инструментов отчетности и моде-

лирования (см. рис. 12).

Page 23: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 23

Инструмент IBM InfoSphere Metadata Workbench позво-

ляет пользователям выполнять задачи, относящиеся к

следующим четырем важнейшим категориям:

• Исследование ключевых информационных активов

для понимания механизмов их использования,

их отношений и значений навигация по активам

технических и бизнес-метаданных и по активам

информационных запросов для выявления про-

стых или сложных отношений с целью генерации

специальных отчетов.

• Использование платформы IBM InfoSphere

Information Server для полного понимания происхо-

ждения информации, включая источник поступле-

ния данных, отношения данных и события, проис-

ходившие с данными по мере их перемещения

между приложениями и хранилищами данных.

• Анализ зависимостей между активами IBM

InfoSphere Information Server и сторонними

ресурсами, такими как объекты из инструмен-

тов моделирования и отчетности, для выявле-

ния взаимовлияния, а также для генерации

отчетов для обеспечения нормативного соответ-

ствия и соблюдения регулирующих норм и стан-

дартов, таких как закон Сарбейнса-Оксли и акт

Basel II.

• Управление информационными активами с целью

улучшения понимания их функционирования и

анализа посредством присвоения значений и

бизнес-определений или посредством определе-

ния отношений с новыми источниками данных.

Возможности инструмента IBM InfoSphere

Metadata Workbench по поиску и подаче запросов

Рис. 12. Инструмент IBM InfoSphere Metadata Workbench предоставляет интуитивно понятный и всеобъемлющий Web-интерфейс для анализа

информационных активов и управления ими

Page 24: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

24 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

позволяют разработчикам, администраторам,

менеджерам и аналитикам просматривать и иссле-

довать метаданные по всем ресурсам – от плат-

формы IBM InfoSphere Information Server до

инструментов моделирования и бизнес-анализа.

Эта уникальная наблюдаемость улучшает понима-

ние и повторное использование метаданных в

новых проектах, что способствует сокращению

дублирования усилий при разработке, уменьше-

нию сроков разработки и повышению ее эффек-

тивности.

Развертывание IBM InfoSphere Information Server на основе архитектуры унифицированных метаданныхПлатформа IBM InfoSphere Information Server рас-

считана на гибкую интеграцию с существующими

в организации процессами интеграции данных. На

рис. 13 представлен один из возможных вариантов

развертывания IBM InfoSphere Information Server,

показано, каким образом организация сможет

добиться максимального эффекта при разработке

приложений с помощью архитектуры унифициро-

ванных метаданных, предлагаемых этой платформой.

Рис. 13. Архитектура IBM InfoSphere Information Server позволяет организации добиться максимального эффекта при разработке приложений

с помощью репозитория унифицированных метаданных

Структуры обмена данными

Импорт отраслевых моделей данных

Наполнение

СвязываниеРазвер-тывание

Rational Data Architect

SOA

InformationServices Director

Импорт отраслевых моделей данных

Rational Data Architect

Совместное использование

Совместное использование

Совместное использование

Совместное использование

Поиск и профилирование исходных данных

InfoSphere Information

Analyzer

Отображение источников на

целевую модель

InfoSphere FastTrack

Преобразованиеи очистка

InfoSphere DataStage и InfoSphere

QualityStage

Связы-вание

Опреде-ление

Созда-ние

Унифицированные метаданные для активного администрирования, управления и отчетности

Инструмент Metadata Workbench обеспечивает полную наблюдаемость и контролируемость метаданных

Page 25: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

Программное обеспечение IBM 25

Рис. 14. IBM Rational Data Architect помогает импортировать

информацию из отраслевых моделей данных

Процесс начинается с определения моделей данных.

Организация может импортировать информацию из

отраслевых моделей данных IBM, доступных с помо-

щью Rational Data Architect, в состав каждой из кото-

рых входят глоссарий, модель логических данных и

модель физических данных. Эти глоссарии содержат

тысячи стандартных отраслевых терминов, которые

могут быть использованы для начального наполнения

модуля InfoSphere Business Glossary. Организации

могут изменять и расширять отраслевые модели

данных IBM в соответствии со специфическими

требованиями бизнеса.

После определения моделей данных и применения

бизнес-контекста аналитики осуществляют профи-

лирование и выявляют системы-источники, которые

будут использоваться для наполнения новой целевой

модели данных. Кроме того, в ходе процесса профи-

лирования аналитики могут по мере необходимости

дополнительно создавать и определять новые

бизнес-термины для описания источников данных,

если эти бизнес-определения не были ранее сформу-

лированы в отраслевых моделях данных IBM.

Теперь аналитик готов к созданию спецификаций

отображения, которые вводятся в ETL-задания для

нового приложения. С помощью бизнес-контекста и

результатов профилирования аналитик задает пра-

вила конкретного преобразования, необходимого для

конвертации контента источников данных в коррект-

ный формат для определенной отраслевой модели

данных IBM. В ходе этого процесса аналитик задает не

только бизнес-правила для конкретного преобразова-

ния, но также может задать прямые отношения между

бизнес-терминами и их представлением в физических

структурах. Затем эти отношения могут быть опубли-

кованы в модуле InfoSphere Business Glossary для их

дальнейшего использования, а также для улучшения

понимания отношений между активами.

Теперь бизнес-спецификации могут быть использо-

ваны в качестве ретроспективной документации и

интегрированы непосредственно в процесс генера-

ции ETL-заданий модуля InfoSphere DataStage.

Сформированные вышеописанным образом бизнес-

правила включаются в ETL-задание в качестве кода

или аннотированных указаний для выполнения

разработчиком. После того как задание InfoSphere

DataStage будет готово, разработчик может развер-

нуть этот же пакетный процесс в качестве SOA-

компонента (с помощью инструмента InfoSphere

Information Services Director).

На протяжении этого процесса метаданные генери-

руются и сопровождаются естественным образом –

как следствие использования тех или иных моду-

лей платформы IBM InfoSphere Information Server.

Платформа IBM InfoSphere Information Server

«делится» релевантными метаданными с каждой из

пользовательских ролей, задействованных на про-

тяжении всего процесса интеграции. Для управле-

ния метаданными в этой уникальной архитектуре

требуется лишь небольшой объем ручного сопрово-

ждения, в отличие от альтернативных решений,

которые используют пассивные метаданные и поэ-

тому требуют значительных усилий по сопрово-

ждению для управления метаданными и поддержа-

ния актуальности информации. Только сторонние

метаданные требуют выполнения административ-

ных задач, таких как описание отношений с объек-

тами метаданных IBM InfoSphere Information

Server. Администраторы и разработчики, которым

необходимо просматривать активы метаданных

Page 26: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

26 IBM InfoSphere Information Server: упрощение интеграции с помощью унифицированных метаданных

IBM InfoSphere Information Server и сторонние

активы метаданных, могут воспользоваться

инструментом InfoSphere Metadata Workbench для

подачи запросов, проведения анализа и генерации

отчетов по соответствующей информации из

общего репозитория.

IBM InfoSphere Information Server помогает организациям пользоваться возможно-стями метаданных в интересах интегра-ционных проектовПоддержка стратегии унифицированных метадан-

ных, разработанной для совершенствования коллек-

тивной деятельности, укрепления доверия и улучше-

ния нормативного соответствия, позволяет IBM

InfoSphere Information Server учитывать не только

технологии, но также потребности людей и процессов.

Предоставляемые этой платформой общий репозито-

рий активных метаданных и сервисы помогают

организациям пользоваться метаданными, генерируе-

мыми на всем протяжении процесса интеграции, с

целью автоматического поддержания согласованности

между проектами и подразделениями. Кроме того,

весьма гибкая и масштабируемая архитектура поддер-

живает большое количество пользовательских ролей

без снижения уровня безопасности, что вооружает

организации необходимыми инструментами для сво-

евременного предоставления релевантной информа-

ции соответствующим пользователям и процессам.

Дополнительная информация

Для получения дополнительной информации о про-

дукте IBM Information Server и об интеграционных

решениях IBM посетите сайт: ibm.com/software/data/ips.

Page 27: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение
Page 28: IBM InfoSphere Information Server: упрощение ...public.dhe.ibm.com/software/dw/ru/download/infoserver_simplify... · 4 IBM InfoSphere Information Server: упрощение

© Copyright IBM Corporation

123370, Москва Пресненская наб., 10 Тел.: +7 (495) 775-8800 Факс: +7 (495) 258-6468, 258-6404

Все права защищены.

IBM, логотип IBM, DataStage, DB2, InfoSphere, QualityStage, Rational, S/390, System z, WebSphere и z/OS являются товарными знаками или зарегистрированными товарными знаками International Business Machines Corporation в США и/или других странах. Если первые упоминания в данной публикации вышеперечисленных или каких-либо других зарегистрированных товарных знаков IBM отмечены символами ® или ™, это означает, что данный товарный знак зарегистрирован в США или охраняется нормами общего права и принадлежит IBM на дату публикации этого материала. Такие товарные знаки могут также быть зарегистрированными в других странах товарными знаками или товарными знаками, охраняемыми нормами общего права других стран. Со списком принадлежащих IBM товарных знаков можно ознакомиться на сайте компании в разделе «Copyright and trademark information» по адресу ibm.com/legal/copytrade.shtml.

Java и все товарные знаки, в которых использовано слово Java, являются товарными знаками Sun Microsystems, Inc. в США и других странах.

Microsoft, Excel и Windows являются зарегистрированными товарны-ми знаками Microsoft Corporation в США и/или других странах.

Linux является зарегистрированным товарным знаком, принадлежа-щим Линусу Торвальдсу, в США и/или других странах.

UNIX является зарегистрированным товарным знаком The Open Group в США и других странах.

Другие названия компаний, продукции и услуг могут являться товарными знаками или знаками обслуживания соответствующих компаний.

Упомянутые в данной публикации продукты или услуги IBM могут быть недоступны в ряде стран, где IBM ведет свою деятельность. Предложения могут быть изменены, продлены или отозваны без предварительного уведомления.

Все утверждения относительно направлений работы и перспективных планов корпорации IBM характеризуют исключительно цели и задачи компании и могут быть изменены или отозваны без уведомления.

1 Компания Gartner: «Magic Quadrant for Application Infrastructure, Q207» (Магический квадрант «Инфраструктура приложений», 2 кв. 2007 г.), май 2007 г.

2 Компания Gartner: «Magic Quadrant for Data Integration Tools, 2007» (Магический квадрант «Инструменты для интеграции данных», 2007 г.), октябрь 2007 г.

3 Компания InfoSizing, Inc.: «Performance Benchmark Report: DataStage XE Parallel Extender» (Отчет по тестированию производительности: DataStage XE Parallel Extender), декабрь 2002 г.

Подлежит переработке для повторного использования