25
Тема 10 Стандарти ANSI ASC X12, ISO 11179. Підтримка стандарту Дублінського ядра.

Тема 10. Стандарти ANSI ASC X12, ISO 11179. Підтримка стандарту Дублінського ядра

Embed Size (px)

Citation preview

Тема 10

•Стандарти ANSI ASC X12, ISO 11179.

•Підтримка стандарту Дублінськогоядра.

Електронний документообіг EDI. ANSI ASC X12

• Електронний документообіг EDI (Electronic DataInterchange) – обмін між комп’ютерами структурованою інформацією по взаємоузгоджених правилах. Вперше EDI почав застосовуватися в середині 60-х років в сфері залізничних і автомобільних перевезень.

• Стандарт електронного обміну документами ANSI ASC X12 (American National Standards InstituteAccredited Standards Committee X12) був розроблений в 70-х роках, коли був важливий малий розмір електронного документа і кожен байт повинен був нести максимум інформації.

Організації, які працюють над стандартами EDI:

• ANSI (American National Standards Institute) – це Інститут, який встановлює стандарти для багатьох видів діяльності. EDI займається Комітет ANSI X12 –головна організація США по стандартизації EDI.

• EDIA (The Electronic Data Interchange Association, раніше відома як Transportation Data Coordinating Committee (TDCC))

• AIAG (The Automotive Industry Action Group) – група стандартів для автомобільної промисловості. Даний стандарт є підгрупою стандартів ANSI X12.

• UCS (The Uniform Communications Standard) стандарт, використовуваний для бакалійної індустрії.

• EDIFACT (Electronic Data Interchange for Administration, Commerce, andTransport.) – Організація, що займається стандартизацією EDI при Раді з Економіки та Соціальної політики ООН. Стандарти EDIFACT, в відміну від ANSI X12, використовуються в основному в Європі, в той час як X12 – в Америці.

• ODETTE (The Organization for Data Exchange by Tele-Transmission in Europe.)• VICS (The Voluntary Inter-industry Communication Standards) – організація, яка є

підгрупою ANSI X12 і займається стандартами для індустрії роздрібної торгівлі.

Основні терміни та поняття:

• документ

• функціональна група

• interchange

Типи даних, які може містити елемент у стандарті:

• AN (Alpha-Numeric)

• R (Real)

• N[X] (Number)

• ID (Identity)

• DT (Date)

• TM (Time)

• B (Binary)

Сегмент

• Сегмент (segment) - комбінація пов'язаних елементів або складових даних, які згруповані для надання корисної інформації.

• Сегмент складається з ідентифікатора (tag) і елементів, розділених спеціальними символами (element separator) – («зірочка» (asterisk) - «*»). Закінчуються сегменти іншим символом (segment terminator) – (тильда «~»).

• У документі сегменти йдуть один за одним у порядку, визначеному стандартом.

Типи опціональності елементу:

• M (Mandatory) – обов’язковий елемент.

• O (Optional) – необов’язковий, опціональний елемент.

• C (Conditional) – залежний елемент, який опціонально залежить від умов.

Елемент

• Елемент (element) сегмента - це «квант» інформації, що міститься в сегменті.

• Елементи в сегменті мають свої «адреса», які складаються з імені сегмента і позиції елемента в даному сегменті. Зазвичай позначається як<ІМ'Я СЕГМЕНТУ> - <ПОЗИЦІЯ> або <ІМ'Я СЕГМЕНТУ> <ПОЗИЦІЯ>

Сегменти конвертів

Існують три типи конвертів:• ISA / IEA Envelopes, • GS / GE Envelopes• ST / SE Envelopes.

Початкові сегменти конвертів мають назву Header, а завершальні – Trailer:

• ISA – Interchange Control Header• GS – Function Group Header• ST – Transaction Set Header• SE – Transaction Set Trailer• GE – Function Group Trailer• IEA – Interchange Control Trailer

ISO / IEC 11179

ISO / IEC 11179 (офіційно відомий якISO/IEC 11179 реєстр метаданих (MDR)СТАНДАРТ) міжнародний стандарт дляпредставлення метаданих для організації дореєстру метаданих.

Структура стандарту ISO / IEC 11179:

• Частина 1 - Рамки (іменовані ISO/IEC 11179-1)

• Частина 2 – Класифікація

• Частина 3 - Registry метамодель і основні атрибути

• Частина 4 - Формулювання визначень даних

• Частина 5 - найменування та ідентифікаційні принципи

• Частина 6 – Реєстрація

Кожен елемент даних у реєстрі 11179 метаданих ISO / IEC:

• повинні бути зареєстровані відповідно до керівних принципів реєстрація (11179-6)• буде однозначно визначені в реєстрі (11179-5)• повинні бути названі відповідно до іменування та ідентифікації принципів (11179-5) • повинні бути визначені за допомогою вироблення правил визначення даних (11179-4) • можуть бути класифіковані в схемі класифікації (11179-2)

Елементи даних, які зберігають "коди" абоперераховані значення необхідно також вказатисемантику кожного з кодових значень з точнимивизначеннями.

ПІДТРИМКА СТАНДАРТУ ДУБЛІНСЬКОГО ЯДРА

Інтернет це величезний обсяг цифрових ресурсів,розподілений практично по всій земній кулі. Оцінитикількісно мережу Інтернет можна тільки приблизно.Це динамічна система, яка змінює свої параметрищохвилини.

Для того, що б хоч якось упорядкувати такий обсягнеструктурованої інформації в мережі Інтернетіснують пошукові сервери.

За принципом індексування вони поділяються надві групи:• з індексуванням автоматичним (машинним)• з інтелектуальним індексуванням (за участюлюдини)

МЕТАДАНІ

З покон віку бібліотекарі займалисяінтелектуальною обробкою джерел інформації напаперових носіях. Вони створювали і створюютькаталоги. Спочатку карткові, останнім часом —електронні. Та все ж і перші, і другі базуються на тихсамих правилах щодо опису книги, журналу,газетної або журнальної статті тощо.

З розвитком Інтернет фахівці з інформаційнихтехнологій придумали нові терміни для збереженняпевних одиниць описової або статистичноїінформації про об’єкти і назвали їх МЕТАДАНИМИ.

Набори Метаданих

У буквальному значенні МЕТАДАНІ можна розшифрувати як“дані про дані”, перехід до чого-небудь іншого, зміну стану,перетворення.

Бібліографічна картка є не що інше, як набір МЕТАДАНИХ накнигу чи статтю з журналу, яка побудована за правиламибібліографічного опису.

Наборів МЕТАДАНИХ існують десятки. Це можуть бути вузькоспецифічні набори чи метадані універсального характеру.

Предметом подальшої уваги стане Ініціатива ДублінськогоЯдра Метаданих (Dublin Core Metadata Initiative).

Стандарт метаданих Dublin Core, є форматом описупрактично будь-яких ресурсів Інтернет — не складний заструктурою, відносно легкий у застосуванні, інтернаціональний

Дублінське ядро

Дублінське ядро - словник (семантична мережа)основних понять англійської мови, призначений дляуніфікації метаданих для опису найширшого діапазонуресурсів.

Словник розділений на два рівні:• простий (некваліфікований, simple), щоскладається з 15 елементів;• компетентний (кваліфікований, qualified), щоскладається з 18 елементів і групи кваліфікаторів, якіуточнюють семантику елементів для підвищеннякорисності пошуку ресурсів.

Практичне застосування елементів Дублінського ядра.

Розглянемо елементарну веб-сторінку<html>

<head><title>

Заклик до бібліотечного співтовариства </title>

</head><body>

Привіт! Давайте вивчати Дублінське ядро. </body>

</html>

Можемо спостерігати — у вікні браузера буде показано все те, що записано в блоці тіла html-документу (тобто між тегами <body> і </body>).

Це дає нам змогу зробити важливе припущення — якщо ми створимо спеціальні теги із даними Дублінського ядра і розмістимо іх у блоці ЗАГОЛОВКІВ, тобто між тегами <head> і </head>, то вони будуть інтегровані у будь-який html-документ, але не з’являться у вікні браузера під час перегляду.

Як "працює" Дублінське ядро

Знову перепишемо наш html-документ вставивши у блок заголовків теги

<html><head><title> Заклик до бібліотечного співтовариства </title>

<meta name=”DC.Title” content=”Заклик до бібліотечного співтовариства»> <meta name=”DC.Description” content=”Цей документ є агітаційним закликом

вивчати новий стандарт Дублінське ядро метаданих" > <meta name=”DC.Subject” content=”Дублінське ядро, метадані, звернення»><meta name=”DC.Language” content=”uk”>

</head><body>Привіт! Давайте вивчати Дублінське ядро. </body>

</html>

Розглянемо синтаксис кодування елементу. Спочатку завжди записується службове слово:meta

Далі атрибут name= . Після службових слів вноситься власне назва елементу із префіксом DCчерез крапку — щоб позначити стандарт метаданих, у нашому випадку це Дублінське ядро, іобов’язково береться у подвійні лапки.

Після цього слідує атрибут content=, а за ним (теж обов’язково у подвійних лапках) слідуєзмістовне наповнення елементу, тобто його значення.

Додаткові засоби DC

Ми розглянули мінімальний склад кодуванняелементу Дублінського ядра мовою HTML.Арсенал DC також включає в собі такі поняттяяк кваліфікатори та схеми. Ці додаткові засобирозширюють можливості опису цифровогоресурсу і роблять його більш детальним. Їхвикористання не обов’язково, але бажано.

Кваліфікатори

Кваліфікатор є атрибутом назви певного елементу Дублінського ядра,що розширює або деталізує назву елемента. Він вноситься одразу ж післяімені елемента і відокремлюється крапкою.

Приклади (для наочності кваліфікатор підкреслено):<meta

name=”DC.Creator.PersonalName”content=”Чуковський”>

<metaname=”DC.Data.Created”content=”2014-04-23”>

Бажано використовувати у якості кваліфікаторів терміни ізконтрольованих словників, але за філософією Дублінського ядра діє принцип“відкидання зайвого”. Тобто якщо програма-агент, що індексує ресурси нерозуміє змісту якогось кваліфікатора — вона просто відкине його.

Схема та локалізація

Схема є атрибутом що пояснює до якої системи класифікаціївідноситься певний елемент Дублінського ядра. Він не обов’язковий іможе бути використаний не у всіх елементах. Атрибут схема кодуєтьсянаступним чином: службове слово scheme, знак = і у подвійник лапкахназва класифікації, стандарту або схеми.

Приклад:<Meta name="DC.Subject" Scheme="ББК" content="78.30">

І ще один атрибут — атрибут мови можна використовувати ізбільшістю елементів Дублінського ядра. Як і схема він кодується у тегуокремо і складається із службового слова Lang, знаку = і коду мови (уподвійних лапках).

Приклад:<meta name=”DC.Title” lang=”uk” content=”Мойдодир”>

Елементи метаданих DC:

1. Title (назва ресурсу)2. Creator (особа, організація або служба, відповідальна за

підготовкузмісту ресурсу)3. Subject (тема, обговорювана в змісті ресурсу)4. Description (опис змісту ресурсу у вільній формі)5. Publisher (особа, організація або служба, що забезпечує доступ до

ресурсу)6. Contributor (інші учасники підготовки змісту ресурсу крімзазначеного в

Creator)7. Date (дата створення або надання доступу до ресурсу)8. Type (жанр, категорія або інші характеристики природи ресурсу)9. Format (характер подання ресурсу)10.Identifier (точне посилання на ресурс)11.Source (посилання на джерело, з якого продукувати даний ресурс)12.Language (мова представлення ресурсу)13.Relation (посилання на ресурс, пов'язаний з даним) 14.Coverage (область простору, часу і т.д., до якої відноситьсязміст

ресурсу)15.Rights (права інтелектуальної власності на ресурс і т.п.).

Додаткові елементи DC

Досягнута угода про склад елементів метаданих Дублінського ядрафіксує склад належних йому елементів. Однак при практичному їхвикористанні немає можливості забезпечення однозначної інтерпретації їхсенсу різними користувачами.

Наприклад, елемент Date в різних випадках може мати різний зміст -дата публікації сторінки в Веб, дата останнього оновлення цієї сторінки і т.д.

Крім того DC 1.1 не визначає правила подання значень назв елементівметаданих. З цих причин DCMI в додаток до Дублінської ядра схвалила тризасоби, які не ввійшли в офіційний склад DC 1.1:

1. Набір з 33 додаткових і уточнюючих елементів метаданих2. Комплект схем кодування (кваліфікаторів), кожна з яких визначає

безліч значень відповідного елемента DC3. Словник типів, що включає набір ідентифікаторів типів можливих

значень деяких елементів DC, вказівка яких для відповідних значеньдозволить адекватно їх інтерпретувати.

Поділ елементів DC

ЗМІСТІНТЕЛЕКТУАЛЬНА

ВЛАСНІСТЬСТАН

Назва Створювач Дата

Предмет Видавець Формат

Опис Співавтор Ідентифікатор

Тип Права Мова

Джерело

Відношення

Охват

П’ятнадцять елементів Дублінського ядра можна поділити на три основні групи за їх призначенням

У стандарті Дублінського ядра метаданих втілені наступні характеристики:

• Простота створення і підтримки данихДублінське ядро являє собою мінімально простий набір елементів що дають

змогу не тільки фахівцям створювати прості описові записи для цифрових ресурсів і забезпечує ефективний механізм запитів до ресурсів у мережевому оточенні.• Семантика загального вживання

Знаходження ресурсів серед великої кількості загальної (часто слабко структурованої) інформації у мережі Інтернет є досить складною справою.

Дублінське ядро може допомогти «досліднику цифрових ресурсів» (досліднику-непрофесіоналу) знайти потрібну інформацію через послідовність загальних елементів.• Міжнародний масштаб

WWW притаманний цілий ряд специфічних лінгвістичних проблем. Розроблювачі Дублінського ядра, являють собою представників практично усіх континентів планети впевнені, що розвиток цього стандарту вирішить складну багатомовну і мильтикультурну природу електронних ресурсів планети.• Розширюваність

Досягаючи балансу між простотою опису цифрових ресурсів з однієї сторони і необхідністю ретельного опису деталей з іншого боку, розроблювачі Дублінського ядра усвідомлюють важливість створення механізму, здатного розширити набір елементів у залежності від специфіки ресурсу. Передбачається, що розроблювачі інших подібних стандартів створять додаткові набори елементів для опису ресурсів, які дадуть змогу інтегрувати їх до набору Дублінського ядра з метою максимально повного опису ресурсу.