Temat numer Przetłumaczony I opracowany przez zespół numer 2 w składzie



Pobieranie 155,03 Kb.
Strona1/2
Data23.02.2018
Rozmiar155,03 Kb.
  1   2

Temat numer 5.
Przetłumaczony i opracowany przez zespół numer 2 w składzie:
Cezary Górka

Dominik Dziok

Marcin Koch

Marcin Kłaput

Model Grafowo Orientowany do Artykulacji Zależności Ontologicznych

Prasenjit Mitra, Gio Widerhold i Martin Kersten




Streszczenie. Ontologie przedstawiają zawartość, podstawowe właściwości i relacje pomiędzy termami w bazie wiedzy. Wiele źródeł jest obecnie dostępnych ze skojarzonymi ontologiami. Najważniejsze prace nad użyciem ontologii polegają na konstrukcji pojedynczej globalnej ontologii zakrywającej wszystkie źródła. Takie rozwiązanie nie jest skalowalne ani zachowawcze, zwłaszcza gdy źródła często zmieniają się. Proponujemy skalowalny i łatwe do utrzymania podejście bazujące na interoperacjach ontologii. Aby obsłużyć zapytanie użytkownika przechodząc przez granice leżących u podstaw systemów informacji, interoperacje pomiędzy ontologiami powinny być precyzyjnie zdefiniowane. Naszym sposobem jest użycie reguł które przechodzą przez luki semantyczne, przez stworzenie artykulacji lub połączenia pomiędzy systemami. Reguły są generowane przy użyciu półautomatycznych narzędzi artykulacyjnych z pomocą ekspertów w dziedzinie. Aby zrobić ontologie odpowiedzialnymi za automatyczne kompozycje, bazujące na zgromadzonych regułach wiedzy, reprezentujemy je przy użyciu modeli grafowo orientowanych rozszerzonych o niewielki zbiór operatorów algebraicznych. Przyjazne użytkownikowi narzędzie którym jest ONION pomaga ekspertom zapełniać semantyczne luki w prawdopodobnych ustawieniach. Nasza struktura wprowadza solidne podstawy by uprościć pracę ekspertom dziedziny, umożliwia integracje z publicznymi słownikami semantycznymi jak Wordnet i będzie automatycznie pobierać mediatorów zgodnych z ODMG.

  1. Wprowadzenie

Zapełnianie semantycznych luk pomiędzy różnorodnymi źródłami aby odpowiedzieć na zapytanie końcowego użytkownika jest wstępnym warunkiem i kluczowym wyzwaniem do wspomagania globalnych systemów informacyjnych. Podstawa do tego połączenia jest założona w ontologii dla zawiłych źródeł wiedzy. Ontologia w tym kontekście jest zdefiniowana jako taka struktura wiedzy, która pozwala na dzielenie i ponowne użycie wiedzy do specyfikacji termów i relacji między nimi. Ontologie nawiązują do źródeł wiedzy tak jak słowniki związane są z pracą literacką. Tak jak słowniki, ontologie zbierają i organizują termy odniesienia. Przez analogie, definicje w słowniku dają nam powiązania między słowami, tak ontologie dają powiązania, relacje między termami.

Ontologie rozważane w tym dokumencie są zgodne, tj. term w ontologii nie jest powiązany z różnorakimi pojęciami w jednej bazie danych. Zgodne słownictwo jest potrzebne do niedwuznacznego zapytania i unifikacji informacji z wielorakich źródeł.

Automatyzacja dostępu do obszernych zasobów informacji, jak WWW wymaga więcej precyzji niż jest teraz osiągalna. Dzisiaj XML jest używany jako nośnik semantycznych informacji, ale sama z siebie reprezentacja XML nie jest wystarczająca. Dokument XML może reprezentować pojedynczą ontologię dziedziny ale pomaga w rozwiązaniu problemów wprowadzonych przez błędy dopasowania semantycznego. Skupiamy się na tak uformowanych kwestiach jak punkt startowy, wyjaśnienie jak budować połączenia semantyczne tj. reguły logiczne które zapełniają luki semantyczne pomiędzy źródłami i użycie wnioskowania bazującego na informacjach semantycznych do skomponowania wiedzy z różnych źródeł.

Zapełnianie luk pomiędzy wielorakimi źródłami informacji jest aktywnym obszarem badań Poprzednie prace nad integracją informacji i nad integracją systamów opierały się na konstrukcji unifikowanych systemów baz danych. Jednakże unifikowanie systemów okazuje się nie zbyt skalowalne odkąd obszerne systemy integracji prowadzą do ogromnych i trudnych do utrzymania układów. Od kiedy znaczenie i możliwości baz danych nie są sprecyzowane i szybko się zmieniają, domagają się identyfikacji „pod-dziedziny” i „przestrzenie nazw” aby pomóc stworzyć precyzyjny kontekst semantyczny odmiennych źródeł. Zamiast tego, proponujemy wykorzystać połączenia semantyczne pomiędzy takimi kontekstami jak punkt startowy w taki sposób że źródłowe ontologie mogą pozostać niezależne. W większości prawdopodobnych sytuacji wystarczy po prostu użyć połączenia semantycznego gdziekolwiek wymagane jest wzajemne oddziaływanie pomiędzy źródłami informacji.

Dzielimy niżej leżące założenia tak, że ogólny obraz jest syntaktyczną reprezentacją semantycznego kontekstu źródła informacji. Definiowanie takiego obrazu wymaga jednakże specyfikacji manualnych. Obrazy muszą być odświeżane lub rekonstruowane nawet dla małych zmian w indywidualnym źródle. Zamiast ręcznego kreowania i materializowania takich obrazów, dostarczamy półautomatyczną opartą na regułach strukturę dla interoperacji bazujących na artykulacjach ontologii. Naszym argumentem jest to, że w wielu przypadkach zastosowanie zbioru zasad artykulacji ontologii danej dziedziny ułatwi pracę.

Semantyczna interoperacyjność była badana w pracy nad różnorodnymi bazami danych i systemach wielu baz danych. Jedną z użytych strategii jest połączenie wszystkich systemów w globalny układ połączeniowy. Takie podejście ma te same wady co strategia polegająca na łączeniu informacji. Co więcej, poleganie na użytkowniku w sprawie zapełnienia luk pomiędzy informacjami otrzymanymi z różnych baz danych narzuca założenie że wszystkimi użytkownikami będą eksperci z danej dziedziny. Zamiast tego rozważamy system do proponowania i rozwiązywania luk semantycznych tylko w przecięciu między źródłami wiedzy które są związanie z zastosowaniem. Taki system jest napędzany przez zbiór zasad wprowadzony przez eksperta z dziedziny, który skupia się na kreowaniu artykulacji. Nudne zadanie kreowania artykulacji jest bardzo uproszczone przez użycie narzędzia które korzysta z zewnętrznych źródeł wiedzy do proponowania stosowanych połączeń semantycznych. Poza tym pozwala ekspertom wprowadzać bezpośrednie oceny i zmiany na potencjalnie nie jasne konstrukcje.

Ontologie zostały już przedstawione przy użyciu rozmaitych modeli tekstowych. Chociaż takie modele są proste do konstrukcji, ich relacje strukturalne są często trudne do wizualizacji. To staje się szczególnie zasadnicze jeśli ontologie muszą być prezentowane ludziom, użytkownikom końcowym.

Przystosowaliśmy modele grafowe do reprezentowania ontologii. Model taki przenosi relacje strukturalne z ontologii w prosty, jasny, elegancki i użyteczny format. Dobrze rozmieszczony plan graficzny jest istotą modelu GOOD, który został wykorzystany do modelowania obiektowo orientowanych DBMS używając struktur opierających się na grafach.

W tym dokumencie pokażemy jak ontologie indywidualnych źródeł wiedzy mogą być artykułowane w zunifikowaną ontologię przy użyciu reprezentacji graficznej gdzie połączenia semantyczne są modelowane przy użyciu zasad logicznych oraz reguł funkcjonalnych.

Innowacją w systemie ONION (ONtology compositION) jest architektura bazująca na formalizmie rozsądkowym aby wspomagać strukturę skalowaną do integracji ontologii. Ta architektura wprowadza równowagę pomiędzy zautomatyzowany ( i możliwe że zawodny system ) i manualny system specyfikowany całkowicie przez ekspertów dziedziny. Ta modułowa struktura pozwala na jasne odseparowanie kilku przetwarzanych procesów wiedzowych. Model jest łatwy, jednak wystarczająco bogaty, żeby wprowadzać podłoże dla wniosków logicznych niezbędnych do kompozycji wiedzy i dla detekcji błędów w regułach artykulacyjnych. Algebra ontologii jest zdefiniowana. Jest machiną do wspomagania procesu komponowania ontologii przez artykulacje. Implementacja systemu ONION bazuje na algebrze ontologii.

W dalszej części dokumentu na początku przedstawimy ogólną architekturę systemu ONION. Później przybliżymy graficzna reprezentację ontologii oraz generację artykulacji. Następnie przedstawimy algebrę ontologii i wszystko podsumujemy wnioskami.




  1. Przegląd ONION

Konwencje notacji


W pozostałej części dokumentu będziemy się posługiwać następującymi terminami. Indywidualne ontologie są odniesieniem do ontologii źródłowych. Reguły artykulacji wskazują, które termy, indywidualnie lub w zespole, są związane w ontologiach źródłowych. Ontologia artykulacji zawiera te termy i relacje między nimi. Termin artykulacja będzie się odnosił do ontologii artykulacji i do reguł, które opisują termy pomiędzy ontologią artykulacji i ontologią źródłową. Ontologia źródłowe wraz z artykulacją jest nazywana ontologią zunifikowaną.

Ważne jest by odnotować, że ontologia zunifikowana nie jest fizyczną jednostką, ale jedynie termem ułatwiającym bieżące rozważania. Ontologie źródłowe są utrzymywane niezależnie i artykulacja jest jedyną rzeczą, która jest fizycznie pamiętana. Jak to jest pokazane na Rys.1, ontologia zunifikowana Ont5 zawiera ontologie źródłowe Ont3 i Ont4 oraz ontologię artykulacji Art2. Artykulacja ontologii źródłowych Ont4 i Ont3 składa się z ontologii artykulacji Art2 i semantycznych połączeń łączących je z ontologiami źródłowymi.




Rys.1 System ONION
Teraz zaprezentujemy przegląd architektury systemu i przedstawimy przykład. Architektura ONION, pokazana na Rys.1, została zaprojektowana z dużym naciskiem na modularność. Uznaje ona potrzebę stosowania kilku, znajdujących się u podstaw, reprezentacji źródła wiedzy, dopuszczając różne rodzaje komponentów semantycznego wnioskowania oraz integrację z mechanizmami przetwarzania zapytań. Utrzymując model prostym a architekturę modularną, mamy zamiar uzyskać szerszą możliwość skalowania i w konsekwencji narazić się na mniejszą ilość problemów.


2.1 Warstwa danych ONION
Warstwa danych ONION jest głównym punktem tego dokumentu. Kieruje ona reprezentacją ontologii, artykulacją, załączonym zbiorem reguł oraz zasadami koniecznymi dla przetwarzania zapytań. Każda ontologia, Oi reprezentowana jako graf, odzwierciedla (część) zewnętrznego źródła wiedzy. Jako, że ontologie mogą być reprezentowane na wiele sposobów, zakładamy pewne transformacje żeby uczynić je dostępnymi do zarządzania w kontekście naszego systemu. Akceptujemy ontologie bazujące na specyfikacji IDL lub dokumentach XML, jak i proste listy sąsiedztwa.

Większość narzędzi do ontologii posiada mechanizmy wnioskowania, różniące się złożonością, ściśle powiązane z ontologiami. Nasze podejście polega na rozdzieleniu mechanizmu logicznego wnioskowania od reprezentacji modelu dla ontologii, jak tylko jest to możliwe. To pozwala nam na przystosowanie różnych mechanizmów wnioskowania aby móc rozważać różne grafy ontologii i być pewnym, że nie upoważnimy konkretnej semantyki do logicznego wnioskowania.

Artykulacja jest też reprezentowana jako graf ontologii wraz ze strukturami Aij, np., semantyczne połączenia pomiędzy ontologiami artykulacji, a leżącymi u ich podstaw ontologiami Oi i Oj. Ontologia artykulacji zwykle używa pojęć i struktur odziedziczonych z indywidualnych źródeł. Jako takie mogą one być postrzegane jako nowe źródła wiedzy dla warstw wyższych. Semantyczne połączenia mogą być rzutowane jako reguły artykulacji Rk, które pobierają term z Oi i odwzorowują go na term Oj używając etykiety posiadającej znaczenie semantyczne.


2.2 Przeglądarka ONION
Przeglądarka ONION jest to graficzny interfejs użytkownika dla systemu ONION. Ekspert w dziedzinie inicjuje sesję wyświetlając interesującą go ontologię. Teraz może uściślać, wybierając spośród istniejących ontologii, importować dodatkowe ontologie do systemu , czy specyfikować reguły artykulacji.

Alternatywną metodą jest wywołanie generatora artykulacji aby zwizualizować możliwe połączenia semantyczne bazujące na dostępnym zbiorze reguł. Następnie ekspert może uaktualnić sugerowane połączenia używając przeglądarki lub dostarczać nowych reguł do generacji artykulacji.

W końcu używając interfejsu może formułować zapytania; lub zarządzać systemem celem wygenerowania opakowania do włączenia w konkretnej aplikacji używając mechanizmu zapytań ONION.


2.3 System zapytań ONION
Interoperacje kształtują podstawy dla zapytań o ich semantycznie znaczące przecięcia lub do wymiany informacji pomiędzy leżącymi u podstaw źródłami.

Pierwsze wymagają tradycyjnego mechanizmu zapytań, który pobiera zapytanie złożone z termów z ontologii artykulacji i wyprowadza plan wykonania w stosunku do załączonych źródeł. Zwracane są połączenia semantyczne. Czasem jednak wymagane jest przeformułowanie zapytania.

System ten ma graficzny interfejs użytkownika, opakowania dla aplikacji i procesor zapytań, który używa reguł wykonywania zapytań celem przeformułowania i wygenerowania rozwiązania.


2.4 Mechanizm artykulacji
Mechanizm artykulacji jest odpowiedzialny za tworzenie ontologii artykulacji oraz połączeń semantycznych pomiędzy nimi a ontologiami źródłowymi, bazującymi na regułach artykulacji. ONION bazuje na systemie SKAT (Semantic Knowledge Articulation Tool) zaprojektowanym w Stanford. Reguły artykulacji są proponowane przez SKAT, używając zasad eksperta oraz innych, zewnętrznych źródeł wiedzy lub semantycznych leksykonów (np. Wordnet), po czym są weryfikowane przez eksperta. Mechanizm wnioskowania używa reguł artykulacji wygenerowanych przez SKAT, jak i reguł z indywidualnych ontologii źródłowych, żeby wygenerować więcej reguł, jeśli to tylko możliwe.

Generator artykulacji pobiera reguły artykulacji i generuje artykulacje, np. graf ontologii artykulacji i semantyczne połączenia, które są następnie przekazywane ekspertowi do zatwierdzenia. Ekspert ma ostatnie słowo w generowaniu artykulacji i jest odpowiedzialny za korektę niezgodności w sugerowanych artykulacjach. Jeśli zasugeruje modyfikacje, są one przekazywane do SKAT do dalszej generacji nowych reguł artykulacji. Proces ten jest iteracyjnie powtarzany, aż do momentu, gdy ekspert jest zadowolony z wygenerowanej artykulacji.



2.5 Przykład
Aby zilustrować nasz grafowy model ontologii, użyjemy wybranych części dwóch ontologii. Części ontologii przewoźnik i fabryka, odnoszące się do aplikacji transportowej, zostały mocno uproszczone. Powiązania semantyczne „Podklasa”, „Atrybut”, „Instancja” i „Semantyczna Konsekwencja” są skrótowo reprezentowane przez „S”, „A”, „I”, „SI”. Dla przejrzystości kilka najbardziej oczywistych krawędzi zostało pominiętych. Niezależnie od wcześniej wspomnianych powiązań, ontologie indywidualne zawierają również inne binarne powiązania pomiędzy termami. Oczekujemy, że ontologie zawierają reguły definiujące własności każdego powiązania, np. będziemy mieć reguły wskazujące przechodni charakter relacji „Podklasa”. Reguły te są używane przez generator artykulacji i mechanizm wnioskowania podczas generowania artykulacji i odpowiadania na zapytania użytkownika.

Rys.2 Artykulacje ontologii


3. Grafowa reprezentacja Ontologii
System ONION został zaczerpnięty z opartych na grafach baz danych w[15]. W tym rozdziale przedstawimy jego formalne tło i związane operacje.
Model Orientowany na Grafach. Formalnie, ontologia O jest reprezentowana przez skierowany etykietowany graf G=(N,E) gdzie N jest skończonym zbiorem wierzchołków oraz E jest skończonym zbiorem krawędzi. Krawędź jest oznaczana jako (n1,,n2) gdzie n1 i n2 należą do N i  jest etykietą krawędzi. Etykieta wierzchołka n jest określona przez funkcję (n) która odwzorowuje wierzchołek w niepusty ciąg znaków. W kontekście ontologii, etykieta często jest rzeczownikiem, która przedstawia pojęcie. Etykieta  na krawędzi e=(n1,,n2) jest słowem otrzymanym z =(e). Słowo związane z krawędzią odnosi się do zarówno czasownika w języku naturalnym, jak i zdefiniowanej wcześniej znaczeniowej zależności. Dziedziną funkcji  i  jest ogólny zbiór wszystkich wierzchołków(z wszystkich grafów), a zbiorem wartości jest zbiór słów(ze wszystkich słowników).

Przykład. Nasz działający przykład jest to kompozycja trzech niezależnych grafów, z których każdy posiada ontologiczny kontekst. Semantyczny model jest zbudowany na relacjach {Instancja, Podklasa, Atrybut}, które często występują w literaturze.
Wzorce grafów. Aby posługiwać się ontologicznymi grafami, musimy zidentyfikować części grafów, które nas interesuj. Wzorce grafów mogą być używane do tego celu. Definiujemy wzór P będący grafem P=(N’,E’), który pasuje do podgrafu jeśli, z wyjątkiem strukturalnego dopasowania, etykiety odpowiadających krawędzi i wierzchołków są identyczne.

Formalnie, graf G1=(N1,E2) jest dopasowany do grafu G2=(N2,E2) jeśli istnieje całkowicie mapująca funkcja f: N1N2 taka, że:

1.n1 N1, 1(n1) = 2( f(n1))

2.e1 = (n1,,n2) E1 e2 = (f(n1),, f(n2)) E2

W praktyce, oprócz dopasowania opisanego powyżej, ekspert może zdefiniować inne wersje dopasowania. Dla przykładu, ekspert może znaleźć zbiór synonimów i zastosować regułę, która rozluźni pierwszy warunek i spowoduje, że wierzchołki będą dopasowywane do siebie nie tylko gdy mają dokładnie te same etykiety, ale również jeśli są synonimami zdefiniowanymi przez eksperta. Ewentualnie drugi warunek, który wymaga aby krawędzie miały tę samą etykietę, nie musi być przymusowy.

W zestawie narzędziowym ONION, wzorce są głownie identyfikowane przez bezpośrednią manipulacje reprezentacji grafów. W interfejsie tekstowym używamy prostej notacji z (okrągłymi) nawiasami aby oznaczyć hierarchicznie obiekty.




  1   2


©operacji.org 2017
wyślij wiadomość

    Strona główna