Exhibit i Potluck – zbieranie i przetwarzanie danych

Artur Machlarz ByArtur Machlarz

Exhibit i Potluck – zbieranie i przetwarzanie danych

Poza PiggyBank i Solver (patrz artykuł na niniejszym blogu) Simile dostarcza kilka innych interesujących aplikacji do zbierania, przetwarzania i zarządzania informacjami. Do ciekawszych produktów zaliczyć można z całą pewnością Exhibit – aplikację tworzącą „w locie” bardzo wygodną bazę danych z plików JSON – oraz Potluck, który integruje bazy stworzone przy pomocy Exhibit.

Exhibit to aplikacja internetowa, która tworzy bardzo dynamiczne bazy danych – z pliku JSON jest generowany zapis w formacie analogicznym do formy RDF i odpowiednio przetworzony zamieszczany jest na naszej stronie internetowej. Odpowiednio przetworzony, to znaczy zaprezentowany w taki sposób, że mamy wyraźnie wyodrębnione kategorie oraz ich wartości. Dodatkowo także mamy wyszukiwarkę dla stworzonej bazy oraz możliwość dowolnego filtrowania jej zawartości. Możemy włączać i wyłączać dowolne wartości poszczególnych kategorii w dowolnych konstelacjach:

Exhibit

Jedna z przykładowych stron z bazą Exhibit ze strony Simile.

Bazę Exhibit tworzymy wpisując w nagłówku naszej strony www odwołanie do skryptu Exhibit i link do pliku JSON. W pliku tym defniujemy pola bazy oraz ich właściwości (np. możemy zdefiniować pole jako datę, jako link, adres geograficzny itp.). Podanie takich definicji pozwala na późniejsze dodatkowe przetwarzanie danych, np. zbiorcze przedstawienie wskazanych w bazie lokalizacji w GoogleMaps (przykład prostego pliku JSON – możemy także podejrzeć pliki JSON w przykładach baz Exhibit zamieszczonych na stronie Simile). Poza tymi dwoma linkami dodajemy jeszcze informacje o tym, jakie chcemy mieć możliwości filtrowania danych (w odpowiednich miejscach wpisujemy

ex:role="facet" ex:expression=".[nazwa kategorii]"

Do stworzenia pliku JSON możemy wykorzystać inną aplikację Simile do przekonwertowania np. pliku .xls do JSON, nawet „w locie”, tzn.: możemy pracować na pliku .xls, który będzie stanowił źródło danych dla bazy Exhibit. Aplikacja nazywa się Babel i służy tylko do wzajemnej konwersji różnych formatów. Ostatecznie zatem okazuje się, że do budowy bazy Exhibit potrzebujemy tylko graficznie atrakcyjną stronę w html i plik xls.

Potluck to także aplikacja sieciowa. Jej jedyną funkcją jest łączenie baz Exhibit. Pozwala to na swobodne porównywanie informacji i wygodne powiązanie informacji z kilku źródeł.

Obie aplikacje są przykładem zastosowania opisu semantycznego w formacie spełniającym wymogi RDF. Ich zasadą działania jest bowiem identyfikacja pojedynczego „rekordu” i nadanie mu jednoznacznego identyfikatora URI oraz interpretacja wskazanych przez nas kategorii jako predykatów i ich wartości. Zapis w formacie JSON jest formalnie zgodny z trójkowym zapisem RDF:

 

Exhibit

Exhibit generuje także zapis w pliku .rdf – na ilustracji część wyniku walidacji pliku: jeśli porównamy z tą ilustracją źródłowy plik JSON zobaczymy zasadę interpretacji zapisu w pliku JSON.

AM.

 

O autorze

Artur Machlarz

Artur Machlarz administrator

Od 2005 pracuje jako infobroker, zajmuje się wyszukiwaniem i opracowywaniem informacji. Specjalizuje się w tworzeniu unikalnych baz danych. Jako pracownik naukowy zajmuje się modelami przetwarzania informacji w systemach rozproszonych. Lubi się wspinać i grać na kontrabasie.

Odpowiedz

Time limit is exhausted. Please reload the CAPTCHA.