IR (Information Retrieval)

Artur Machlarz ByArtur Machlarz

Information is not music…

„Information is not knowledge. Knowledge is not wisdom. Wisdom is not truth. Truth is not beauty. Beauty is not love. Love is not music. Music is the best…” – Frank Zappa.

Informacja nie jest ani miłością ani muzyką, ale muzyka zawsze zawiera pewne informacje. Podobnie jak słoje drzewa mogą powiedzieć coś o jego wieku, tak i utwór muzyczny może być przynajmniej nośnikiem informacji o samym sobie, informacji, która pozwala na identyfikację i opis dzieła oraz jego porównywanie z innymi utworami.

Czytaj dalej

Artur Machlarz ByArtur Machlarz

Model „Bibliontology” raz jeszcze

Niewątpliwą zaletą modelu Bibliontology zaprezentowanego na początku 2008 roku jest integracja z innymi modelami opisu danych w sieci semantycznej. Dzięki temu do zastosowań sieciowych z pewnością nadaje się bardziej od innych formatów zapisu metadanych bibliograficznych. Czytaj dalej

Artur Machlarz ByArtur Machlarz

Open Calais, czyli budujemy mosty do Web 3.0.?

Open Calais to serwis internetowy tworzący „na żywo” metaopis treści dowolnego dokumentu w oparciu o ustalone zasady analizy zawartości dokumentu i jego przekładu na RDF. System Calais dokonuje kategoryzacji treści dokumentu: ludzie, technologie, miejsca, zdarzenia są wyodrębniane z tekstu. Pozwala to na dość swobodną nawigację i ocenę zawartości przeglądanego dokumentu. Czytaj dalej

Artur Machlarz ByArtur Machlarz

Co to jest: „semantyczna wyszukiwarka”?

Do wyszukiwarek semantycznych zalicza się przynajmniej dwa rodzaje wyszukiwarek: wyszukiwarki analizujące „znaczenie” indeksowanych dokumentów oraz wyszukiwarki przeszukujące zasoby sieci semantycznej. Te dwa rodzaje wyszukiwarek semantycznych działają inaczej i inną mają też pełnić rolę w poszukiwaniu informacji. Czytaj dalej

Artur Machlarz ByArtur Machlarz

Exhibit i Potluck – zbieranie i przetwarzanie danych

Poza PiggyBank i Solver (patrz artykuł na niniejszym blogu) Simile dostarcza kilka innych interesujących aplikacji do zbierania, przetwarzania i zarządzania informacjami. Do ciekawszych produktów zaliczyć można z całą pewnością Exhibit – aplikację tworzącą „w locie” bardzo wygodną bazę danych z plików JSON – oraz Potluck, który integruje bazy stworzone przy pomocy Exhibit. Czytaj dalej

Artur Machlarz ByArtur Machlarz

PiggyBank, czyli próbka działania semantycznej sieci

Piggy Bank to jeden z produktów Simile – dodatek do przeglądarki Firefox. Jego funkcją jest pobieranie różnego rodzaju metadanych związanych ze wskazaną stroną www – w szczególności danych zawartych w plikach RDF. Aplikacją rozszerzającą funkcjonalność PiggyBank jest screen-scrapper Solver ułatwiający pobieranie danych ze stron bez dołączonych plików RDF i ich zapisywanie w schemacie RDF. Czytaj dalej

Artur Machlarz ByArtur Machlarz

The Bibliographic Ontology – semantyka do opisu bibliograficznego

Na blogu Frédéricka Giasson znalazła się informacja o opublikowaniu semantyki dla pozycji bibliograficznych (BIBO). Zgodnie z informacjami podanymi przez autora bloga (i jednocześnie współautora ontologii BIBO) ontologia ta zostanie wykorzystana przez Zotero w opisie dokumentów. Czytaj dalej

Artur Machlarz ByArtur Machlarz

SemWebCentral – baza projektów Semantic Web

SemWebCentral to nie tylko platforma informacyjna i baza projektów służących rozwojowi Web 3.0., ale przede wszystkim platforma wspomagająca rozwój i zarządzanie poszczególnymi projektami. Do poszczególnych, zarejestrowanych w serwisie, projektów, dołączone są listy dyskusyjne, fora, dokumentacje, informacje o zadaniach do realizacji. Czytaj dalej

Artur Machlarz ByArtur Machlarz

Boolify – Boole’owska „wyszukiwarka” edukacyjna

Boolify to nie tyle wyszukiwarka internetowa, co projekt edukacyjny przedstawiający zasadę działania operatorów Boole’a w wyszukiwarkach – uczniowie mogą się przekonać na przykładach, jak bardzo zmieniają się listy wyników wyszukiwania przy zastosowaniu różnych operatorów. Walor edukacyjny tego programu niestety pomniejsza brak bogatszego komentarza do działań, które można wykonać przy pomocy operatorów Boole’owskich – poza linkiem do pracy Boole’a An Investigation of the Laws of Thought. Czytaj dalej

Artur Machlarz ByArtur Machlarz

TextMap – informacje z mediów amerykańskich

TextMap to bardzo interesujące narzędzie do analizy zawartości serwisów informacyjnych – niestety jedynie amerykańskich. System automatycznie przyporządkowuje termin użyty w zapytaniu do odpowiedniej kategorii (osoba, państwo, miasto, firma, tytuł – np. profesor, senator, historia itp., nazwę leku itd.) i wskazuje statystyczne zależności z innymi terminami z ustalonej kategorii oraz z terminami właściwymi dla innych kategorii. Czytaj dalej