Analiza dokumentów w LUMIFI

Artur Machlarz ByArtur Machlarz

Analiza dokumentów w LUMIFI

Wśród internetowych aplikacji semantycznych LUMIFI wyróżnia się możliwością zastosowania do dokumentów innych niż strony internetowe. Niestety nie należy jednak do szczególnie udanych pod innymi względami – zarówno skuteczność zintegrowanej z Lumifi wyszukiwarki internetowej jak i jakość podziałów kategorialnych różni się niestety na niekorzyść od innych semantycznych narzędzi do analizy tekstów i semantycznych wyszukiwarek porządkujących wyniki w klastry.

Z Lumifi możemy analizować dokumenty z trzech źródeł: po pierwsze, możemy przeszukiwać internet (wyszukiwarka w Lumifi to Gigablast) i Lumifi identyfikuje zawartość wyszukanych witryn internetowych; po drugie, możemy wpisać adres strony internetowej, która ma być analizowana; po trzecie, możemy wskazać dowolny plik (np. pdf), wgrać go do Lumifi i poczekać na analizę zawartości pliku. Oczywiście możemy dzięki temu łatwiej porównywać zawartość treściową większej ilości plików.

Lumifi automatycznie rozpoznaje i wskazuje kategorie związane z zapytaniem w wyszukiwarce. Ograniczyć listę wyników możemy wskazując jedną z kategorii, albo wpisując w odpowiednim oknie własną kategorię. Tak samo Lumifi działa w odniesieniu do plików zewnętrznych i wskazanych konkretnych witryn internetowych: analiza zawartości pliku bądź witryny, to po prostu rozpoznanie kategorii tematycznych pojawiających się w pliku lub witrynie www. Kliknięcie na jedną z kategorii, albo wprowadzenie innej niż automatycznie rozpoznana, powoduje ograniczenie listy wyników przeszukiwania dokumentu lub podstron witryny.

Lumifi

Lumifi

Prezentacja wyników analizy zawartości strony internetowej i wgranego pliku. (Kliknij na obrazek, żeby zobaczyć powiększenie)

Lista wyników – jak to zazwyczaj bywa w tego rodzaju aplikacjach – jest prezentowana w taki sposób, żeby użytkownik miał dostarczone „na tacy” treści związane z daną kategorią tematyczną a pochodzące z listy wyników wyszukiwania, dostarczonego pliku albo wskazanej witryny internetowej. Poszczególne punkty z listy możemy zapisać w podręcznym notatniku i opatrzyć je notatkami. Notatnik może być współdzielony przez większą ilość użytkowników.

Lumifi

Dodawanie notatki do jednej z pozycji notatnika. (Kliknij na obrazek, żeby zobaczyć powiększenie)

Aplikacja Lumifi jest dostępna także w wersji nieinternetowej, tzn. może być używana do zarządzania zawartością naszego twardego dysku. Niestety aplikacja ta jest dostępna tylko dla systemu Windows i Mac. Użytkownicy Linuxa mogą z Lumifi korzystać wyłącznie w sieci.

Lumifi może być w przyszłości całkiem użytecznym narzędziem do porównywania zawartości różnych plików i stron internetowych. Póki co, trudno być w pełni usatysfakcjonowanym z efektów „czytania” plików przez Lumifi. Lumifi, o czym także należy pamiętać przy testowaniu, nie czyta plików w innych językach niż angielski, co też jest pewnym ograniczeniem. Brakuje też czegoś po stronie wyników lektury plików: zintegrowanego narzędzia do generowania nowych plików przy użyciu treści wydobytych ze wskazanych dokumentów. W tej chwili jedyne co możemy osiągnąć, to lista wyników z własnymi notatkami, które co najwyżej możemy sobie swobodnie porządkować.

AM.

O autorze

Artur Machlarz

Artur Machlarz administrator

Od 2005 pracuje jako infobroker, zajmuje się wyszukiwaniem i opracowywaniem informacji. Specjalizuje się w tworzeniu unikalnych baz danych. Jako pracownik naukowy zajmuje się modelami przetwarzania informacji w systemach rozproszonych. Lubi się wspinać i grać na kontrabasie.

Odpowiedz

Time limit is exhausted. Please reload the CAPTCHA.