Jak działa Hakia?

Wszyscy, którzy słyszeli o idei wyszukiwania semantycznego i przodującej póki co w tej dziedzinie Hakii (przodującej przynajmniej marketingowo…), mają od niedawna okazję zapoznać się nieco bliżej z zasadami działania tej wyszukiwarki. Autorzy Hakii udostępnili bowiem trochę informacji z działu Hakia R&D na stronie HAKIA LAB.
Ze strony Hakia Lab możemy dowiedzieć się nieco więcej o zasadzie analizy semantycznej wyrażeń w zapytaniach, dowiemy się też nieco więcej o algorytmie ustalania rankingu stron względem ich zawartości treściowej i o systemie QDEX służącym analizie semantycznej stron internetowych. Dowiemy się także, że w polu zainteresowań Hakia R&D jest aktualnie rozwijanie systemów dialogowego porozumiewania się z użytkownikami.

Poza kilkoma wstępnymi (i nadal dość ogólnikowymi) zdaniami dotyczącymi projektu ontologicznej semantyki (czyli metody semantycznej analizy wypowiedzi, która została zastosowana w Hakii), możemy także zobaczyć ilustrację działania tej metody. Ilustracja ta bez dużo bardziej pełnych, niż dostępne, objaśnień jest jednak chyba mało zrozumiała.

hakia lab
Tak wygląda “działanie” Hakii w podczas analizy znaczeniowej wyrażenia złożonego z paru słów.
Autorzy odsyłają czytelnika do strony www.ontologicalsemantics.com, ale można tam znaleźć jedynie napis “Coming Soon!”… Nadal zatem podstawowym źródłem informacji o ontologicznej semantyce pozostają książki i artykuły Viktora Raskina i Siergieja Nierenburga oraz prace poświęcone aplikacji tej teorii w różnych projektach związanych z maszynowym przetwarzaniem języka naturalnego. Jednak pierwszy rzut oka na ilustrację analizy przykładowego wyrażenia sugeruje, że mamy do czynienia z mało subtelną analizą semantyczną: opartą na przyporządkowaniu terminu do którejś z klasycznych części mowy i wskazaniu możliwych znaczeń terminów prostych danego wyrażenia a potem na ich rozkładzie na semy - podstawowe jednostki znaczeniowe (jak sądzę, określone właśnie w języku skonstruowanej na ten użytek “ontologii”). Ten rodzaj analizy nie uwzględniałby tego, co jest podstawą sukcesu Google Translate: w języku naturalnym, naturalną jednostką decydującą o znaczeniu wypowiedzi złożonej (choćby z kilku słów), jest całość danej wypowiedzi i to od niej powinno się zaczynać analizę semantyczną. Jeśli zaś zaczniemy analizę od terminów składowych, nie damy rady zrekonstruować znaczenia pełnej wypowiedzi (wyjątkiem byłyby wypowiedzi formułowane w językach z bardzo ściśle określoną składnią i ścisłymi definicjami używanych terminów - na przykład matematyka?). To mogłoby być jednym z wyjaśnień mało satysfakcjonującego działania tej wyszukiwarki.Oczywiście zupełnie inną kwestią jest to, czy rzeczywiście potrzebujemy wyszukiwarki, której możemy zadawać pytania w języku naturalnym, zamiast wpisać parę terminów w wyszukiwarkę tradycyjną…

Artur Machlarz

Dodaj do: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • del.icio.us
  • connotea
  • Google Bookmarks
  • Technorati
  • Wykop

Brak komentarzy

Brak komentarzy.

RSS komentarzy do tego posta. TrackBack URI

Dodaj komentarz

WordPress Themes