CognitionSearch - kolejna próba…

…realizacji idei wyszukiwania opartego na analizie semantycznej. Autorzy CognitionSearch twierdzą, że dzięki zastosowanej technologii uzyskać można znacząco większą ilość relewantnych wyników niż w jakiejkolwiek innej wyszukiwarce.

CognitionSearch to wyszukiwarka będąca demonstracją możliwości komercyjnego oprogramowania firmy Cognition. W sieci istnieje dopiero od ok. dwóch tygodni i działa w bardzo ograniczonym zakresie, więc trudno w pełni odpowiedzialnie skomentować jakość wyników. Na podstawie dostępnej w tej chwili wersji można coś powiedzieć o wyglądzie tej wyszukiwarki, udostępnianych funkcjach wyszukiwania i mechanizmie jej działania.

W przeciwieństwie do HAKII, która ma być taką wyszukiwarką semantyczną, która na podstawie kontekstu jest w stanie samodzielnie określić tematyczną dziedzinę poszukiwań, CognitionSearch daje użytkownikowi szansę wyboru dziedziny, do której mają być ograniczone poszukiwania: w wersji demonstracyjnej do wyboru mamy “health”, “politics” i “legal”. Wersja ta korzysta z niezbyt wielu źródeł - nie jest eksplorowana cała sieć, lecz parę baz danych, blogów itp. Możliwość ograniczenia tematycznego obszaru wyszukiwania daje jednak faktycznie nadzieję na większy stopień adekwatności wyników do oczekiwań.

Jak wygląda mechanizm wyszukiwania? Wyszukiwanie, tak jak w Hakii, oparte jest na mało subtelnych zasadach analizy semantycznej zapytania:

  • funkcjonalnej klasyfikacji pojedynczych wyrażeń (rzeczownik, czasownik itd.), która jest co najwyżej częściowo zbieżna z możliwymi klasyfikacjami semantycznymi,
  • opisie taksonomicznym: np. ręka jest częścią ciała, palec jest częścią ręki, paznokieć jest częścią palca itd., zwierzę x należy do określonego gatunku, ma cechy a, b, c, d itp.
  • olbrzymiej liście leksykalnych opisów znaczeń terminów, czyli liście możliwych parafraz lub synonimów i złożonych opisów znaczeń terminów
  • mechanizmie pozwalającym na wybranie z listy możliwych znaczeń danego terminu znaczenia najbardziej adekwatnego dla kontekstu, w którym termin wystąpił.

Inaczej niż w Hakii, w CognitionSearch możemy wpływać na jakość wyników i poprawiać wyszukiwarkę. Możemy w szczególności poprawiać ostatni punkt:

CognitionSearch
Na tym obrazku widzimy, że możemy:

  • obniżyć ustaloną przez wyszukiwarkę wartość terminu przez wyłączenie go
  • oraz (tego już za dobrze niestety nie widać…) wybrać inne niż sugerowane przez wyszukiwarkę znaczenie leksykalne terminu z zapytania.

Firma Cognition, która jest twórcą CognitionSearch, informuje, że słownik będący podstawą działania wyszukiwarki oraz oprogramowania komercyjnego, zawiera:

  • 350,000 form podstawowych słów
  • 375,000 pojęć
  • 17,000 słów wieloznacznych
  • 108,000 związków frazeologicznych
  • ponad 4 miliony zdefiniowanych kontekstów znaczeniowych

Cognition uważa, że taki zasób leksykonu pozwala na poradzenie sobie zarówno z problemem zbyt dużej ilości wyników (czyli pojawianiem się choćby różnego rodzaju śmieci), jak i z problemem pomijania wyników istotnych dla zadanego pytania. Przekonać ma nas o tym fakt, że przeciętny absolwent wyższej uczelni używa ok 40 tys. słów (ilu fraz i w ilu kontekstach, nie wiadomo…). W każdym razie ambicją Cognition nie jest na razie opracowanie wyszukiwarki obejmującej zasoby całej sieci, lecz przede wszystkim dwóch dziedzin: prawa i “life sciences”. A przynajmniej dla tych dwóch sprzedawane jest oprogramowanie Cognition.

Artur Machlarz

Dodaj do: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • del.icio.us
  • connotea
  • Google Bookmarks
  • Technorati
  • Wykop

Brak komentarzy

Brak komentarzy.

RSS komentarzy do tego posta. TrackBack URI

Dodaj komentarz

WordPress Themes