Składniki

Witaj w Web 3.0: Wyszukiwania semantyczne

Каким будет Web 3.0 — Сергей Садов

Каким будет Web 3.0 — Сергей Садов
Anonim

Wszechobecny tryb słów kluczowych techniki wyszukiwania w Internecie niedługo zostanie przejęty przez nową odmianę technologii wyszukiwania semantycznego, według analityków z firmy badawczej Ovum.

Chociaż wyszukiwanie słów kluczowych pozostaje najpopularniejszą metodą, zazwyczaj nie jest ona dokładna, czasami użytkownicy uzyskują do 30 000 trafień w wyszukiwaniu, a następnie muszą przeglądać listę luźno pokrewnych słów kluczowych, aby znaleźć odpowiednie dokumenty.

"To miejsce, w którym pojawia się nowy rodzaj tak zwanych technologii semantycznych. algorytmy rankingowe, takie jak Google PageRank do przewidywania trafności, wyszukiwania semantycznego zamieniają się w znaczenie w języku w celu uzyskania bardzo trafnych wyników wyszukiwania ", wynika z raportu opublikowanego przez analityków firmy Ovum: Mike'a Davisa i Madana Sheiny.

Godne uwagi semanti Dostawcy sieci wyróżnieni przez analityków to: Expert System, Powerset, Yedda, Trovix i Hakia. Według autorów świadomość wyszukiwania semantycznego wzrosła, gdy Microsoft wybrał dwie firmy zajmujące się wyszukiwaniem semantycznym Powerset i Zoomix.

W przypadku systemu Expert jego aplikacja o nazwie Cogito została zaprojektowana zgodnie z zasadami ludzkiego rozumienia, aby umożliwić treść być rozumiane w taki sposób, w jaki autor tego chciał. Jest to coś, co jest ignorowane przez wyszukiwanie słów kluczowych.

"Wyszukiwane przez Google słowo" jaguar "zawiera treści dotyczące zwierząt i samochodu. Wyszukiwanie semantyczne będzie wyglądać nie tylko przy słowie kluczowym, ale także w innych słowach takich jak" dżungla ". "lub" salon ", aby oddzielić te dwa znaczenia", powiedzieli autorzy.

Głębsza analiza

Oprócz wyszukiwania semantycznego istnieją inne formy, w tym heurystyka i ontologia, lingwistyka i eksploracja tekstów oraz statystyki. Jednak system Expert twierdzi, że podejścia te są niewystarczające, odnosząc się tylko do morfologicznych i gramatycznych aspektów analizy.

Inne wyszukiwarki często uderzają w ceglaną ścianę, jeśli chodzi o głęboką analizę. Na przykład, gdy heurystycznie sterowana wyszukiwarka widzi dwa przymiotniki w zdaniu, zwykle je zmywa i ocenia zdanie jako neutralne, ponieważ nie ma pojęcia, gdzie wskazują dwa oddzielne przymiotniki.

W porównaniu, wygląda na semantyczne wyszukiwanie w obu zdaniach - jak słowa w zdaniu odnoszą się do siebie - i analiza semantyczna - zrozumienie kontekstu słów kluczowych.

Gdy termin jest niejednoznaczny, co oznacza, że ​​może mieć wiele znaczeń, na przykład kora, potrzebna jest analiza semantyczna innymi słowami, które otaczają go, aby nadać mu prawdziwe znaczenie i kontekst.

Baza danych leksykalnych

Inżynierowie z Expert Systems mówią, że Cogito może zrobić więcej, ponieważ ma sieć semantyczną - leksykalną bazę danych która zapewnia reprezentację wiedzy definicji słów i ich związków. Przelał słownik Webstera do bazy danych w pamięci - zawierał 350 000 słów i 2,8 miliona relacji.

"Sieć semantyczna systemu eksperckiego również koncentruje się na wspólnych słowach. Różni się ona od większości podejść ontologicznych, które dotyczą pakowania znaczenia i kontekstu wokół wyspecjalizowanych treści, takie jak terminy naukowe, i pomijać wspólne słowa, które składają się w 90 procentach z całej treści "- powiedzieli autorzy Ovum.

Jednak wyszukiwanie semantyczne jest wciąż podziurawione" dużą ilością teoretycznych hype, ale mało prawdziwą substancją lub dowodem, że działa lepiej niż obecna technologia wyszukiwania.

"Sieci semantyczne są trudne do zbudowania i nie wszystkie są równe. Jest mało prawdopodobne, aby technologie semantyczne były w stanie zapewnić 100% dokładności w analizie i wynikach. Co więcej, wciąż istnieją znaki zapytania dotyczące potencjalnie lepkich problemów z wydajnością w przypadku semantycznych wyszukiwań, które pochłaniają więcej cykli przetwarzania. "