Składniki

Microsoft Research opracowuje mapę wyszukiwania niestrukturalnych danych

The Science Behind InterpretML: SHAP

The Science Behind InterpretML: SHAP
Anonim

Microsoft Research Indie opracowały technologię, która pozwoli użytkownikom wyszukiwać mapy nawet w krajach takich jak Indie, gdzie adresy często nie mają ustrukturyzowanego formatu.

Projekt badawczy nazywa się Solidne wyszukiwanie lokalizacji, a prototyp technologii jest już gotowy, powiedział B. Ashok, dyrektor ds. Zaawansowanego rozwoju i prototypowania w Microsoft Research India, w środę. Chociaż został opracowany w Indiach, to technologia ma charakter ogólny i został zaprojektowany do wdrożenia w każdym kraju, który ma niestrukturalne adresy. "

Zamiast szukać reguł w adresie, algorytm wykorzystuje dane geoprzestrzenne, aby określić, która lokalizacja warunki w łańcuchu adresu pasują do tego, powiedział Ashok.

[Dalsze czytanie: Twój nowy komputer potrzebuje tych 15 bezpłatnych, doskonałych programów]

W krajach takich jak Indie, lokalizacja jest często opisywana w adresie przez jego relacje przestrzenne np. w pobliżu lub naprzeciwko punktu orientacyjnego, a nie przez formalną, hierarchiczną strukturę adresu składającą się z numeru ulicy, nazwy ulicy, miasta, stanu i kodu pocztowego.

Bardzo często ta sama lokalizacja może mieć inny adres lub odniesienie do inny punkt orientacyjny, powiedział Ashok. Lokalny listonosz wie, jak dostarczać listy oparte na tych nieustrukturalizowanych adresach, ale takie niestrukturalne dane stanowią wyzwanie dla oprogramowania wykorzystywanego do wyszukiwania map, dodał.

Usługi mapowania komercyjnego, w tym Google, Yahoo i Microsoft, zostały pierwotnie zaprojektowane dla kraje takie jak USA, które mają uporządkowane adresy, ale mogą nie być tak dobre podczas pracy nad niestrukturalnymi adresami, powiedział Ashok.

Laboratorium badawcze w Bangalore jest w trakcie dyskusji na temat włączenia nowego algorytmu do Windows Live Local firmy Microsoft.

Microsoft Research India używa technologii, zwanej przestrzennym skrzyżowaniem, do analizy różnych terminów w ciągu adresu, aby znaleźć lokalizację dla nieustrukturalizowanego adresu, takiego jak "2nd Cross, 10th Main, Sadashivnagar, Bangalore."

Oprogramowanie rozpoczyna się od Terminy takie jak "2nd Cross" i "10th Main", następnie używa informacji o skrzyżowaniu ulic, które 2nd Cross przecina z 10th Main, aby zidentyfikować wszystkie wystąpienia na mapie, gdzie 2. Cross int Ersects z 10th Main, Ashok powiedział. Następny termin, Sadashivnagar, przecina się z informacjami zebranymi na skrzyżowaniach drugiego krzyża i dziesiątej głównej, aby dotrzeć do miejsca, do którego odnosi się adres, dodał.

Oprogramowanie dotrze do lokalizacji niezależnie od kolejności, w jakiej warunki są przedstawione w adresie, a także, gdy ta sama lokalizacja ma wiele aliasów adresów, powiedział Ashok. Może być również używany przez użytkowników w wielu językach. Zapytanie w języku hindi, języku indyjskim, będzie na przykład transliterowane do języka mapy, a wyszukiwanie przeprowadzone w oparciu o te warunki, zgodnie z Ashok.

Warunki w adresie takim jak "blisko", które nie zgodne z danymi na mapie są również odrzucane, powiedział Ashok.