Android

Firmy oferują usługi umożliwiające chrupanie danych surowych Gov't

Bitcoin LECI Do Banków Centralnych!! Przebijamy $14,000! Cena Bitcoina Kryptowaluty Altcoiny

Bitcoin LECI Do Banków Centralnych!! Przebijamy $14,000! Cena Bitcoina Kryptowaluty Altcoiny
Anonim

A co, jeśli prezydent USA wezwałby do publikacji szeregu danych rządowych, ale trudno jest określić surowe liczby?

A garstka firm i projekt rozwoju open source próbują upewnić się, że tak się nie dzieje, ponieważ prezydent USA Barack Obama domaga się otwartego rządu w pierwszych dniach jego administracji.

Modele biznesowe są różne, ale niektóre firmy używają surowe dane wydane na Data.gov i gdzie indziej w celu zademonstrowania mocy ich usług polegających na publikowaniu danych i pomijaniu numerów.

Publikacja wszystkich tych danych jest dobrym posunięciem, ale wiele z nich jest w surowym formacie, czyniąc trudno jest go przedstawić w sposób, który ludzie mogą zrozumieć, powiedział Kevin Merritt, dyrektor generalny i założyciel Socrata, dwuletniej firmy skupionej na pomaganiu agencjom rządowym i innym użytkownikom danych w reorganizacji i ponownej publikacji ich w sieci.

Socrata nazywa swoją ser vice reorganizacji danych na łatwe do odczytania, interaktywne wykresy i wykresy "odkrywanie danych społecznościowych".

"Dane są cenne, ale dane społeczne są również cenne," powiedział Merritt, były dyrektor wykonawczy firmy Microsoft. "Jedną rzeczą jest umieszczenie danych w Internecie, ale jest to kolejna rzecz, w której można zdobyć jakąś informację zwrotną."

Tylko w Data.gov w środę rano było prawie 400 nieprzetworzonych zbiorów danych.

baza danych osób zgłaszanych według krajów i regionów, w latach 1998-2008 udzielała azylu w USA; w 2005 r. opublikowano dane na temat toksycznych chemikaliów w Guam; istnieje baza danych tornad, dużych gradu i szkodliwych raportów wiatrowych z lat 1950-2006; istnieją dane na temat geochemii próbek wody w USA; i jest baza danych hut miedzi na całym świecie.

Istnieją również dane na temat wniosków patentowych, wypadków w miejscu pracy, federalnych wydatków na IT i migracji ptaków. Istnieje jeszcze 109 000 zbiorów danych geograficznych.

Vivek Kundra, federalny dyrektor ds. Informatycznych, został zapytany na niedawnym forum Federalnej Komisji Łączności w USA o filozofii administracji Obamy dotyczącej uwalniania danych. "Nie wiemy, które pliki danych będą prowadziły do ​​lepszej analizy" - powiedział. "Staramy się udostępnić jak najwięcej danych, w wyniku czego odkrywamy, że dzieje się tam wiele innowacji."

Po opublikowaniu danych wielu mieszkańców USA dostrzegają trendy, których pracownicy rządowi jeszcze nie widzieli - dodał. Na przykład, w oparciu o dane na temat tego, które loty lotnicze są zwykle opóźnione, fliers zaczynają unikać lotów z niektórych linii lotniczych o określonych porach dnia, powiedział.

Socrata kieruje swoje produkty do agencji rządowych, a także dziennikarzy, naukowców i inni ludzie, którzy chcą zrozumieć surowe dane. Oferuje on garść produktów, w tym bezpłatną podstawową ofertę, która umożliwia każdemu hostowanie danych na Socrata.com i hostowanej, markowej stronie danych dla dużych organizacji. Socrata może pomóc agencjom rządowym obniżyć koszty przechowywania i dostarczania danych, powiedział Merritt.

Socrata przekształca dane z różnych formatów i pozwala użytkownikom udostępniać dane na Twitterze, Digg, Facebooku i innych stronach internetowych. Firma działa zgodnie z filozofią, że dane mają być udostępniane, powiedział Merritt.

"Dane stają się cenniejsze, ponieważ propagują od źródła", powiedział. "Istnieje teoria, im dalej od źródła, tym więcej osób korzysta z niej, a zatem dane muszą być z natury bardziej wartościowe."

Inne firmy, w tym iCharts i Visual i / o, wykorzystują dane rządowe, które są nadal publikowane, aby pokazać moc swoich produktów do analizy wizualnej lub publikowania wykresów.

Ponadto Sunlight Labs, założone przez Sunlight Foundation, rozwija oprogramowanie typu open-source, które wykorzystuje danych rządowych i zachęca innych programistów do tego samego. W tym roku Sunlight Labs zorganizowało dwa konkursy promujące tworzenie aplikacji w oparciu o dane rządowe, a dostało ponad 90 zgłoszeń.

Jednym z powodów, dla których Sunlight Foundation założyła Sunlight Labs, było wsparcie reporterów śledczych tradycyjnych i obywatelskich, powiedział Clay Johnson, dyrektor Sunlight Labs.

"Kiedy administracja Obamy zaczyna wydawać więcej danych, jest za mało palcami na klawiaturach w Sunlight Labs, żeby sobie z tym poradzić "- powiedział Johnson. "Czy administracja Obamy udało się udostępnić więcej danych rządowych? Rozmawiasz z facetem z najbardziej niesłabnącym pragnieniem tego, który nigdy nie powie, że odniósł sukces."

ICharts nie koncentruje się wyłącznie na rządach danych, ale pomaga wydawcy witryn internetowych prezentować informacje w przeszukiwalnych, łatwych do strawienia formatach, powiedział Seymour Duncker, założyciel i dyrektor generalny iChart. "Istnieje ogromna liczba otwartych danych, na przykład produkowanych przez rząd i przez uniwersytety" - powiedział. Istnieje możliwość udostępnienia tych danych wszystkim, dodał.

Nacisk Obamy na przejrzystość rządu daje iCharts wiele nowych nieprzetworzonych danych do pracy, powiedział. "Widzimy, że dostarczanie nieprzetworzonych danych nie jest wystarczające" - dodał Duncker. "Musisz podać kontekst. Widzę tu nowy łańcuch wartości."

Na przykład jedna z głównych list przebojów iChart na pierwszej stronie śledzi amerykański produkt krajowy brutto od 1948 do 2009. W tym roku, jak należy się spodziewać w czasie recesji PKB znacznie spadł.

Visual i / o nazywa swoje produkty oprogramowaniem do analizy wizualnej. Użytkownicy mogą tworzyć interaktywne wykresy i wykresy oraz dzielić się nimi z innymi za pomocą narzędzi opartych na sieci Web Visual i / o, powiedziała Angela Shen-Hsieh, prezes i dyrektor generalny Visual i / o. Użytkownicy wykresów mogą, za pomocą kilku kliknięć, tworzyć różne widoki na podstawie różnych parametrów.

"Kiedy patrzysz na zestawy danych Data.gov, staną się one interesujące, gdy połączymy je razem," Shen - powiedział Hsieh. Dane są bardziej przydatne, ponieważ użytkownicy nakładają zestawy danych, takie jak choroby chroniczne z informacjami geograficznymi, dodała.

Dwóch analityków IT stwierdziło, że dostrzega rosnącą tendencję firm takich jak iCharts i Visual i / o, wykorzystujących dane rządowe do demonstrowania swoich produktów i usługi. Ale zarówno Shawn McCarthy, rządowy analityk z IDC, jak i David Curle, główny analityk w Outsell, zakwestionowali, czy firma mogłaby zbudować model biznesowy całkowicie w oparciu o ponowne wykorzystanie danych rządowych.

Wydaje się, że ograniczone są możliwości sprzedaży poza sprzedażą Przekazane dane są przekazywane agencjom rządowym, a dane są dostępne dla każdego, więc konkurencja byłaby świetna, powiedział Curle.

Wiele grup interesu publicznego tworzy już wykresy i wykresy z danymi rządowymi, dodał McCarthy.

"Odkryłem, że większość danych, które widziałem, wymaga dalszej manipulacji, aby uczynić go naprawdę wartościowym" - powiedział. "Każdy, kto chwyta dane i coś z nimi robi, najprawdopodobniej dodaje do tego wartość."