Android

Google: Vi har gjort ett genombrott i bildsökningen

Flygplan Trick Shots | Dude Perfect

Flygplan Trick Shots | Dude Perfect
Anonim

Människor kan utmärka sig vid mönsterigenkänning, men datorer är inte så smarta att identifiera bilder. Våra hjärnor kan omedelbart identifiera bilder av kända landmärken som Frihetsgudinnan eller Kinesiska muren, men datorer är vanligtvis clueless utan textkoder som ett fuskblad.

Detta kan dock ändras om ett Google-forskningsprojekt i "dator vision" pannar ut. Sökgiganten Måndag presenterade ett dokument om erkännande av landmärke vid konferensen Computer vision and Pattern Recognition (CVPR) i Miami. Den nya tekniken tillåter datorer att snabbt I.D. bilder av mer än 50 000 världsarkitektur med 80 procent noggrannhet, säger Google.

Google är snabbt påpekat att dess mönsterigenkänningsteknik är ett forskningsprojekt och inte en ny tjänst. Det är meningsfullt, som ett sökverktyg som stämmer bara 8 av 10 försök är inte redo för prime time. Konceptet är ändå ganska coolt och kan visa sig att vara en välsignelse för resenärer om Google någonsin kan öka noggrannheten. Möjligheten att snäppa ett foto av ett oidentifierat landmärke och få din smartphone eller Net-enabled kamera identifiera den omedelbart skulle vara populär, tror jag. Naturligtvis finns det också potential för vetenskapliga och konsumenttillämpningar som ingen tänkt på än.

Så hur fungerar det? Jay Yagnik, Googles chef för datasynsforskning, förklarar i ett blogginlägg. Det första steget är att använda 40 miljoner GPS-taggade bilder från två Google-tjänster, Picasa och Panoramio och webbsidor för webbsidor på nätet för att kompilera en lista med landmärken. "Sedan hittade vi kandidatbilder för varje landmärke med hjälp av dessa källor och Google Image Search, som vi sedan" beskärde "med hjälp av effektiv bildmatchning och oövervakad clusteringsteknik, skriver han.

Det sista steget var att utveckla ett indexeringssystem för snabbt bildigenkänning. Men trots projektets skicklighet är noggrann bildsökning knepig. Som bilden nedan indikerar kan orelaterade landmärken delas med liknande arkitektoniska funktioner. Dessutom kan införandet av en enorm banner eller flagga leda till en falsk match.

Förhoppningsvis kommer Googles forskningsprojekt att förbättra bildsökningen, som idag är för beroende av märkning. Nästa steg skulle vara att hitta ett sätt att identifiera det otaliga antalet icke-landmärke bilder, men den uppgiften verkar oändligt mer utmanande.