Команда двух сотрудников Google и исследователя из Рейнско-Вестфальского технического университета Ахена в Германии соединила алгоритм, который может проанализировать изображение и оценить местоположение, в котором это было взято с очень высокой степенью точности.

Чтобы развивать PlaNet (это - название их проекта), исследователи начали, разделив земной шар на 26 000 плиток сетки с более высокой концентрацией плиток в городах, где больше фотографий обычно делается, и с меньшим количеством плиток в диких областях как океаны, леса, пустыни или Арктика.

Исследователи обучили PlaNet с 125 миллионами изображений

Исследователи тогда приняли 91 миллион изображений Flickr, которые содержали данные о геолокации и подали их в PlaNet для единственной цели обучения алгоритм, чтобы отличить тонкие подсказки, уникальные для каждой плитки сетки.

После того, как исследователи обучили PlaNet AI, они тогда взяли еще 34 миллиона изображений и проверили систему, чтобы видеть, насколько точный алгоритм был, и сделайте тонкие изменения, важный шаг в улучшении точности PlaNet.

Во время заключительного этапа их исследования ученые взяли еще 2,3 миллиона изображений, но раздели их геолокацию данные EXIF прежде, чем подать их в PlaNet.

Конечный результат? PlaNet смог точно поместить каждую фотографию в свою надлежащую плитку сетки с точностью до 3,6% для изображений уличного уровня и 10,1% для картин городского уровня. На уровне страны точность PlaNet выросла до 28,4%, и на сдержанном уровне, точность была на уровне 48,0%.

Все это, используя 377 МБ RAM, в отличие от подобных инструментов геолокализации, которые жадно пьют весь TBs памяти.

PlaNet побеждает людей в игре геолокации изображения

Но исследователи взяли свое исследование один шаг вперед, чтобы видеть, как алгоритм жил против людей. Для этого команда Google создала игру GeoGuessr, где людей попросили предположить, где изображение Google Street View было взято, и затем поместите булавку в карту.

В то время как общий ход мыслей - то, что человеческий мозг всегда превосходит нейронные сети из-за своей способности обработки значительно большего количества точек ввода, алгоритму PlaNet удалось вычеркнуть нас в сражении с 50 раундами, победив от 28 до 22.

Исследователи говорят, что средняя ошибка локализации PlaNet составляла 1 131,7 км, в то время как средняя человеческая ошибка локализации составляла 2 320,75 км, более чем удвойте стоимость PlaNet.

Для большего количества технических деталей проверьте PlaNet - фото Геолокация со Сверточной научно-исследовательской работой Нейронных сетей.