Что я узнал и понял об OSM за время участия в проекте.
Posted by LLlypuk82 on 7 July 2016 in Russian (Русский).Сложившаяся парадигма OSM состоит из нескольких принципиальных «моментов»:
-
Та информация, которая кодифицируется (и обусловлена форматом хранения данных), не является чисто карто_графической_ основой, а наполняет геоинформационную базу данных, могущую быть использованной более широко (адресный поиск, маршрутизация и т. п.) или более узко (какой-нибудь подсчёт дорог с покрытием или площади пресноводных водоёмов и т. п.)
-
Вносимая информация не задана изначально на 100%, в том смысле, что нет перечня обозначаемых объектов и сущностей, который бы ограничивал редактора — с одной стороны, а с другой — гарантировал бы их обязательное применение в том или ином виде (визуализация, маршрутизация, поиск и т. д.). Есть перечень «общепризнанных» объектов с их свойствами, тем не менее, не гарантирующий их обязательное «вступление в строй», т. е. применение (об этом — дальше). И есть важные ограничения на внесение данных (см. след. пункт).
-
Действует принцип «не вноси ту информацию, которая не отражает реально существующие объекты или их свойства» («truth on the ground» или «ground truth»). Подкрепляет или поясняет этот принцип ещё один: «верифицируемость данных», т. е. возможность их проверить. Ограничивающей «надстройкой» является запрет на внесение данных из запрещённых источников.
-
Данные распространяются под открытой лицензией.
Теперь чуть подробнее о некоторых аспектах. Второй пункт является отличительной чертой OSM по отношению к подобным сервисам известных брэндов. Особенность заключается в том, что объективно не существует некого отдельно взятого всеобъемлющего «сервиса OSM». Но обычно под ним (ошибочно!) подразумевается сайт openstreetmap.org, который является основоположником и действующей основой всего, что связано с OSM-данными. А поскольку (см. п. 4), то на их основе существует множество сервисов, таких как online-картография (различной направленности, в т. ч. планы внутренних помещений, 3D-визуализация зданий, использование картоосновы, как слоя для наложения на него различной информации типа схем проезда, время работы заведений, online-мониторинга по gps и т. д.), поисковые службы, маршрутизация (пешеходная и по видам транспорта), создание карт для различных навигационных программ и др.
Поскольку очевидно, что ни один информационный ресурс не может включать столь широкий спектр применений «всё-в-одном», то автоматически из этого следует, что «каждый берёт своё» (от базы данных OSM) и на выходе у него «своё блюдо». Указанную «расплывчатость» OSM можно назвать «подводными камнями» (для желающих вносить информацию с целью немедленной положительной отдачи) или «эффектом айсберга» (для желающих получить ту или иную информацию). Но есть и «камни преткновения». Они «разбросаны на путях» участников сообщества OSM и связаны, прежде всего, со способом представления данных в рамках применяемого формата.
Не осмелился назвать это одним из принципов, поскольку он хотя и декларируется, но весьма противоречив: «any tags you like» (любые обозначения, какие пожелаешь). Тут следует оговорить условия:
-
Не изобретай велосипед (когда уже есть принятое обозначение данного объекта или свойства) без надобности или обоснуй его вескими аргументами и документируй;
-
Не обозначай одни объекты или/и свойства тем способом, который уже принято использовать для иного. Общепризнанным способ обозначения становится через процедуру (сомнительной эффективности) внесения и принятия предложений (proposals). Не вдаваясь в тонкости и хитросплетения способов представления информации о различных объектах, лишь констатирую, что по некоторым (в т. ч. весьма важным, таким как адресация, обозначение дорог и их свойств, сфера торговли и услуг, медицина, образование и др.) сферам обозначения до сих пор не достигнуто однозначных договорённостей, либо они не достаточно эффективно позволяют схематично отразить реальность в данных OSM.
Также есть проблемы и с обработкой готовых данных, выгружаемых с серверов, обслуживающих openstreetmap.org.
Ядру «вносящие информацию-обрабатывающие информацию» не хватает положительной обратной связи. Также её не хватает и между самими вносящими. Плохо обстоят дела с продвижением на информационном поле (в поисковых системах, разрозненность и разбросанность документации, её устаревание), а с учётом всего перечисленного (и пропущенного, но имеющего место быть), даже привлечённые участники сталкиваются со слишком большим комком неоднозначностей, противоречий и недопонимания, который не способствует ни количественному, ни, тем более, качественному росту проекта. Тем не менее, он растёт (данными) и развивается (потихоньку) в основном за счёт увлечённых энтузиастов, которых не отвращают никакие трудности, а они готовы с ними справляться по мере возможностей. Есть и крупные «игроки» вроде Mapbox или Mapillary.
Discussion
Comment from BushmanK on 7 July 2016 at 21:19
То, что вы описываете в пункте (2) - фиксированный набор типов и свойств - в традиционных ГИС называется “классификатор”. В OSM классификатор тоже есть, только не в традиционной форме: он свободно расширяемый (any tags you like).
Верифицируемость, на самом деле - не просто возможность проверить данные (то есть посмотреть на них, свериться с чем-то и сказать “да, годится”), а нечто перекликающееся с научным понятием воспроизводимости результата, то есть возможностю того, что независимый маппер, глядя на тот же реальный объект и располагая теми же сведениями о нем (но не зная о существующем обозначении), может обозначить его таким же, либо не противоречащим исходному способом. Такая трактовка критерия верифицируемости позволяет куда эффективнее фильтровать невнятные обозначения.
Comment from freeExec on 8 July 2016 at 08:15
Ждём через пол года заметку, как я превращал данные OSM во что-то полезное.