Принципиально новый подход к пространственной индексации объектов на земной поверхности, который повысит ее производительность в 5-6 раз, предложили ученые МИИГАиК. По их мнению, новый подход найдет применение в системах экологического мониторинга, городского управления, логистики и других пространственных моделях любого масштаба и назначения. Об этом РИА Новости сообщили в пресс-службе вуза.
Индексация — это краеугольный камень всех современных баз данных. Именно благодаря ей возможно из миллионов и миллиардов записей найти необходимые практически моментально. Простейшим, знакомым всем индексом является алфавитный указатель в книге, сообщил доцент кафедры информационно-измерительных систем Московского университета геодезии и картографии (МИИГАиК) Олег Гвоздев.
"Пространственные индексы, в свою очередь, позволяют быстро искать пространственные объекты, имея координаты в пространстве. Найти ближайшую станцию метро или ресторан. Направить обращение в обслуживающую конкретный адрес диспетчерскую скорой помощи или пожарной. Распределить нагрузку на сотрудников курьерской службы и пункты самовывоза. Сформировать отчет, отражающий распределение событий по районам города и решить другие повседневные задачи", — рассказал Гвоздев.
Олег Гвоздев отметил, что обычные методы пространственной индексации позволяют найти объекты, близкие к нужной области, но каждый из них нужно проверить на точное совпадение требованиям запроса.
“Наш метод позволяет сразу получить готовый результат, не обращаясь к данным этих объектов. Более того — он позволяет устранить повторные проверки, для случаев, когда, например, несколько объектов имеют общие точки или границы. Это существенно сокращает объем вычислений и дает 5-6-кратный прирост производительности, по сравнению с доминирующими на рынке универсальными решениями (PostgreSQL+PostGIS), и до 30 процентов — по сравнению со специализированными высокопроизводительными методами на базе сеточных индексов”, — пояснил он.
По мнению авторов, предлагаемый метод будет особенно полезен в системах типа “умный город” или “цифровой двойник”, куда данные поступают непрерывным потоком, а количество запросов достигает нескольких десятков тысяч в секунду, и уже в этом десятилетии может достичь уровня миллионов в секунду.
Другое потенциальное направление применения разработки — “наука о данных” (Data Science) и анализ больших данных (Big Data Analytics), которые лежат в основе современных методов выработки рациональных управленческих решений в коммерческих организациях и общественных институтах.