Size: a a a

OpenStreetMap RU

2020 September 21

ПЖ

Павел Жирнов... in OpenStreetMap RU
fr1
если она сжимает файл, то ждать когда она распакует все 70Гб, чтобы прочитать последнюю строчку - это ужас. Если он сжимает только кластер, то там не будет такой эффективности
ну хранить данные в текстовом неиндексированном файле когда тебе нужно доступ к последней строчке как бессмыссленно.
источник

f

fr1 in OpenStreetMap RU
Павел Жирнов
ну хранить данные в текстовом неиндексированном файле когда тебе нужно доступ к последней строчке как бессмыссленно.
доступ нужен к произвольной позиции в файле
источник

AS

Artem Svetlov in OpenStreetMap RU
Есть ли стандартная схема тегирования, что бы задать дату актуальности для одного тега?
источник

f

fr1 in OpenStreetMap RU
смотри population:data=2010
источник

AS

Artem Svetlov in OpenStreetMap RU
Хочу загнать интервалы автобусных маршрутов в Москве, и показать на карте только маршруты с интервалом меньше 15 минут, а то у нас случайно устроили 1992 год и 2/3 маршрутов стали с 1 машиной на линии
источник

f

fr1 in OpenStreetMap RU
интервалы движения в ОСМ - ничто, по сравнению с онлайн трекером в "реальном времени" в яндексе
источник

П

П3тр0виЧъ in OpenStreetMap RU
fr1
смотри population:data=2010
date
источник

KK

Keks Keksov in OpenStreetMap RU
Pavel Gavrilov
Т.е. есть смысл для хранения дампа использовать файловую систему с компрессией?
Нет, особого смысла нет. Речь идёт о часах работы компьютера. Но для серверов, которые раздают планету, выигрыш, на мой взгляд, существенный. Было 96 стало 71G, я бы сказал, что это 25% экономия трафика
источник

PG

Pavel Gavrilov in OpenStreetMap RU
fr1
если она сжимает файл, то ждать когда она распакует все 70Гб, чтобы прочитать последнюю строчку - это ужас. Если он сжимает только кластер, то там не будет такой эффективности
Что за ерунда? Там жмутся только сектора. Во всяком случае, во времена оны так было.
источник

f

fr1 in OpenStreetMap RU
Keks Keksov
Нет, особого смысла нет. Речь идёт о часах работы компьютера. Но для серверов, которые раздают планету, выигрыш, на мой взгляд, существенный. Было 96 стало 71G, я бы сказал, что это 25% экономия трафика
а время сжатия в 2 раза дольше
источник

PG

Pavel Gavrilov in OpenStreetMap RU
Artem Svetlov
Хочу загнать интервалы автобусных маршрутов в Москве, и показать на карте только маршруты с интервалом меньше 15 минут, а то у нас случайно устроили 1992 год и 2/3 маршрутов стали с 1 машиной на линии
Лично с секундомером замеришь интервалы всех 300+ маршрутов?

Проект интересный, но тебе придется провести на улице с секундомером следующие пару лет жизни.
источник

f

fr1 in OpenStreetMap RU
Pavel Gavrilov
Что за ерунда? Там жмутся только сектора. Во всяком случае, во времена оны так было.
ну в дефолтном секторе 4кб, сжатие будет не шибко большим
источник

PG

Pavel Gavrilov in OpenStreetMap RU
fr1
ну в дефолтном секторе 4кб, сжатие будет не шибко большим
Это уже от реализации зависит. Но читать все 70гб ради пары байт точно никто не будет.
источник

f

fr1 in OpenStreetMap RU
Pavel Gavrilov
Это уже от реализации зависит. Но читать все 70гб ради пары байт точно никто не будет.
причем тут реализация, повторяемость данных в 70Гб и в 4кб очевидно очееень разная
источник

AS

Artem Svetlov in OpenStreetMap RU
fr1
интервалы движения в ОСМ - ничто, по сравнению с онлайн трекером в "реальном времени" в яндексе
Как я из трекера Яндекса карту отрендрю?
источник

f

fr1 in OpenStreetMap RU
никак, она теперь не нужна, есть яндекс.карты :)
источник

PG

Pavel Gavrilov in OpenStreetMap RU
fr1
причем тут реализация, повторяемость данных в 70Гб и в 4кб очевидно очееень разная
Ну понятно, что плотность упаковки от длины словаря зависит и от кучи других характеристик. Но если данные настолько рыхлые, сектора по несколько килобайт размером тоже неплохо пожмутся.
источник

ПЖ

Павел Жирнов... in OpenStreetMap RU
Keks Keksov
Нет, особого смысла нет. Речь идёт о часах работы компьютера. Но для серверов, которые раздают планету, выигрыш, на мой взгляд, существенный. Было 96 стало 71G, я бы сказал, что это 25% экономия трафика
еще больший выигрыш в работе дает использование p2p-раздач :) но это надо делать и пропихивать сквозь медленных на подъем потребителей.
источник

PG

Pavel Gavrilov in OpenStreetMap RU
Жалко, что все это не распараллелить на несколько компов в одной локалке. С общим хранилищем и отдельными обработчиками с общим управлением.
источник

ПЖ

Павел Жирнов... in OpenStreetMap RU
Pavel Gavrilov
Что за ерунда? Там жмутся только сектора. Во всяком случае, во времена оны так было.
нет. не сектора. в случае непрерывного архива надо считывать всё с самого начала.
в случае кусочно-непрерывного с начала кусочка.
а сжатие однородного текста практически пропорционально размеру кусочка. поэтому их выбирают большими
источник