Народ, привет всем. Я тут спарсил все координаты KFC, BurgerKing и McDonalds.
У меня задание:
«Загрузить рестораны (разделенные по предприятию) в pandas.
Проанализировать конкурентную среду в Москве, подготовить и представить выводы»
Вот я пытаюсь сообразить что вообще можно в эти Pandas загрузить, если кол-во ресторанов разное
Давайте порассуждаем. Как можно выразить количественную ценность одной точки предприятия общепита с точки зрения владельца сети. Очевидно, это доход за минусом всех расходов для данной точки. Так как компании стандартизированы и логистикой, и поставщиками всё должно быть более-менее одинаково при первом уровне приближение этим можно пренебречь. Доход формируется от людского потока и его характеристик, очевидно, что пропорционально увеличению и изменению характеристик будет и изменяться сервис, количество сотрудников и поставки сырья. Вряд ли в таких компаниях не анализирует кто к ним приходит, какую он жизнь ведет и как передвигается и т.д. Значит остается людской поток.
Кто ходит во все эти точки? Я бы разделил всех на три большие группы. Постоянно, периодически и временно оказавшиеся рядом люди. Первые это жильцы близлежащих домов, второй это студенты, учащиеся и те, кто осуществляют свою деятельность неподалеку и третьи - туристы, коммандировочники. Вряд ли большое количество людей ходят в данные точки общепита целенаправленно игнорируя подобные предложения, находящиеся ближе. Значит можно выяснить количественные метрики потоки во времени в каждой точки для этих трех групп и от них строить дальнейшие рассуждения. Пространственную концентрацию людей легче всего получить из сведений сотовых операторов, но думаю они не сильно детализированы, хотя вариант идеальный, так как есть возможно есть разбивка по времени. Если таковых сведений нет можно построить диаграммы Вороного для каждой сети в отдельности и кумулятивную. Дальше подтянуть с ГИС ЖКХ сведения для Москвы о многоквартирных жилых домах, там по координатам, и количеству квартир и их площади и вхождение в зоны диаграммы Вороного можно узнать сколько жителей приходится на каждую точку.
С учащимися посложнее. Вытаскиваем с OSM или с портала открытых данных Правительства Москвы местоположение объектов и надо узнать еще количество учащихся и аналогично первому случаю посчитать количество людей, приходящихся на каждую точку.
Теоретически первый и второй способ можно упрощенно объединить через расчет по графу дорог с OSM до места транспортной концентрации людей (метро). От каждого дома, школы и ВУЗа построить кратчайшие пути до станции метро и рассчитать сколько людей (х2, если они в день ходят туда-обратно по маршруту) перемещаются в непосредственной близости от точек общепита. Можно заморочится и поиграться с зонами непосредственной видимости по маршруту и буферными зонами от точек общепита.
К третьей группе помимо метро можно добавить туристические места и маршруты. Как учесть концентрацию людей в туристических местах понятия не имею, возможно на портале открытых данных Москвы это всё есть, не ковырялся.
Всё вышеописанное актуально для отдельно стоящих точек общепита и встроенных пристроенных к домам. С точками, расположенными в ТЦ всё сложнее и легче. Надо найти информацию о людском потоке в ТЦ, теоретически рассматривая предложения аренды в каждом ТЦ можно найти эту информацию, можно посчитать самому аналогично вышеописанному случаю для каждой точки общепита, но там входные размышления будут иные. Теоретически это всё должно быть учтено в ходе проведения государственной кадастровой оценки земельных участков под ТЦ, и если сам ОКС торгового центра оценивался по сравнительному подходу, то это всё будет отражено в удельном показатели кадастровой стоимости земельного участка и объекта капитального строительства. Чем выше УПКС, тем круче место и больше поток людей. Данные характеристики можно вытащить с публичной кадастровой карты или львиную доля из перечня ОКСов которые платят имущественный налог от кадастровой стоимости (с портала открытых данных)
Когда всё это будет, можно забацать приступить к регрессионного анализу, выявить уравнение зависимости количественных факторов местоположения и характеристик местоположения, выраженного через рассчитанные людские потоки и любой другой инфы что придет на ум, уровень преступности в районе, транспортная пропускная способность ближайших магистралей, количество торговых площадей и т.д. которые будут рассчитаны на зоны, в