Size: a a a

Python для анализа данных

2021 January 17

AK

Alex K in Python для анализа данных
спсибо большое! ОЧень помогла с ходом мыслей!
источник

AK

Alex K in Python для анализа данных
Будет нужна какая-то помощь, пиши!
источник

МS

Мariia Smirnova in Python для анализа данных
Alex K
там мак на охотном постоянно переполнен)
им же конкурентоспособность важна, то есть в каком ресте больше будет заказов 🙂
думаю, надо от этого идти
источник

МS

Мariia Smirnova in Python для анализа данных
да не за что, удачи)
источник

AK

Alex K in Python для анализа данных
Мariia Smirnova
им же конкурентоспособность важна, то есть в каком ресте больше будет заказов 🙂
думаю, надо от этого идти
мне кстати кажется по хорошему бы рекомендации дать где воткнуть рестик
источник

AK

Alex K in Python для анализа данных
вот это точно не для 2х)
источник

МS

Мariia Smirnova in Python для анализа данных
Alex K
мне кстати кажется по хорошему бы рекомендации дать где воткнуть рестик
для этого сначала надо фичи нагенерить)))
источник

AK

Alex K in Python для анализа данных
теория графов наверно
источник

МS

Мariia Smirnova in Python для анализа данных
Alex K
вот это точно не для 2х)
да)
источник

AK

Alex K in Python для анализа данных
может кто-нить утром ещё проснется и чо-нить посоветует)
источник

AD

Andrew Dakhnovsky in Python для анализа данных
Alex K
Народ, привет всем. Я тут спарсил все координаты KFC, BurgerKing и McDonalds.

У меня задание:
«Загрузить рестораны (разделенные по предприятию) в pandas.
Проанализировать конкурентную среду в Москве, подготовить и представить выводы»

Вот я пытаюсь сообразить что вообще можно в эти Pandas загрузить, если кол-во ресторанов разное
это у тебя учебное задание?
вот эта фраза "Проанализировать конкурентную среду в Москве, подготовить и представить выводы" - она что-то конкретное обозначает?
потому как очень общая фраза - там может имеется в виду маркетинговое исследование и как и что делать - я вот лично без понятия
ну и то что оно будет в пандасе это конечно хорошо, но я бы его прям на карте бы рисовал и та же цветными кружками помечал как-нибудь по какому-нибудь признаку
типа проходняк (а как его узнать?)
или расстояние до метро
ну т.е. визуальные результаты они всегда смотрятся сильно выигрышней таблички в пандасе)))
источник

V

Vadim in Python для анализа данных
Alex K
Народ, привет всем. Я тут спарсил все координаты KFC, BurgerKing и McDonalds.

У меня задание:
«Загрузить рестораны (разделенные по предприятию) в pandas.
Проанализировать конкурентную среду в Москве, подготовить и представить выводы»

Вот я пытаюсь сообразить что вообще можно в эти Pandas загрузить, если кол-во ресторанов разное
Давайте порассуждаем. Как можно выразить количественную ценность одной точки предприятия общепита с точки зрения владельца сети. Очевидно, это доход за минусом всех расходов для данной точки. Так как компании стандартизированы и логистикой, и поставщиками всё должно быть более-менее одинаково при первом уровне приближение этим можно пренебречь. Доход формируется от людского потока и его характеристик, очевидно, что пропорционально увеличению и изменению характеристик будет и изменяться сервис, количество сотрудников и поставки сырья. Вряд ли в таких компаниях не анализирует кто к ним приходит, какую он жизнь ведет и как передвигается и т.д. Значит остается людской поток.

Кто ходит во все эти точки? Я бы разделил всех на три большие группы. Постоянно, периодически и временно оказавшиеся рядом люди. Первые это жильцы близлежащих домов, второй это студенты, учащиеся и те, кто осуществляют свою деятельность неподалеку и третьи - туристы, коммандировочники. Вряд ли большое количество людей ходят в данные точки общепита целенаправленно игнорируя подобные предложения, находящиеся ближе. Значит можно выяснить количественные метрики потоки во времени в каждой точки для этих трех групп и от них строить дальнейшие рассуждения. Пространственную концентрацию людей легче всего получить из сведений сотовых операторов, но думаю они не сильно детализированы, хотя вариант идеальный, так как есть возможно есть разбивка по времени. Если таковых сведений нет можно построить диаграммы Вороного для каждой сети в отдельности и кумулятивную. Дальше подтянуть с ГИС ЖКХ сведения для Москвы о многоквартирных жилых домах, там по координатам, и количеству квартир и их площади и вхождение в зоны диаграммы Вороного можно узнать сколько жителей приходится на каждую точку.

С учащимися посложнее. Вытаскиваем с OSM или с портала открытых данных Правительства Москвы местоположение объектов и надо узнать еще количество учащихся и аналогично первому случаю посчитать количество людей, приходящихся на каждую точку.

Теоретически первый и второй способ можно упрощенно объединить через расчет по графу дорог с OSM до места транспортной концентрации людей (метро). От каждого дома, школы и ВУЗа построить кратчайшие пути до станции метро и рассчитать сколько людей (х2, если они в день ходят туда-обратно по маршруту) перемещаются в непосредственной близости от точек общепита. Можно заморочится и поиграться с зонами непосредственной видимости по маршруту и буферными зонами от точек общепита.

К третьей группе помимо метро можно добавить туристические места и маршруты. Как учесть концентрацию людей в туристических местах понятия не имею, возможно на портале открытых данных Москвы это всё есть, не ковырялся.

Всё вышеописанное актуально для отдельно стоящих точек общепита и встроенных пристроенных к домам. С точками, расположенными в ТЦ всё сложнее и легче. Надо найти информацию о людском потоке в ТЦ, теоретически рассматривая предложения аренды в каждом ТЦ можно найти эту информацию, можно посчитать самому аналогично вышеописанному случаю для каждой точки общепита, но там входные размышления будут иные. Теоретически это всё должно быть учтено в ходе проведения государственной кадастровой оценки земельных участков под ТЦ, и если сам ОКС торгового центра оценивался по сравнительному подходу, то это всё будет отражено в удельном показатели кадастровой стоимости земельного участка и объекта капитального строительства. Чем выше УПКС, тем круче место и больше поток людей. Данные характеристики можно вытащить с публичной кадастровой карты или львиную доля из перечня ОКСов которые платят имущественный налог от кадастровой стоимости (с портала открытых данных)

Когда всё это будет, можно забацать приступить к регрессионного анализу, выявить уравнение зависимости количественных факторов местоположения и характеристик местоположения, выраженного через рассчитанные людские потоки и любой другой инфы что придет на ум, уровень преступности в районе, транспортная пропускная способность ближайших магистралей, количество торговых площадей и т.д. которые будут рассчитаны на зоны, в
источник

V

Vadim in Python для анализа данных
Alex K
Народ, привет всем. Я тут спарсил все координаты KFC, BurgerKing и McDonalds.

У меня задание:
«Загрузить рестораны (разделенные по предприятию) в pandas.
Проанализировать конкурентную среду в Москве, подготовить и представить выводы»

Вот я пытаюсь сообразить что вообще можно в эти Pandas загрузить, если кол-во ресторанов разное
ычисленные по диаграмме Вороного и вывести условную ценность каждой точки.

Далее рассчитать по выявленному регрессионному уравнению сильные и слабые точки. Посчитать их количество по сетям и сделать выводы кто стронг 😊

Это то что пришло на ум сразу. Практически на каждом шаге можно углубляться и усложнять, так и упрощать.  

Рученьками всё можно посчитать в QGIS, там же можно всё и автоматизировать. Дерзайте.
источник

А

Алексей in Python для анализа данных
Alex K
Вакансия python junior
Что то подсказывает, что для такой вакансии либо они слишком много хотят, либо ты накручиваешь дополнительные "а можно ещё..."
Может это задание должно ограничиться визуализацией на карте или каким нибудь расчётом плотности
источник

AK

Alex K in Python для анализа данных
Алексей
Что то подсказывает, что для такой вакансии либо они слишком много хотят, либо ты накручиваешь дополнительные "а можно ещё..."
Может это задание должно ограничиться визуализацией на карте или каким нибудь расчётом плотности
Может и плотности. Видишь нету критериев. Поэтому я накручиваю "а можно ещё"
источник

AK

Alex K in Python для анализа данных
Vadim
Давайте порассуждаем. Как можно выразить количественную ценность одной точки предприятия общепита с точки зрения владельца сети. Очевидно, это доход за минусом всех расходов для данной точки. Так как компании стандартизированы и логистикой, и поставщиками всё должно быть более-менее одинаково при первом уровне приближение этим можно пренебречь. Доход формируется от людского потока и его характеристик, очевидно, что пропорционально увеличению и изменению характеристик будет и изменяться сервис, количество сотрудников и поставки сырья. Вряд ли в таких компаниях не анализирует кто к ним приходит, какую он жизнь ведет и как передвигается и т.д. Значит остается людской поток.

Кто ходит во все эти точки? Я бы разделил всех на три большие группы. Постоянно, периодически и временно оказавшиеся рядом люди. Первые это жильцы близлежащих домов, второй это студенты, учащиеся и те, кто осуществляют свою деятельность неподалеку и третьи - туристы, коммандировочники. Вряд ли большое количество людей ходят в данные точки общепита целенаправленно игнорируя подобные предложения, находящиеся ближе. Значит можно выяснить количественные метрики потоки во времени в каждой точки для этих трех групп и от них строить дальнейшие рассуждения. Пространственную концентрацию людей легче всего получить из сведений сотовых операторов, но думаю они не сильно детализированы, хотя вариант идеальный, так как есть возможно есть разбивка по времени. Если таковых сведений нет можно построить диаграммы Вороного для каждой сети в отдельности и кумулятивную. Дальше подтянуть с ГИС ЖКХ сведения для Москвы о многоквартирных жилых домах, там по координатам, и количеству квартир и их площади и вхождение в зоны диаграммы Вороного можно узнать сколько жителей приходится на каждую точку.

С учащимися посложнее. Вытаскиваем с OSM или с портала открытых данных Правительства Москвы местоположение объектов и надо узнать еще количество учащихся и аналогично первому случаю посчитать количество людей, приходящихся на каждую точку.

Теоретически первый и второй способ можно упрощенно объединить через расчет по графу дорог с OSM до места транспортной концентрации людей (метро). От каждого дома, школы и ВУЗа построить кратчайшие пути до станции метро и рассчитать сколько людей (х2, если они в день ходят туда-обратно по маршруту) перемещаются в непосредственной близости от точек общепита. Можно заморочится и поиграться с зонами непосредственной видимости по маршруту и буферными зонами от точек общепита.

К третьей группе помимо метро можно добавить туристические места и маршруты. Как учесть концентрацию людей в туристических местах понятия не имею, возможно на портале открытых данных Москвы это всё есть, не ковырялся.

Всё вышеописанное актуально для отдельно стоящих точек общепита и встроенных пристроенных к домам. С точками, расположенными в ТЦ всё сложнее и легче. Надо найти информацию о людском потоке в ТЦ, теоретически рассматривая предложения аренды в каждом ТЦ можно найти эту информацию, можно посчитать самому аналогично вышеописанному случаю для каждой точки общепита, но там входные размышления будут иные. Теоретически это всё должно быть учтено в ходе проведения государственной кадастровой оценки земельных участков под ТЦ, и если сам ОКС торгового центра оценивался по сравнительному подходу, то это всё будет отражено в удельном показатели кадастровой стоимости земельного участка и объекта капитального строительства. Чем выше УПКС, тем круче место и больше поток людей. Данные характеристики можно вытащить с публичной кадастровой карты или львиную доля из перечня ОКСов которые платят имущественный налог от кадастровой стоимости (с портала открытых данных)

Когда всё это будет, можно забацать приступить к регрессионного анализу, выявить уравнение зависимости количественных факторов местоположения и характеристик местоположения, выраженного через рассчитанные людские потоки и любой другой инфы что придет на ум, уровень преступности в районе, транспортная пропускная способность ближайших магистралей, количество торговых площадей и т.д. которые будут рассчитаны на зоны, в
Фига тут целое исследование получается. Интересный рассуждения. Спасибо за них. Даже если не смогу что-то реализовать то точно полезно с точки зрения понимания
источник

AK

Alex K in Python для анализа данных
Andrew Dakhnovsky
это у тебя учебное задание?
вот эта фраза "Проанализировать конкурентную среду в Москве, подготовить и представить выводы" - она что-то конкретное обозначает?
потому как очень общая фраза - там может имеется в виду маркетинговое исследование и как и что делать - я вот лично без понятия
ну и то что оно будет в пандасе это конечно хорошо, но я бы его прям на карте бы рисовал и та же цветными кружками помечал как-нибудь по какому-нибудь признаку
типа проходняк (а как его узнать?)
или расстояние до метро
ну т.е. визуальные результаты они всегда смотрятся сильно выигрышней таблички в пандасе)))
Это тестовое. Визуализация на карте будет по geopandas
источник

А

Алексей in Python для анализа данных
Alex K
Может и плотности. Видишь нету критериев. Поэтому я накручиваю "а можно ещё"
Посмотри вакансию и сделай то что там написано (что от тебя ожидают), или повтори то что уже делал ранее (что умеешь). Недавно проходил собес по теме BI, оперативно сделал что хотели проверить и быстро добавил своего (что уже делал ранее). Потом навыдумывал "а можно ещё..." и застрял!!!
В итоге отправил то что сделал (без додумок) и прошёл техническую часть.
источник

AK

Alex K in Python для анализа данных
Алексей
Посмотри вакансию и сделай то что там написано (что от тебя ожидают), или повтори то что уже делал ранее (что умеешь). Недавно проходил собес по теме BI, оперативно сделал что хотели проверить и быстро добавил своего (что уже делал ранее). Потом навыдумывал "а можно ещё..." и застрял!!!
В итоге отправил то что сделал (без додумок) и прошёл техническую часть.
Проанализировать конкурентную среду в Москве, подготовить и представить выводы

геомаркетинговая IT-компания Опыт работы с GeoPandas, Scrapy будет плюсом
источник

AK

Alex K in Python для анализа данных
Вот что у меня есть
источник