Size: a a a

Python для анализа данных

2019 November 01

А

Алексей in Python для анализа данных
ну да, фунций нет еще в этой версии базы данных, она его и не понимает
источник

D

Dmitriy Klimakov in Python для анализа данных
Подскажите, есть ли скрипты для стриминга данных из Google analytics в big query ?
источник

ML

Maria Linda in Python для анализа данных
Коллеги, кому интересно, добавляйтесь в канал https://t.me/python_ru_study, сдесь собираю много полезного для Python девелопера, статьи, книги, ссылки
источник
2019 November 03

RG

Roman Grind in Python для анализа данных
Такой вопрос как хеши преобразовать в векторы?
источник

V

Valera in Python для анализа данных
Ребята, а кто-нибудь парсил я.недвижимость? У меня есть небольшой опыт сбора данных с сайта госзакупок с помощью beautiful soup, но когда я открываю код я.недвижимости, то грустно становится
источник

V

Valera in Python для анализа данных
Может подскажите с чего начать?
источник

V

Valera in Python для анализа данных
В моем случае страничка состояла из нескольких таблиц, с помощью find_all я их перебирал, смотрел как называются столбцы и забирал нужное
источник

MY

Maksim Yasinski in Python для анализа данных
Valera
Ребята, а кто-нибудь парсил я.недвижимость? У меня есть небольшой опыт сбора данных с сайта госзакупок с помощью beautiful soup, но когда я открываю код я.недвижимости, то грустно становится
Обычно на таких сайтах выдача идёт через JavaScript или фрэймворки. Из того что я нашёл проще всего парсить selenium с нажатием на соответствующие кнопки и т.д.
источник

RG

Roman Grind in Python для анализа данных
Maksim Yasinski
Обычно на таких сайтах выдача идёт через JavaScript или фрэймворки. Из того что я нашёл проще всего парсить selenium с нажатием на соответствующие кнопки и т.д.
Он тоомознутый же. Есть чо побыстрее?
источник

MY

Maksim Yasinski in Python для анализа данных
Roman Grind
Он тоомознутый же. Есть чо побыстрее?
А как скрипты быстро отработать? Пишу с телефона, если напомните завтра с компа точнее гляну
источник

P

Parθava in Python для анализа данных
Добрый день. Есть у меня такая категория данных с названиями регионов. Проблема в том, что в ней огромное количество синонимичных значений, таких как "РЕСП. БАШКОРТОСТАН", "БАШКОРТОСТАН", "РЕСПУБЛИКА БАШКОРТОСТАН" и т.д. Можете посоветовать способ, как их можно было бы сгруппировать в более крупные?
источник

P

Parθava in Python для анализа данных
Переслано от Parθava
источник

MY

Maksim Yasinski in Python для анализа данных
Parθava
Добрый день. Есть у меня такая категория данных с названиями регионов. Проблема в том, что в ней огромное количество синонимичных значений, таких как "РЕСП. БАШКОРТОСТАН", "БАШКОРТОСТАН", "РЕСПУБЛИКА БАШКОРТОСТАН" и т.д. Можете посоветовать способ, как их можно было бы сгруппировать в более крупные?
Выбрать паттерн приведения в одно название и потом .unique()
источник

P

Parθava in Python для анализа данных
ну а какой паттерн тут может быть
источник

MY

Maksim Yasinski in Python для анализа данных
Край, область  далее их сокращения последним словом и сокращения реплэйс на полные версии, ремпублика первым словом и тоже реплэйс
источник

P

Parθava in Python для анализа данных
разобрался вроде как
источник

P

Parθava in Python для анализа данных
но
источник

P

Parθava in Python для анализа данных
там не через реплейс надо
источник

P

Parθava in Python для анализа данных
потому что если делать через реплейс, то там будут пробелы
источник

P

Parθava in Python для анализа данных
получается не "РЕСП. ТАТАРСТАН" > "ТАТАРСТАН", а " ТАТАРСТАН"
источник