Size: a a a

Python для анализа данных

2020 November 26

KM

Konstantin Mohov in Python для анализа данных
источник

AD

Artemiy Dubovoy in Python для анализа данных
Pavel Zheltouhov
вот сейчас будет больно:
в superset встроили предсказание временных рядов от Facebook.
Наверное, мне должно быть стыдно сейчас, но я не в курсе, и поверхностное гугление не помогло. Поделитесь ссылочкой?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Artemiy Dubovoy
Наверное, мне должно быть стыдно сейчас, но я не в курсе, и поверхностное гугление не помогло. Поделитесь ссылочкой?
ну вот например описание.
https://github.com/apache/incubator-superset/pull/10324
вы можете просто загрузить данные и он предскажет. Как если бы на питоне мучались.

просто это характерный пример.
почти повторяющие по функционалу друг друга продукты.
один из загнивающего энтерпрайза, а второй из молодежного питона.
в второй кажется активнее развивается.
источник

AD

Artemiy Dubovoy in Python для анализа данных
Pavel Zheltouhov
ну вот например описание.
https://github.com/apache/incubator-superset/pull/10324
вы можете просто загрузить данные и он предскажет. Как если бы на питоне мучались.

просто это характерный пример.
почти повторяющие по функционалу друг друга продукты.
один из загнивающего энтерпрайза, а второй из молодежного питона.
в второй кажется активнее развивается.
Спасибо, ознакомлюсь

Это да. Про clojure впервые услышал, когда познакомился с Metabase. Непонятно, как его под себя допиливать
источник

PZ

Pavel Zheltouhov in Python для анализа данных
а в metabase что сделали ? машинки-эмодзи в консоли рисуют
источник

AD

Artemiy Dubovoy in Python для анализа данных
Pavel Zheltouhov
а в metabase что сделали ? машинки-эмодзи в консоли рисуют
Это 0.1% использования Metabase, вы придираетесь)

Самая главная проблема в моём кейсе — разграничение прав. Например, нельзя делать дропдаун фильтры по полям в таблицах, если не давать юзерам права на доступ к источнику (читай: пускать в БД)
источник

AD

Artemiy Dubovoy in Python для анализа данных
Pavel Zheltouhov
а в metabase что сделали ? машинки-эмодзи в консоли рисуют
Плюс в целом модель прав через какие-то неочевидные костыли сделана, часто приходилось делать отдельную группу прав под 1 пользователя
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Artemiy Dubovoy
Плюс в целом модель прав через какие-то неочевидные костыли сделана, часто приходилось делать отдельную группу прав под 1 пользователя
в superset напишут "нам пофиг, демократизируем доступ к данным" и закроют баг.
источник

AD

Artemiy Dubovoy in Python для анализа данных
Pavel Zheltouhov
в superset напишут "нам пофиг, демократизируем доступ к данным" и закроют баг.
Шарить кб в отдел продаж, где непорядочный человек вполне может проработать месяц и уйти к конкурентам — не круто
источник

@

@annykey in Python для анализа данных
Всем привет.
Подскажите начинающему аналитику, плиз)
источник

@

@annykey in Python для анализа данных
Есть 5000 актов вордовских, из них нужно извлечь определенные данные и сложить в табличку ексель. Возможно ли такое?
источник

@

@annykey in Python для анализа данных
Гугл пока только рассказал как читать и редактировать ворд файлы.
источник

АМ

Алексей Макаров... in Python для анализа данных
Если ты студент и отлично разбираешься в Data Science, то Россельхозбанк и партнеры приготовили для тебя две крутые задачи. Приходи на онлайн Data Science-чемпионат AgroCode, предлагай свое решение (у тебя будет 30 попыток) и поборись за первое место в лидерборде. Призовой фонд – 320 тысяч рублей!
Предварительная регистрация – до 18 ноября, прием решений – до 11 декабря.
Узнай больше на сайте https://agro-code.ru/
Генеральный спонсор – Россельхозбанк.
источник

VI

Vlad Isayko in Python для анализа данных
@annykey
Есть 5000 актов вордовских, из них нужно извлечь определенные данные и сложить в табличку ексель. Возможно ли такое?
Считать данные несложно. Вопрос лишь в том что именно нужно извлеч. Потом можно к примеру собрать все в датафрейм пандаса, а потом датафрейм сохранить в excel файл (по мне так самый простой вариант)
источник

@

@annykey in Python для анализа данных
Это я и так понимаю)) Вопрос именно в том, как из каждого файла вытащить данные. По сути это либо набор цифр либо слово.
источник

@

@annykey in Python для анализа данных
для примера. Отсюда нужно взять номер акта, дату, город, сумму и номер терминала. И сложить все в отдельные ячейки, соответственно.
источник

KM

Konstantin Mohov in Python для анализа данных
@annykey
Есть 5000 актов вордовских, из них нужно извлечь определенные данные и сложить в табличку ексель. Возможно ли такое?
ну а в чем проблема? читаешь файлы через python-docx, из каждого параграфа выдираешь слова, регулряками выдираешь то, что нужно, складываешь в словарик, словарик в датафрейм, датафрейм в эксель
источник

KM

Konstantin Mohov in Python для анализа данных
эксель в яйцо, яйцо в утку, утка в шоке
источник

@

@annykey in Python для анализа данных
угу, про docx я уже наковыряла )) т.е. регулярки надо ? ок, уже легче ) спасибо
источник

KM

Konstantin Mohov in Python для анализа данных
да. если это жесткие формы, то окружаешь нужные данные словами типа "к акту (тут регулярку) от (тут регулярка) по терминалу номер (тут регулярка)"
источник