Size: a a a

Python для анализа данных

2021 September 22

АР

Александр Райков... in Python для анализа данных
Есть
источник

АР

Александр Райков... in Python для анализа данных
К слову, не работает. Я перетащил рабочую директорию питона в пакеты анаконды, возникает баг с numpy (импорт которого необходим для панды)
источник

R

Rustam in Python для анализа данных
Анаконда может подтянуть библиотеки которые стоят уже в питоне, а вот на оборот такое тоже не встречалось)
источник

МК

Максим Коротченков... in Python для анализа данных
Ребят, кто работал с OSM картой?

Мне достался код, не совсем понимаю, что за ссылка на API:

def make_route(lon_start, lat_start, lon_end, lat_end):
   proc = subprocess.Popen(f'curl "http://10.202.153.48:5000/route/v1/driving/{lon_start},{lat_start};{lon_end},{lat_end}?steps=true&geometries=geojson"',
                           shell=True, # оболочка=True
                           stdout=subprocess.PIPE # для дочернего процесса будет создан пайп
                          )
   
   out = proc.stdout.readlines() # считывает и возвращает список строк
   
   return out
источник

H

HK416 140316 in Python для анализа данных
Переслано от HK416 140316
кто сталкивался с этой проблемой можете помочь?
источник

DS

Dmitry Spodarets in Python для анализа данных
Всем привет!
Сегодня вечером вместе с Андреем Латышем  из Provectus на вебинаре "From research to product with Hydrosphere" поговорим про превращение ML исследования в продукт с использованием Hydrosphere. Присоединяйтесь!
https://dataphoenix.info/webinar-the-a-z-of-data-from-research-to-product-with-hydrosphere/
источник
2021 September 23

МК

Максим Коротченков... in Python для анализа данных
Ребят, кто подскажет хорошую статью с примерами по работе с картой OSM? Мне нужно метки поставить на карту (координаты известны)
источник

AD

Alexander Dergilev in Python для анализа данных
Ребята, привет. Появилась задача - открывать документы пдф (не текст, именно - изображение) и проверять их на предмет а) наличия печати (есть нет) б) наличия ИНН (вытаскивать эти данные) . Данные атрибуты могут находится в разных местах в документе. Куда капать? Желательно что нибудь не сильно замороченное и рабочее. Буду благодарен
источник

R

Rustam in Python для анализа данных
Если найдешь решение будь товарищем поделись пожалуйста)
источник

AD

Alexander Dergilev in Python для анализа данных
👍👌
источник

A

Alexander in Python для анализа данных
подпишусь
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Вообще, для использования предобученных моделей хорошо разбираться в computer vision не нужно.
Загнали в нейросеть - получили вектор циферок.  Остается поверх циферок любой хорошо известный вам классификатор внедрить. С задачей определить наличие характерных контуров (синих? ) кружков и прямоугольников от печати наверняка ImageNet и справится.
Ну а у ИНН есть набор цифр с контрольной суммой в конце.  Что-то распознающее текст + регулярное выражение.


План примитивный, но все зависит от того с кем вы конкурируете.
источник

IS

Ilya Shutov in Python для анализа данных
1. ИНН — Finereader или аналоги и дальше поиск по распознанному тексту чего-либо похожего на ИНН с помощью регулярок
2. Печать — используем цветовой канал (HSV), фильтрация по фиолетовому цвету и потом поиск чего-то круглого (OpenCV). Можно и просто по пропорции фиолетовых пикселей — есть/нет
3. Ручная верификация. На автомат плохо полагаться, могут быть фейки

И надо изучить документы, что  и как ожидать, чтобы было проще.
источник

R

Rustam in Python для анализа данных
Вас послушаешь так вообще кажется такая тривиальная задача)
источник

AD

Alexander Dergilev in Python для анализа данных
Наговорить можно чего угодно
источник

IS

Ilya Shutov in Python для анализа данных
1. глаза боятся, а руки делают
2. не надо слушать, надо работать.

просили идею — два человека синхронно независимо дали идентичные ответы.
конечно там будут сложности!!!
но это рабочие моменты и они есть в каждой задаче.

что ныть то?
зарплату за что получаете?

порой здешний чат не перестает поражать глубиной инфантильности.
думаешь, дно.
но нет, есть куда опускаться
источник

AD

Alexander Dergilev in Python для анализа данных
это не камень в огород был
источник

PZ

Pavel Zheltouhov in Python для анализа данных
в Orange за 5 минут можно тестовый прототип накидать такого. Серьезно.
это чтобы просто понять насколько хорошо исходные данные классифицируются по такой схеме.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Только там графика на сервере microsoft обрабатывается через интернет. (обязан предупредить)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
ой, а вот  с ИНН посложнее
источник