Size: a a a

Python для анализа данных

2021 August 16

М

Максим in Python для анализа данных
"objective": 'reg:squarederror'
источник

PZ

Pavel Zheltouhov in Python для анализа данных
это общий механизм оценки. можно вместо ожидания ml-гангстеров читать документацию на sklearn, считая что их опыт там обобщен.
источник

А

Анастасия in Python для анализа данных
Ок, тогда не бинарное и да используйте R2 adjusted или AIC или log loss
источник

М

Максим in Python для анализа данных
Ладно, Вы победили
источник

М

Максим in Python для анализа данных
Хорошо, обращу внимание, спасибо)
источник

N

NicVo in Python для анализа данных
Задание: Здравствуйте. У нас две пары 2D-лидаров от двух разных производителей. Они собирают данные в следующем виде:
(Файлы  RPliader, YDLidar)
Лидары подключены к Распбери. Нужно обраатывать данные с каждой пары, собирать воедино и выводить данные от каждой пары в вграфическом виде, где показываются точки — все то, что попадает в зону работы лидаров. Важно отсекать то, что находится за пределами заданных прямоугольников.
(рисунок 1)
На рисунке зеленым и оранжевым показана пара лидаров, которая сканирует вертикальную плоскость, а фиолетовым и голубым пара, которая сканирует горизонтальную плоскость. Все, что находится за пределами прямоугольников в вывод не попадает.
То есть нужно: а. объединять данные с каждого из лидаров в паре, б. исключать то, что не входит в заданный прямоугольник, в. собирать так,ч тобы можно было представить в графическом виде. Все должно обрабатываться и выводиться в режиме реального времени.
Мы уже умеем снимать данные с каждого лидара и выводить их от каждого по-отдельности:
( рисунок 2)
Нам нужны два скрипта на питоне. Для каждого из видов лидаров.
А это скрипты (внизу поселение 2), которые умеют обрабатывать данные с одного лидара каждого типа. Они не умеют обрабатывать данны с двух и более лидаров одного типа и они не умеют отсекать то, что находится за пределами заданных прямоугольников.
Цена: 15к
источник

IS

Ilya Shutov in Python для анализа данных
А тут можно так писать? Обычно такое пишут с разрешения админов.
источник

N

NicVo in Python для анализа данных
В лс Пиши если интересно
источник

В

Вадим in Python для анализа данных
#работа #удаленка #геймдев
Всем привет!
Компания: Azur Games  
Вакансия:  Python Developer;
Зарплатная вилка: от 180К до  300К;
СТЭК: Python, Django, Airflow, React, js, Clickhouse;
Формат: удаленка/офис/гибридный;

Ищем Python Developer для создания внутренних систем аналитики, а также для работы с ETL процессами игровых данных.😊
Если ТЫ любишь игры или мечтаешь попасть в геймдев, то это ТВОЯ уникальная возможность🎮
Подробнее о вакансии можно почитать тут (по ссылке вся инфа + посмотри на условия);
По всем вопросам пишите мне в личку  - @SimpleRecruiter

Подробнее о наших последних успехах:
Выход на рынок консолей
Azur Games топ 5 в мире по загрузкам
источник

ДЦ

Дмитрий Цепко... in Python для анализа данных
Добрый день,
пытаюсь открыть на маке док.

выдает ошибку:

OSError: Could not find a suitable TLS CA certificate bundle, invalid path: /usr/local/share/ca-certificates/Yandex/YandexInternalRootCA.crt


не могу найти решения
источник

h

helby in Python для анализа данных
Код прикрепите
источник

SD

Sofia D in Python для анализа данных
Коллеги, привет

не подскажете, как посчитать доверительный интервал для вероятностей в sklearn

probabilities = model.predict_proba(X) <- определяем вероятности

А можно ли для них вытащить se? Или сразу доверительный интервал
источник

I

Igor in Python для анализа данных
Нет такого в принципе (если только не используешь байесовский подход). Можешь обучить на подвыборках (бутстреп) и построить распределение.
источник

SD

Sofia D in Python для анализа данных
Спасибо!
источник

SD

Sofia D in Python для анализа данных
Я еще такую штуку нашла https://newbedev.com/confidence-interval-of-probability-prediction-from-logistic-regression-statsmodels - попробую реализовать
источник

SD

Sofia D in Python для анализа данных
Через бутстреп хорошая идея
источник

I

Igor in Python для анализа данных
Байесом лучше)
источник

SD

Sofia D in Python для анализа данных
Спасибо!
источник

ДЦ

Дмитрий Цепко... in Python для анализа данных
def get_clickhouse_data(q):
   url = 'https://{host}:8443/?database={db}&query={query}'.format(
       host='rc1a-lit1p7ya7uwlsi61.mdb.yandexcloud.net',
       db='default',
       query = q
   )
   auth = {
       'X-ClickHouse-User': 'login',
       'X-ClickHouse-Key': 'parol'
   }

   res = requests.get(
       url,
       headers=auth
       ,verify='/usr/local/share/ca-certificates/Yandex/YandexInternalRootCA.crt'
   )
   if res.status_code == 200:
       return res.text
   else:
       raise ValueError(res.text)
#    res.raise_for_status()
#    return res.text

def get_clickhouse_df(q):
   data = get_clickhouse_data(q)    
   df = pd.read_csv(io.StringIO(data), sep = '\t')
   return df

q = '''SELECT count(*) from default.visits_all'''
get_clickhouse_df(q)
источник

VM

Valerii Mamontov in Python для анализа данных
Он не может открыть файл с корневым сертификатом - YandexInternalRootCA.crt
Проверь путь, по которому он лежит, и права на файл.
источник