Size: a a a

Python для анализа данных

2021 October 13

SS

Sergey Svetlov in Python для анализа данных
Надо устанавливать
источник

A

Artyom in Python для анализа данных
а дисперсию имеет сысл разделить на среднее значение, чтобы  показать отклонение в %?
источник

В

Владислав in Python для анализа данных
Всем привет) подскажите пожалуйста, скачиваю себе файл csv, на ноут, при открытии через read_csv - ошибка токенизации, убираю заголовки и открывается такая дичь.  Можете плз подсказать как это лечить?
источник

K

Kseniia in Python для анализа данных
А что сам Карпов говорит, как это открыть?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Так надо и данные тоже скачать и путь подменить на локальный.
Может  Карпов и не предполагал такое использование.
источник

В

Владислав in Python для анализа данных
Блин, я вообще случайно файл загрузил туда, перепутал немного со своим локальным. Это уже личная задача не связанная с обучением. Неловко получилось(
источник

NE

Nikita Eliseev in Python для анализа данных
Есть массив numpy, нужно найти номера столбцов, в которых находится мода каждой строки. Как это сделать?
источник

NE

Nikita Eliseev in Python для анализа данных
через np.where работает для маленьких матриц, для больших находит дополнительные повторения, из-за чего потом прога крашится
источник

M

Mikhail in Python для анализа данных
Ну считаете моду, проверяете на равенство и argmax
источник

NE

Nikita Eliseev in Python для анализа данных
вот проверка на равенство сбоит. грубя говоря вместо матрицы (60,1) выдаёт матрицу (71, 1). Видимо, при большом количестве данных что-то совпадает
источник

NE

Nikita Eliseev in Python для анализа данных
mode, _ = sp.stats.mode(smth, axis = 1)
i, j = np.where(mode[0] == smth)
источник

NE

Nikita Eliseev in Python для анализа данных
Здесь smth - матрица, полученная после умножения весов на расстояния
источник

M

Mikhail in Python для анализа данных
источник

NE

Nikita Eliseev in Python для анализа данных
Спасибо большое, заработало)
источник

M

Mikhail in Python для анализа данных
увидел что нужны все номера столбцов
источник

M

Mikhail in Python для анализа данных
где мода — там номер, где нет моды — там nan
источник

NE

Nikita Eliseev in Python для анализа данных
Я скорее так имел ввиду. Все номера столбцов в том смысле, что для каждой строки мне нужен был индекс, где находится мода
источник

M

Mikhail in Python для анализа данных
ну если неважно что индексов несколько (нужен любой), тогда да
источник

NE

Nikita Eliseev in Python для анализа данных
По факту у меня knn classifier, поэтому одного любого должно хватить
источник
2021 October 14

А

Алексей in Python для анализа данных
приветы. У меня есть необходимость делать кастомные отчеты для пользователей. Как это должно выглядеть:
- юзер заполняет форму с данными по которому будет фильтроваться sql запрос
- юзер жмет на кнопочку, заполненные данные передаются в sql скрипт в качестве параметров
- скрипт отрабатывает и возвращает результат в виде таблички и/или файла

Может кто-то сталкивался с подобным?
источник