Size: a a a

Python для анализа данных

2021 January 22

PZ

Pavel Zheltouhov in Python для анализа данных
есть куча книжек в т ч на русском.
источник

МS

Мariia Smirnova in Python для анализа данных
Егор Овчинников
И еще... Я вот совсем новичок в этом деле, мне интересно и важно ваше мнение....если после валидации вы получаете неудоволетворительные результаты качества модели... Что вы делаете? Опишите первые 3 шага.
А ты регрессию или классификацию делаешь?
источник

ЕО

Егор Овчинников... in Python для анализа данных
Pavel Zheltouhov
ухты, оказывается не все так просто как видео на ютубе с заранее подходящим датасетом. кто бы мог подумать!
Епт. Что к чему?! Есть человеческий опыт! Если бы я хотел нагуглить, то это бы и сделал. Здесь вопрос личного опыта. И да я понимаю, что на него влияет много факторов и бла, бла, бла. Суть вопроса максимально проста и понятна. Но спасибо за ссылку😂
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
Епт. Что к чему?! Есть человеческий опыт! Если бы я хотел нагуглить, то это бы и сделал. Здесь вопрос личного опыта. И да я понимаю, что на него влияет много факторов и бла, бла, бла. Суть вопроса максимально проста и понятна. Но спасибо за ссылку😂
еще могу заранее дать ответ на следующих 10 твоих вопросов : "это зависит от разных факторов"
источник

ЕО

Егор Овчинников... in Python для анализа данных
Мariia Smirnova
А ты регрессию или классификацию делаешь?
Классификация
источник

ЕО

Егор Овчинников... in Python для анализа данных
Pavel Zheltouhov
еще могу заранее дать ответ на следующих 10 твоих вопросов : "это зависит от разных факторов"
Молодец👍🏻
источник

МS

Мariia Smirnova in Python для анализа данных
Егор Овчинников
Классификация
А на трейне метрики хорошие?
источник

МS

Мariia Smirnova in Python для анализа данных
Или тоже плохие?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
Молодец👍🏻
это был обучающий пример предиктивной аналитики
источник

ИК

Игорь Кудрешов... in Python для анализа данных
Егор Овчинников
Епт. Что к чему?! Есть человеческий опыт! Если бы я хотел нагуглить, то это бы и сделал. Здесь вопрос личного опыта. И да я понимаю, что на него влияет много факторов и бла, бла, бла. Суть вопроса максимально проста и понятна. Но спасибо за ссылку😂
вообще не понимаю людей) не умеют пользоваться накопленным опытом) так бы уже давным давно многие вещи могли бы систематезировать и автоматизировать
источник

ЕО

Егор Овчинников... in Python для анализа данных
Егор Овчинников
И еще... Я вот совсем новичок в этом деле, мне интересно и важно ваше мнение....если после валидации вы получаете неудоволетворительные результаты качества модели... Что вы делаете? Опишите первые 3 шага.
Понимаю, что это саарказм, но именнл поэтому и написал, что "новичек". Мне вот интересно, те люди, которые пестрят "острыми" ответами на глупые вопросы(я этого не отрицаю) никогда "глупых" вопросов не задавали?...
источник

ЕО

Егор Овчинников... in Python для анализа данных
*Сарказм
источник

ИК

Игорь Кудрешов... in Python для анализа данных
кто знает питон, объясните мне почему в нем нет вшитой функции бинарного поиска?
источник

A

Aleksey in Python для анализа данных
Игорь Кудрешов
кто знает питон, объясните мне почему в нем нет вшитой функции бинарного поиска?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
Понимаю, что это саарказм, но именнл поэтому и написал, что "новичек". Мне вот интересно, те люди, которые пестрят "острыми" ответами на глупые вопросы(я этого не отрицаю) никогда "глупых" вопросов не задавали?...
Задавали. Лет до 6. А потом научились читать .
Кстати, рекомендую тогда уж Энциклопедический словарь юного техника, Издательство: М.: Педагогика
Переплет: твердый; 512 страниц; 1980 г.
Формат: увеличенный

мне помогло понять где взять ответы на банальные всем известные вопросы.
источник

ЕО

Егор Овчинников... in Python для анализа данных
Pavel Zheltouhov
Задавали. Лет до 6. А потом научились читать .
Кстати, рекомендую тогда уж Энциклопедический словарь юного техника, Издательство: М.: Педагогика
Переплет: твердый; 512 страниц; 1980 г.
Формат: увеличенный

мне помогло понять где взять ответы на банальные всем известные вопросы.
источник

VM

Valerii Mamontov in Python для анализа данных
Игорь Кудрешов
кто знает питон, объясните мне почему в нем нет вшитой функции бинарного поиска?
Здравствуйте!
Точно не уверен, но думаю, что "бинарный поиск" встроен по умолчанию.
Например, пользователь получил список/словарь из миллиона элементов.
Просмотреть весь список вручную невозможно. Миллион элементов.
Но ему нужно проверить, есть ли в этом списке/словаре интересующее его слово/число.

import random

x_list = random.sample(range(21000000), 1000000)

number = 7634576

if number in x_list:
    print("number has found, his index is", x_list.index(number))
else:
    print("sorry, number is not found")

В этом случае Python выполнит поиск числа мгновенно, даже по списку из миллиона элементов.
Внутри словаря, как говорят "под капотом", лежит/вшит "бинарный поиск".
Таким же образом работает поиск буквы в очень длинной строке.
Игорь, опишите свою проблему/задачу. Может всё дело не в бинарном поиске.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
Не, вообще я тут подумал:
Во многих статьях и книгах (и тем более ютубе) пропущен этап методологии. Нет ответа на вопрос "модель неудачна и что дальше?" . Нет обзора процесса. Как будто само собой разумеется, что это общеизвестно.

таким образом, можно выделить две-три путевых книги с академически исчерпывающим подходом и упоминающих CRISP-DM
Келлехер "Наука о данных"
Дэвид Шпигельхалтер "Искусство статистики"
(и еще может Скиена, "Наука о данных", просто потому что он преподает и упражнения в конце глав написал)
источник

A

Aleksey in Python для анализа данных
Valerii Mamontov
Здравствуйте!
Точно не уверен, но думаю, что "бинарный поиск" встроен по умолчанию.
Например, пользователь получил список/словарь из миллиона элементов.
Просмотреть весь список вручную невозможно. Миллион элементов.
Но ему нужно проверить, есть ли в этом списке/словаре интересующее его слово/число.

import random

x_list = random.sample(range(21000000), 1000000)

number = 7634576

if number in x_list:
    print("number has found, his index is", x_list.index(number))
else:
    print("sorry, number is not found")

В этом случае Python выполнит поиск числа мгновенно, даже по списку из миллиона элементов.
Внутри словаря, как говорят "под капотом", лежит/вшит "бинарный поиск".
Таким же образом работает поиск буквы в очень длинной строке.
Игорь, опишите свою проблему/задачу. Может всё дело не в бинарном поиске.
1) В примере при семплировании утрачивается свойство упорядоченности => бинарный поиск не может быть использован
2) В питоновском листе никак не отслеживается признак упорядоченности => без этого признака остаётся только линейный поиск
источник

JF

Jack Finch in Python для анализа данных
Jack Finch
Добрый день, есть фактический ретеншн когорты пользователей, подскажите пожалуйста как смоделировать новую кривую ретеншена при изменение ретеншена определенного дня .Например ретеншн 7ого дня будет 50%

[https://prnt.sc/xd3dwu](https://prnt.sc/xd3dwu)
up
источник