Size: a a a

AI / Big Data / Machine Learning

2020 January 26

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Но насколько я знаю есть бонусы и 13-я зарплата
источник

SS

Sergey Shushkov in AI / Big Data / Machine Learning
25% годовых мне на моем круге озвучивали )
источник

A

Alexandr in AI / Big Data / Machine Learning
Cookie Thief
я вот этого вообще не понимаю кстати, кто реально идет на вакансию не зная вилки даже примерно?
На хедхантере том же большинство вакансий без вилок
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Alexandr
На хедхантере том же большинство вакансий без вилок
И это не характеризует работодателей с хорошей стороны.
источник

CT

Cookie Thief in AI / Big Data / Machine Learning
И хендхантер, как хорошую площадку)
источник
2020 January 27

x

xxxvid in AI / Big Data / Machine Learning
Как трактовать следующий вопрос : "некоторые параметры(колонки) датасета имеют разную размерность в зависимости, допустим, от вида модели телефона (самсунг или эппл), необходимо привести параметры (колонки) в одинаковую размерность"? То есть необходимо масштабировать признаки или что-то другое?
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Скорее привести их к нормальному виду, обобщить характеристику признака(ов)
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Мсье знакомо понятие нормализация?
источник

x

xxxvid in AI / Big Data / Machine Learning
Да
источник

x

xxxvid in AI / Big Data / Machine Learning
Я понял о чем речь
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Ну вот это по всей видимости где-то из той области :)
источник

x

xxxvid in AI / Big Data / Machine Learning
То есть масштабировать признаки?
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Хотя контекст может отличаться. Но да, в каком-то смысле масштабировать, главное чтобы признаки одинаково измерялись в различающихся параметрах, насколько я понял
источник

x

xxxvid in AI / Big Data / Machine Learning
Потому что я тоже не понял данного вопроса, как может отличаться размер колонок в зависимости от какого-то фактора, если датасет это матрица n×m и она в принципе правильная
источник

M

Marat in AI / Big Data / Machine Learning
xxxvid
Как трактовать следующий вопрос : "некоторые параметры(колонки) датасета имеют разную размерность в зависимости, допустим, от вида модели телефона (самсунг или эппл), необходимо привести параметры (колонки) в одинаковую размерность"? То есть необходимо масштабировать признаки или что-то другое?
рискну предположить, что привести к общей размерности
не знаю, что там у телефонов, но например, у нас есть дата фрейм с инфой о недвижимости из трёх колонок: страна, где недвижка, адрес, и площадь
в зависимости от страны у нас площадь будет измеряться в разных величинах: например футы для США и метры для России
соответственно, нужно привести площади к одной из этих размерностией
источник

КБ

Константин Белов in AI / Big Data / Machine Learning
ребята, а анаконду можно запустить внутри jupyter notebook, если ты на сервере ?
источник

N

Nikolay in AI / Big Data / Machine Learning
ребят, подскажите, пожалуйста: какой лучше хранилище использовать для хранения big data? формат hdf5, весят >1гб, возможность работать с большим количеством таких файлов (~1000 файлов)
источник

S

Stepan in AI / Big Data / Machine Learning
Добрый день. Подскажите зеленому участнику сообщества)
Подгружаю данные, вижу что данные имеют 5 млн. строк и 400 столбцов. С чего начать разведывательный анализ этих данных , как подступится ко всем этим признакам?
источник

M

Mash-Nyash in AI / Big Data / Machine Learning
В зависимости от задачи и алгоритма обучения, можно заранее выкинуть столбцы, не релевантные для конкретной классификации/проблемы. Можно запилить регрессию и посмотреть на коэффициенты переменных, плюс correlation matrix plot.
источник

M

Mash-Nyash in AI / Big Data / Machine Learning
Либо уменьшить количество через pca
источник