Телеграмм чат группы bigdata_ru страница 1776

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AI / Big Data / Machine Learning

4292 membersпожаловаться на группу

2019 December 27

ПП

Проксимов Прксимович in AI / Big Data / Machine Learning

Илья

Эм, это общий подход, питон, математика, sql, и классы-генераторы перекрывают значительную часть моей работы дс. Межсерверное взаимодействие очень пригодилось для микросерверной архитектуры при выходе на продакшн

А я то думал там девопсы мутят

источник

19:44пожаловаться #1

И

Илья in AI / Big Data / Machine Learning

У нас с этим сложнее, поэтому после прототипирования и исследований сразу продумывать по варианту реализации нужно, так то я и с докером работаю =)

источник

19:46пожаловаться #2

2019 December 28

R

Roman in AI / Big Data / Machine Learning

По работе много публикуют в сообществе ods.ai в слаке. Это вообще маст хев место для датасатанистов

источник

00:23пожаловаться #3

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning

#правила
Здесь действует одно правило:
правило адекватного, профессионального общения, релевантного теме нашей группы.

Полезные ресурсы:
▫️Большая подборка материалов по AI & ML
▫️Список Демидовой Кати: статьи и примеры по AI и ML
▫️Книги из официального списка рекомендаций ШАДа
▫️Книги по AI и ML
▫️Список каналов и групп для программистов

Пожалуйста, не задавайте мета-вопросов в чате: https://nometa.xyz/

Вакансии здесь: @datasciencejobs

HackMD - Collaborative Markdown Knowledge Base

источник

01:50пожаловаться #4

2019 December 29

КБ

Константин Белов in AI / Big Data / Machine Learning

ребят, что делать, если разбираешь пример из книги https://github.com/jakevdp/PythonDataScienceHandbook
и там нужно просто установить пакеты, но
miniconda пишет, что:
PackagesNotFoundError: The following packages are not available from current channels

Я боюсь, что если я найду альтернатинвные каналы и скачаю какие-то другие версии этих пакетов, то потом когда буду запускать примеры из книги, они сломаются и работать не будут и мне придется исправлять много ошибок..(

Что делать в этом случае ?

jakevdp/PythonDataScienceHandbook

Python Data Science Handbook: full text in Jupyter Notebooks - jakevdp/PythonDataScienceHandbook

источник

00:53пожаловаться #5

U

UWO in AI / Big Data / Machine Learning

Все нормально думают будет с альтернативными пакетами

источник

01:09пожаловаться #6

U

UWO in AI / Big Data / Machine Learning

Если что пофиксишь сам - опыт как никак)

источник

01:10пожаловаться #7

КБ

Константин Белов in AI / Big Data / Machine Learning

Ok

источник

08:53пожаловаться #8

КБ

Константин Белов in AI / Big Data / Machine Learning

Спасибо

источник

08:53пожаловаться #9

AP

Andrey Parasich in AI / Big Data / Machine Learning

Где вы видели реальное использование PCA?

источник

22:32пожаловаться #10

V

Violet in AI / Big Data / Machine Learning

В гусенице

источник

22:50пожаловаться #11

КБ

Константин Белов in AI / Big Data / Machine Learning

Andrey Parasich

Где вы видели реальное использование PCA?

Когда фильтрация данных

источник

23:09пожаловаться #12

КБ

Константин Белов in AI / Big Data / Machine Learning

источник

23:10пожаловаться #13

2019 December 30

GP

Grigory Pomadchin in AI / Big Data / Machine Learning

Andrey Parasich

Где вы видели реальное использование PCA?

например https://www.asprs.org/wp-content/uploads/pers/1987journal/dec/1987_dec_1649-1658.pdf (это просто в довесок комментам выше)

источник

07:09пожаловаться #14

D

DaySandBox in AI / Big Data / Machine Learning

Message from E Y O B 火炎焱燚 deleted. Reason: new user and external link (?)

источник

07:38пожаловаться #15

R

Roman in AI / Big Data / Machine Learning

Константин Белов

Че за книжка? Рашка?

источник

08:50пожаловаться #16

AG

Aleksandr Garmash in AI / Big Data / Machine Learning

Че за книжка? Рашка?

гуглится же легко
https://books.google.ru/books?id=t4Q_DwAAQBAJ&pg=PA400&lpg=PA400&dq=%D0%A1%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%D1%8D%D1%82%D0%BE+%D0%B1%D1%8B%D1%81%D1%82%D1%80%D0%B5%D0%B5+%D0%B2%D1%81%D0%B5%D0%B3%D0%BE+%D0%BC%D0%BE%D0%B6%D0%BD%D0%BE,+%D0%B2%D1%81%D1%82%D0%B0%D0%B2%D0%B8%D0%B2+%D1%80%D0%B5%D0%B7%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%82%D1%8B+%D0%B2+%D0%B8%D1%81%D1%85%D0%BE%D0%B4%D0%BD%D1%8B%D0%B9+%D0%BE%D0%B1%D1%8A%D0%B5%D0%BA%D1%82+DataFrame&source=bl&ots=KqlMdTz_jg&sig=ACfU3U2gFBO-iszm5J6TguQFHOVd-qM6_w&hl=en&sa=X&ved=2ahUKEwjZ2qfrq93mAhVSwqYKHZZYDKgQ6AEwAHoECAoQAQ#v=onepage&q=%D0%A1%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C%20%D1%8D%D1%82%D0%BE%20%D0%B1%D1%8B%D1%81%D1%82%D1%80%D0%B5%D0%B5%20%D0%B2%D1%81%D0%B5%D0%B3%D0%BE%20%D0%BC%D0%BE%D0%B6%D0%BD%D0%BE%2C%20%D0%B2%D1%81%D1%82%D0%B0%D0%B2%D0%B8%D0%B2%20%D1%80%D0%B5%D0%B7%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%82%D1%8B%20%D0%B2%20%D0%B8%D1%81%D1%85%D0%BE%D0%B4%D0%BD%D1%8B%D0%B9%20%D0%BE%D0%B1%D1%8A%D0%B5%D0%BA%D1%82%20DataFrame&f=false

Python для сложных задач: наука о данных и машинное обучение

Книга «Python Data Science Handbook» - это подробное руководство по самым разным вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки. Читатели, уже имеющие опыт программирования и желающие эффективно использовать Python в сфере Data Science, найдут в этой книге ответы на всевозможные вопросы, например: 1) как мне считать этот формат данных в мой скрипт? 2) Как преобразовать, очистить эти данные и манипулировать ими? 3) Как визуализировать данные такого типа? Как при помощи этих данных разобраться в ситуации, получить ответы на вопросы, построить статистические модели или реализовать машинное обучение?

источник

15:11пожаловаться #17

2019 December 31

A

Alexander in AI / Big Data / Machine Learning

Ребят, у меня здесь NLP задача и я был бы очень благодарен если бы подсказал в каком направлении двигаться!

Есть значит у меня телефонные разговоры операторов с абонентами (речь уже преобразована в текст , и уже произведена классификация того что говорит абонент, и то что говорит оператор). Задача выявить чем абонент разочарован, чтобы при последующим звонке того же абонента, оператор выдел на экране в чём разочарование состояло.

Сейчас все реализовано следующим образом: с помощью regular expressions ведётся поиск отрицательных слов, типа "разочарован", "зол", и т.д. Далее от каждого такого слова отчитывается десять слов в право и десять в лево (пунктуации в тексте нету, поэтому нельзя просто выбрать интересуемое предложение). Получаем кусок текста который потенциально несет negative sentiment. Если в одном разговоре таких слов много, то будет создано много кусков текста. Далее используется Vader из NLTK для скоринга каждого такого куска текста. Выбирается наиболее негативный кусок и он и показывается оператору, когда этот же абонент звонит в следующий раз.

Алгоритм не идеальный по многим причинам. Основная:

Vader приписывает значительный отрицательный скор, обрывкам теста, которые по сути являются набором бессвязных слов. Понятно что Vader не особо в этом виноват, так как такое качество исходного текста. К слову, я не могу повлиять на способ преобразования звука в текст :(

источник

08:05пожаловаться #18

A

Alexander in AI / Big Data / Machine Learning

Какие есть идеи на сегодняшний день:
1) Попробовать другие pre-trained модели (какие порекомендуете?).
2) Попробовать отследить где начинается предложение с негативным словом и где оно заканчивается (есть ли разработанные модели для этого?).
3) Модель которая бы говорила что-то вроде "этот кусок текста мусор и его оценивать не надо, его выкидываем".
4) Topic modeling. То есть все негативные куски текста классифицировать по топикам.
5) Выкинуть этап с regular expressions.
6) Сделать тестовые данные для модели, а не использовать pre-trained модель

источник

08:06пожаловаться #19

A

Alexander in AI / Big Data / Machine Learning

Если честно, то мне кажется 1) не получится реализовать адекватно.
Так как мусора в кусках текста на столько много, то реализовать 2) тоже будет проблематично.
3) - не решение проблемы на 100% и опять же вопрос как реализовывать.
4) - не знаю как реализовывать, но наверное это лучшее что можно было бы предложить. Оператор будет видеть не какой-то неструктурированный набор текста, а осмысленное словосочетание ("дорогие услуги", "неудобный сервис", и т.д.).
5) У меня сомнения на счёт этого. Regular expressions находят хотя бы негативные слова из тонны мусора, без этого мне кажется любой последующий алгоритм будет плохо работать. То что успел понять точно - выкидывание regular expressions ведёт к значительному замедлению расчётов.
6) Думаю это не повредит и например способ 4) не будет без этого работать. На это уйдут месяцы, и хорошо бы знать, что они были потрачены не зря и есть общая идея как улучшить результаты.

В общем, спасибо что дочитали до конца и я открыт к любым вашим идеям.

источник

08:08пожаловаться #20