Size: a a a

Machine learning

2020 December 22

V

Vladislav-kun in Machine learning
Svetlana Astafyeva
Спасибо!
Посмотрю!
Если что он очень долгий (по сравнению с Карповскими), у меня где-то дней 30-35 ушло
источник

NO

Nikolai Orlov in Machine learning
Друзья, помогите, плиз, уже несколько дней сижу с первым заданием #C3W4. Где нужно убрать слова, встречающиеся больше 4000 раз. Прошерстил форум, все должно работать. Но не работает.
Код вот такой.

находим индексы с частотой >4000
extra_elements=[]
for key in dictionary2.dfs.keys():
 if dictionary2.dfs[key]>4000:
   extra_elements.append(key)

удаляем элементы
for i in extra_elements:
 dictionary2.filter_tokens(bad_ids=[dictionary2.token2id[dictionary2[i]]])
dict_size_after=len(dictionary2)

создаем новый корпус и считаем размеры старого и нового
corpus2 = [dictionary2.doc2bow(text) for text in texts]
def corpus_size(corpus):
 n=0
 for i in range(len(corpus)):
   n=n+len(corpus[i])
 return n

Ответ получается 6714 6702 428249 404521. Система не принимает.
источник

SA

Svetlana Astafyeva in Machine learning
Vladislav-kun
Если что он очень долгий (по сравнению с Карповскими), у меня где-то дней 30-35 ушло
Ох...
А как рассказывают?
Нудно или интересно?
И вообще, откладывается что-то?
источник

i

igor in Machine learning
Nikolai Orlov
Друзья, помогите, плиз, уже несколько дней сижу с первым заданием #C3W4. Где нужно убрать слова, встречающиеся больше 4000 раз. Прошерстил форум, все должно работать. Но не работает.
Код вот такой.

находим индексы с частотой >4000
extra_elements=[]
for key in dictionary2.dfs.keys():
 if dictionary2.dfs[key]>4000:
   extra_elements.append(key)

удаляем элементы
for i in extra_elements:
 dictionary2.filter_tokens(bad_ids=[dictionary2.token2id[dictionary2[i]]])
dict_size_after=len(dictionary2)

создаем новый корпус и считаем размеры старого и нового
corpus2 = [dictionary2.doc2bow(text) for text in texts]
def corpus_size(corpus):
 n=0
 for i in range(len(corpus)):
   n=n+len(corpus[i])
 return n

Ответ получается 6714 6702 428249 404521. Система не принимает.
я в апельсине сделал
источник

i

igor in Machine learning
источник

SS

Sergey Salnikov in Machine learning
о, кстати, RapidMiner недавно вспомнил, оказывается это один из популярных тулзов, использовал кто?
источник

V

Vladislav-kun in Machine learning
Svetlana Astafyeva
Ох...
А как рассказывают?
Нудно или интересно?
И вообще, откладывается что-то?
Очень много гуглить придется и читать самостоятельно (хотя я думаю это и в плюс). Безусловно откладывается)
источник

NO

Nikolai Orlov in Machine learning
igor
я в апельсине сделал
Я делаю в гугл.колаб, первое задание там выполнилось без проблем. А логика решения такая же была?
источник

SA

Svetlana Astafyeva in Machine learning
igor
Для кого, какая база, цели, сколько времени свободного, знаете ли анлгийский
Для кого?
Для себя. Учусь, чтобы сменить профессию на DS. Или я неправильно поняла?
База.
Статистика только курс Карпова. Математика более или менее.
Время.
Мало времени. Хочу больше уделить ML.
Английский.
Не настолько, чтобы спокойно слушать курсы и все понимать.
Лучше на русском.
Платить.
От цены зависит.
источник

I

Ibp in Machine learning
Valery
есть учебный сорев, условие - дан граф, даны свойства каждой вершины в виде набора 0 и 1, фичей много (около 3к)
даны ребра между вершинами, 1 - ребро есть, 0 - ребра нет
дан набор пар вершин, где наличие ребер надо предсказать
предполагается использование графовых нейронок, но у меня получилось побить верхний бейзлай классификатором на скалярном произведении фичей пары вершин
то есть данные типа так заданы? где x - вершины
источник

SA

Svetlana Astafyeva in Machine learning
Vladislav-kun
Очень много гуглить придется и читать самостоятельно (хотя я думаю это и в плюс). Безусловно откладывается)
У меня похоже мало что откладывается.
Вроде второй курс легко прошла, в 4 недели вместо 5 уложилась, задания легко все сделала. Отвлеклась на статистику и теорвер, теперь заново перечитываю, переслушиваю весь курс, как в первый раз.
Смотрю свой код и не верю, что это я написала. 🤦
источник

i

igor in Machine learning
Vladislav-kun
Очень много гуглить придется и читать самостоятельно (хотя я думаю это и в плюс). Безусловно откладывается)
курсы каша из топора - это минус
источник

i

igor in Machine learning
К сожалению на русском языке сложнее найти.
источник

V

Valery in Machine learning
Ibp
то есть данные типа так заданы? где x - вершины
Да, но это не матрица смежности. У Вас индексы иксов совпадают, как будто вершины по 2 осям
источник

I

Ibp in Machine learning
ну это как бы не важно, их же можно наверное отсортировать?
источник

V

Valery in Machine learning
Все фичи бинарные,
источник

V

Valery in Machine learning
источник

V

Valery in Machine learning
Оригинал)
источник

I

Ibp in Machine learning
Valery
Да, но это не матрица смежности. У Вас индексы иксов совпадают, как будто вершины по 2 осям
если так, тут как бы я вижу  такой способ: для каждой пары иксов ( неважно, отсортированы они или нет) можно в этой таблице найти найти ответ таргет - 0 или 1 и нагенерировать обучающий датасет с где каждой паре прилепить таргет. И на этой конструкции обучит сетку подавая на вход пару [x1,x2]  а на выход таргет. Ну и поубучать это все
источник

of

oleg fadeev in Machine learning
Народ подскажите, где будет уместно задать базовые тупые вопросы по питону?
источник