Size: a a a

Machine learning

2020 December 23

PS

Pavel Savin in Machine learning
самое прикольное, что если наоборот написать, то нормально отработает:

a[a.index(min(a[j:]))], a[j]  = a[j], a[a.index(min(a[j:]))]
источник

NO

Nikolai Orlov in Machine learning
igor
я в апельсине сделал
Что такое апельсин?
источник

i

igor in Machine learning
Orange data mining tool
источник

А

Артём in Machine learning
Nikolai Orlov
Друзья, помогите, плиз, уже несколько дней сижу с первым заданием #C3W4. Где нужно убрать слова, встречающиеся больше 4000 раз. Прошерстил форум, все должно работать. Но не работает.
Код вот такой.

находим индексы с частотой >4000
extra_elements=[]
for key in dictionary2.dfs.keys():
 if dictionary2.dfs[key]>4000:
   extra_elements.append(key)

удаляем элементы
for i in extra_elements:
 dictionary2.filter_tokens(bad_ids=[dictionary2.token2id[dictionary2[i]]])
dict_size_after=len(dictionary2)

создаем новый корпус и считаем размеры старого и нового
corpus2 = [dictionary2.doc2bow(text) for text in texts]
def corpus_size(corpus):
 n=0
 for i in range(len(corpus)):
   n=n+len(corpus[i])
 return n

Ответ получается 6714 6702 428249 404521. Система не принимает.
Последнее число у вас неверное, поэтому не принимается грейдером
источник

А

Артём in Machine learning
Nikolai Orlov
Друзья, помогите, плиз, уже несколько дней сижу с первым заданием #C3W4. Где нужно убрать слова, встречающиеся больше 4000 раз. Прошерстил форум, все должно работать. Но не работает.
Код вот такой.

находим индексы с частотой >4000
extra_elements=[]
for key in dictionary2.dfs.keys():
 if dictionary2.dfs[key]>4000:
   extra_elements.append(key)

удаляем элементы
for i in extra_elements:
 dictionary2.filter_tokens(bad_ids=[dictionary2.token2id[dictionary2[i]]])
dict_size_after=len(dictionary2)

создаем новый корпус и считаем размеры старого и нового
corpus2 = [dictionary2.doc2bow(text) for text in texts]
def corpus_size(corpus):
 n=0
 for i in range(len(corpus)):
   n=n+len(corpus[i])
 return n

Ответ получается 6714 6702 428249 404521. Система не принимает.
В задании написано вычислить суммарное количество РАЗЛИЧНЫХ ингредиентов в каждом документе корпуса, у вас этого нет
источник

NO

Nikolai Orlov in Machine learning
Артём
Последнее число у вас неверное, поэтому не принимается грейдером
Да, я понял. Спасибо.
источник

NO

Nikolai Orlov in Machine learning
Я перезаписал в список не индексы, а сами слова, а потом подставил в фильтр через for. Так заработало.
источник

M

Manish in Machine learning
If anyone wants applied ai course for data science Dm me
источник

of

oleg fadeev in Machine learning
Pavel Savin
самое прикольное, что если наоборот написать, то нормально отработает:

a[a.index(min(a[j:]))], a[j]  = a[j], a[a.index(min(a[j:]))]
Благода, я ломал голову и не понимал в чем дело.
Вариант как ты предложил с разбитием на две строки , я тоже пробовал. Но видимо в нем тоже умудрился сделать ошибку.
источник

of

oleg fadeev in Machine learning
В итоге с полным набором списка все равно не сортирует, до определенного момента все ок, а потом не понимаю почему сортировка прекращается
a = [17, 24, 91, 96, 67, -27, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, -97, -37, -84, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, -91, 44, 25, 79, 97, 0, -94, 7, -47, -96, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, -84, -95, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84]


for j in range(len(a)):
   
   k = a.index(min(a[j:]))
   
   a[j], a[k] = a[k], a[j]
   #print(a.index(min(a[j:])))
print(a)
источник

of

oleg fadeev in Machine learning
Результат такой -
[-97, -96, -95, -94, -91, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, 17, -37, -27, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, 67, 44, 25, 79, 97, 0, 96, 7, -47, 24, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, 91, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84, -84, -84]

[Program finished]
источник

i

igor in Machine learning
А должен сортировать?
источник

PS

Pavel Savin in Machine learning
igor
А должен сортировать?
Внешне выглядит как пузырёк
источник

А

Артем in Machine learning
Pavel Savin
Внешне выглядит как пузырёк
Это сортировка выбором
источник

PS

Pavel Savin in Machine learning
oleg fadeev
Результат такой -
[-97, -96, -95, -94, -91, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, 17, -37, -27, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, 67, 44, 25, 79, 97, 0, 96, 7, -47, 24, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, 91, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84, -84, -84]

[Program finished]
Ну в общем посмотри, в каком месте первый раз ломается (либо a[j] строго меньше a[k], либо вообще вдруг какой-то магией k < j)
источник

PS

Pavel Savin in Machine learning
Артем
Это сортировка выбором
Возможно, не специалист в квадратичных сортировках)
источник

А

Артем in Machine learning
oleg fadeev
В итоге с полным набором списка все равно не сортирует, до определенного момента все ок, а потом не понимаю почему сортировка прекращается
a = [17, 24, 91, 96, 67, -27, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, -97, -37, -84, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, -91, 44, 25, 79, 97, 0, -94, 7, -47, -96, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, -84, -95, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84]


for j in range(len(a)):
   
   k = a.index(min(a[j:]))
   
   a[j], a[k] = a[k], a[j]
   #print(a.index(min(a[j:])))
print(a)
a.index() возвращает номер номер первого вхождения элемента в список. Если найденный минимальный элемент уже есть в отсортированной части, то он его и вернёт
источник

i

igor in Machine learning
oleg fadeev
В итоге с полным набором списка все равно не сортирует, до определенного момента все ок, а потом не понимаю почему сортировка прекращается
a = [17, 24, 91, 96, 67, -27, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, -97, -37, -84, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, -91, 44, 25, 79, 97, 0, -94, 7, -47, -96, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, -84, -95, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84]


for j in range(len(a)):
   
   k = a.index(min(a[j:]))
   
   a[j], a[k] = a[k], a[j]
   #print(a.index(min(a[j:])))
print(a)
Скинь в кодскалптор ссыль
источник

D

Dmitry in Machine learning
Pavel Savin
Внешне выглядит как пузырёк
У пузырька другой алгоритм
источник

i

igor in Machine learning
oleg fadeev
В итоге с полным набором списка все равно не сортирует, до определенного момента все ок, а потом не понимаю почему сортировка прекращается
a = [17, 24, 91, 96, 67, -27, 79, -71, -71, 58, 48, 88, 88, -16, -78, 96, -76, 56, 92, 1, 32, -17, 36, 88, -61, -97, -37, -84, 50, 47, 94, -6, 52, -76, 93, 14, -32, 98, -65, -16, -9, -68, -20, -40, -71, 93, -91, 44, 25, 79, 97, 0, -94, 7, -47, -96, -55, -58, -78, -78, -79, 75, 44, -56, -41, 38, 16, 70, 17, -17, -24, -83, -74, -73, 11, -26, 63, -75, -19, -13, -51, -74, 21, -8, 21, -68, -66, -84, -95, 78, 69, -29, 39, 38, -55, 7, -11, -26, -62, -84]


for j in range(len(a)):
   
   k = a.index(min(a[j:]))
   
   a[j], a[k] = a[k], a[j]
   #print(a.index(min(a[j:])))
print(a)
у меня работаетт ваш алг
источник