Size: a a a

2020 October 25

AB

Anton Burkin in codingteam
Это без всяких нейронок.
источник

c

codingteam@cjr in codingteam
Minoru
для этого нужно выделить из сообщения «тему», которую K-means проинтерпретирует как метку
источник

t

ttldtor in codingteam
codingteam@cjr
Minoru
причём Орхидеус почитал доки Scala.js и процитировал, что даже с волшебным гугловым минификатором там никак не меньше 200 Кб будет. Что тоже чересчур много
Он просто хейтер)))
источник

c

codingteam@cjr in codingteam
Minoru
@ttldtor: )))
источник

t

ttldtor in codingteam
Dr. Friedrich von Never
Я против JS, короче. Если на что-то типизированное (ну, начиная с Тайпскрипта), что Орхидеус сам аккуратно встроит в билд-пайплайн — то годится.
да!
источник

AB

Anton Burkin in codingteam
Я k-mean использую, когда у меня есть куча данных без лейблов.
источник

AB

Anton Burkin in codingteam
А классифицировать то нужно.
источник

AB

Anton Burkin in codingteam
Даже в универе на бумажке k-mean считал, на зачёте 😄
источник

c

codingteam@cjr in codingteam
Minoru
и как он определяет «расстояния» до классов?
источник

AB

Anton Burkin in codingteam
Там какоего-то умного мужика расстояние
источник

c

codingteam@cjr in codingteam
Minoru
э-э-э
источник

AB

Anton Burkin in codingteam
Я помню было несколько рассчётов у меня
источник

c

codingteam@cjr in codingteam
Minoru
так, ладно, поставлю вопрос иначе: чтобы считать «расстояние», у каждого элемента должны быть «координаты». Какие «координаты» нужны сообщениям, чтобы k-means группировал их по темам?
источник

t

ttldtor in codingteam
Anton Burkin
Оно позволяет расскидывать лейблы на не размеченные данные
только ты должен точно знать, сколько лейблов будет
источник

t

ttldtor in codingteam
Anton Burkin
Даже в универе на бумажке k-mean считал, на зачёте 😄
как решал проблему локальных экстремумов? Градиентный спуск на бумажке тоже делал?
источник

c

codingteam@cjr in codingteam
Minoru
говорят, раньше градиентный спуск делали на портфелях. Врут всё, наверное
источник

AB

Anton Burkin in codingteam
codingteam@cjr
Minoru
так, ладно, поставлю вопрос иначе: чтобы считать «расстояние», у каждого элемента должны быть «координаты». Какие «координаты» нужны сообщениям, чтобы k-means группировал их по темам?
Ну я в своих hello world использовал два вида из книги:
1) Word embedding
2) One Hot Encoding
источник

AB

Anton Burkin in codingteam
ttldtor
только ты должен точно знать, сколько лейблов будет
Вот да. И это проблемка.
источник

t

ttldtor in codingteam
codingteam@cjr
Minoru
говорят, раньше градиентный спуск делали на портфелях. Врут всё, наверное
на портфелях удобнее, чем на ранцах, я тебе говорою
источник

AB

Anton Burkin in codingteam
ttldtor
как решал проблему локальных экстремумов? Градиентный спуск на бумажке тоже делал?
Мне это не нужно было в этой задаче. Но вообще делал градиентный спуск на бумажке тоже, но это по другой дисциплине.
источник