Size: a a a

Natural Language Processing

2020 August 10

KS

Konstantin Smith in Natural Language Processing
Быстродействие измерялось на работе SDK Pullenti, переведённое с C# на разные языки программирования. Это не значит, что для любой программы это так. На данном довольно сложном алгоритме (Pullenti) у меня получилось, что  C# и Java по скорости примерно равны, JavaScript в 5 раз медленнее, Python - в 20 раз медленнее, Про PHP не буду говорить, там раз в 100, но это, думаю, из-за неэффективной работы со строками (там string представлены в utf-8, и нельзя сразу добраться до i-го символа).
источник

E

Etki in Natural Language Processing
duh. я просто сказал, что за "я тут делал Х, и выяснил, что A быстрее Б" сразу заклюют, при чем справедливо
источник

EB

Evgeniy Blinov in Natural Language Processing
Etki
duh. я просто сказал, что за "я тут делал Х, и выяснил, что A быстрее Б" сразу заклюют, при чем справедливо
И будут неправы, тк действительно ничего не мешает А быть быстрее Б
источник

E

Etki in Natural Language Processing
А не быстрее Б просто потому что некий абстрактный код первелся на другой язык, без учета того, как он был переведен, что учитывалось, что там с компиляторами и настройками и прочее.
источник

E

Etki in Natural Language Processing
это ровно то же, что и "AOT быстрее JIT" и наоборот
источник

EB

Evgeniy Blinov in Natural Language Processing
Etki
А не быстрее Б просто потому что некий абстрактный код первелся на другой язык, без учета того, как он был переведен, что учитывалось, что там с компиляторами и настройками и прочее.
Что вполне валидно, тк если чел не сечет в компиляторах и настройках, он так и будет писать, как написал бенчи, и выводы из бенчей для него будут актуальны
источник

EB

Evgeniy Blinov in Natural Language Processing
Плюс есть тупо атомарные операции
источник

E

Etki in Natural Language Processing
> не сечет

вот за "выводы" с этим фактом и заклюют
источник

EB

Evgeniy Blinov in Natural Language Processing
Etki
> не сечет

вот за "выводы" с этим фактом и заклюют
Тут такое дело, для автора бенч имеет смысл в любом случае, тк отражает его стиль кодирования, а для третьих лиц это зависит от его уровня как кодера, и в принципе тоже может быть валидным
источник

EB

Evgeniy Blinov in Natural Language Processing
Но в целом аргумент о сложности абстрактных бенчей мог бы быть норм
источник

EB

Evgeniy Blinov in Natural Language Processing
Если бы он ругал абстрактные бенчи за абстрактность, а не измерение как идею в принципе
источник
2020 August 11

SL

Satish Luintel in Natural Language Processing
Do we have a NLP expert from Melbourne please?
источник

AG

Aydar Gabdrahmanov in Natural Language Processing
Добрый вечер всем!
Столкнулся со статьей по Берт классификатору, у кого-нибудь был опыт в использования классификатора с аттеншн леером?
https://www.groundai.com/project/progress-notes-classification-and-keyword-extraction-using-attention-based-deep-learning-models-with-bert8306/2
источник

AK

Anton Kolonin in Natural Language Processing
источник

A

Alexander in Natural Language Processing
Всем привет! Подскажите, кроме Kaggle как можно набрать опыт?  Может есть куда пойти стажером онлайн или вступить в проект? Есть ли толк от Яндекс Практикум(Data Sciense)? Такое ощущение что по программе и так все знаю, но может кто проходил и может отзыв оставить? Какие можно придумать интересные проекты под резюме? Заранее спасибо
источник

NS

Nikolay Shmyrev in Natural Language Processing
Alexander
Всем привет! Подскажите, кроме Kaggle как можно набрать опыт?  Может есть куда пойти стажером онлайн или вступить в проект? Есть ли толк от Яндекс Практикум(Data Sciense)? Такое ощущение что по программе и так все знаю, но может кто проходил и может отзыв оставить? Какие можно придумать интересные проекты под резюме? Заранее спасибо
В проект с открытыми исходниками податься более-менее популярный. Там и работа найдётся.
источник

🐙

🐙 in Natural Language Processing
Alexander
Всем привет! Подскажите, кроме Kaggle как можно набрать опыт?  Может есть куда пойти стажером онлайн или вступить в проект? Есть ли толк от Яндекс Практикум(Data Sciense)? Такое ощущение что по программе и так все знаю, но может кто проходил и может отзыв оставить? Какие можно придумать интересные проекты под резюме? Заранее спасибо
Смотрел митап про gensim, кажется, в яндексе, и там один из авторов библиотеки говорил, что берёт студентов на что-то вроде стажировки, или что-то подобное. Кажется вот этот: https://www.youtube.com/watch?v=U0LOSHY7U5Q&t=3790s .
YouTube
Практическое занятие по обработке текста в gensim с помощью алгоритма word2vec
Яндекс организует семинар Льва Константиновского, посвящённый обработке текста.
Лев Константиновский — специалист по анализу текста, программирует на Python и Java. Получил большой опыт в финансовых учреждениях. Менеджер исследований и разработки в RaRe Technologies. Также является комьюнити-менеджером в open source проекте Gensim, где участвует в разработке одноимённой библиотеки алгоритмов машинного обучения для понимания естественных языков.
Автор прочтёт практическое введение в обработку текстов, написанных на естественных языках с помощью open source приложения gensim, познакомит участников с теорией алгоритма word2vec. Слушатели смогут научиться автоматически привязывать теги к документам на примере жанров и киносценариев. Также рассмотрят семь разных алгоритмов обработки текста: word2vec, doc2vec и другие.
источник

K

K.S. in Natural Language Processing
если хоть немного в теме, то Яндекса не будет толку
источник

EB

Evgeniy Blinov in Natural Language Processing
Что сейчас есть крутое в области генерации шуток?
источник

DP

Defragmented Panda in Natural Language Processing
Evgeniy Blinov
Что сейчас есть крутое в области генерации шуток?
GPL3 может и в шутки. не специализировано но все же, пытается
источник