Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 August 21

А

Александр in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Думал есть способ на «автопилот» поставить. Там около 3к записей в таблице, но видимо только вручную и придётся
источник

А

Александр in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
No Name
Я бы попробовал лемматизация + словари
Вот это подробнее можно?
источник

NN

No Name in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Александр
Вот это подробнее можно?
источник

NN

No Name in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
На очепятках можно расстояние левенштейна использовать
источник

AB

Arcady Balandin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ещё вариант. Если все категории заранее известны то любой ответ по словарю возможных значений и нечеткому поиску (тот же левенштайн) можно всегда отнести к какому то классу. Разумеется в первой итерации должно быть класс "не знаю что это"
источник

MC

Maxim Cheparin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Александр
Так а чем они помогут?) Особенно если опечатки, да и вариаций на тему там уйма)
похоже на стандартную проблему, которую, вроде как, уже лет 5 научились решать

я не спец по текстам, но думаю, твоя проблема качественно решается,
лично из того что я знаю: лемматизация и стемминг (мб на n-граммы юзать)- но есть методы покруче, просто их не преподавали в курсе, что я прошел, хех
источник

MC

Maxim Cheparin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
No Name
На очепятках можно расстояние левенштейна использовать
да, во, на опечатках еще какую-нидь метрику ввести на стемминговых уже словах - но это уже следующий этап
источник

MC

Maxim Cheparin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
(хотя если их будет немного, а у тебя всего 3к записей, то мб и руками можно будет перебрать)
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
небольшой вопрос относительно данной иллюстрации конволюции:
Как бы вы описали принцип weights sharing на этой иллюстрации, как он проявляется ?
Интуитивно хотелось бы чтобы все три матрицы в фильтре W0 были одинаковые, чтобы значения иксов в той же позиции на разной глубине использовали то же значение w,  чего по сути в данном произведение не происходит, каждое инпутовое значение в области 3 на 3 на 3 глубинах умножает другое значение w и всего один раз.
Поэтому интуиция с цифровым примером не совсем складывается.
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
небольшой вопрос относительно данной иллюстрации конволюции:
Как бы вы описали принцип weights sharing на этой иллюстрации, как он проявляется ?
Интуитивно хотелось бы чтобы все три матрицы в фильтре W0 были одинаковые, чтобы значения иксов в той же позиции на разной глубине использовали то же значение w,  чего по сути в данном произведение не происходит, каждое инпутовое значение в области 3 на 3 на 3 глубинах умножает другое значение w и всего один раз.
Поэтому интуиция с цифровым примером не совсем складывается.
Weight sharing между чем и чем
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Коллеги, кто хочет в Сочи hadoop шатать, и ещё денег за это получать? В @datasciencejobs последняя вакансия как раз про это ;)
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
между нейронами. Нейрон насколько я понимаю в данном случае это функция f, которая дав ей инпут x: y=f(x)=wx+b.
Вот и пытаюсь увидеть принцип на примере.
Из другой картинки конечно понятно, что weight sharing заключается в том, что разный инпут получает те же w, что есть на другой картинке, поэтому не уверен, что интуиция этой картинки верная, либо я еще не понял.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
между нейронами. Нейрон насколько я понимаю в данном случае это функция f, которая дав ей инпут x: y=f(x)=wx+b.
Вот и пытаюсь увидеть принцип на примере.
Из другой картинки конечно понятно, что weight sharing заключается в том, что разный инпут получает те же w, что есть на другой картинке, поэтому не уверен, что интуиция этой картинки верная, либо я еще не понял.
вот с этой картинкой у меня складывается выше цифровое умножение. А со второй менее.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
вот с этой картинкой у меня складывается выше цифровое умножение. А со второй менее.
на цифровом примере, берем разные аупуты и видим что к ним приводят разные инпуты, но те же "фильтры".
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
между нейронами. Нейрон насколько я понимаю в данном случае это функция f, которая дав ей инпут x: y=f(x)=wx+b.
Вот и пытаюсь увидеть принцип на примере.
Из другой картинки конечно понятно, что weight sharing заключается в том, что разный инпут получает те же w, что есть на другой картинке, поэтому не уверен, что интуиция этой картинки верная, либо я еще не понял.
а вот тут третий пункт, может быть перефразировка, но не догнал еще.
источник

MC

Maxim Cheparin in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dan • Captain
Коллеги, кто хочет в Сочи hadoop шатать, и ещё денег за это получать? В @datasciencejobs последняя вакансия как раз про это ;)
а что такое хэдуп? это для параллельного проганья? инженерить?
источник

R

Runtime Еггор in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dan • Captain
Коллеги, кто хочет в Сочи hadoop шатать, и ещё денег за это получать? В @datasciencejobs последняя вакансия как раз про это ;)
А что, можно шатать и не получать? Оо
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Maxim Cheparin
а что такое хэдуп? это для параллельного проганья? инженерить?
Big big big data. Хранилка, процедурилка, и многое чего другое делалка:)
источник

R

Runtime Еггор in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Maxim Cheparin
а что такое хэдуп? это для параллельного проганья? инженерить?
Ok google
источник

D•

Dan • Captain in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Runtime Еггор
А что, можно шатать и не получать? Оо
У меня есть вакансия для стажеров, там получают опыт за шатание хадупов
источник