в данной модели rnn (в общем самая простая и стандартная), насколько я понимаю, за процесс, который называется embedding, а точнее за "изучение метрики" отвечают две матрицы W_hh и W_xh ?
ведь h_dim это именно новое измерение того многомерного плана, на который делается как бы mapping допустим нашего слова (индекса слова) в какую-то h_dim мерную точку ?
Или все же это больше W_xh?
Чисто на теоретическом уровне, понял идею embedding, хочется это еще на формуле "увидеть".