Я не совсем понял там про хэш-таблицу. Это в NLP так принято — слова складывать в хэш-таблицу? Ничо, что в ней возможны коллизии?
нет мне просто нужно отфильтровать все слова которые связаны с моей темой я сделаю это быстрее если у меня будет такой словарь (т.е. я беру все слова из фиаса) и кладу их в словарь а дальше извлекаю из всех текстов что приходят от юзера только те слова что есть в словаре