Ну а так он связно писал или высыпал бред? У меня помню при генерации описания товаров такое выдало, что я подумал о восстании машин. "Перчатки сделаны из прочного пластика, который прослужит десятилетиями. Это будет длиться долго и сохранятся годами. Вы будете их носить на свадьбы ваших друзей и мероприятия. Перчатки очень прочные. Вы будете носить их годами. Это будет длиться вечно. Это создано что бы длиться тысячилетиями и будет длиться вечно. Единственная проблема что я не могу вытащить из них рук. "
Ну а так он связно писал или высыпал бред? У меня помню при генерации описания товаров такое выдало, что я подумал о восстании машин. "Перчатки сделаны из прочного пластика, который прослужит десятилетиями. Это будет длиться долго и сохранятся годами. Вы будете их носить на свадьбы ваших друзей и мероприятия. Перчатки очень прочные. Вы будете носить их годами. Это будет длиться вечно. Это создано что бы длиться тысячилетиями и будет длиться вечно. Единственная проблема что я не могу вытащить из них рук. "
Ну а так он связно писал или высыпал бред? У меня помню при генерации описания товаров такое выдало, что я подумал о восстании машин. "Перчатки сделаны из прочного пластика, который прослужит десятилетиями. Это будет длиться долго и сохранятся годами. Вы будете их носить на свадьбы ваших друзей и мероприятия. Перчатки очень прочные. Вы будете носить их годами. Это будет длиться вечно. Это создано что бы длиться тысячилетиями и будет длиться вечно. Единственная проблема что я не могу вытащить из них рук. "
Ну а так он связно писал или высыпал бред? У меня помню при генерации описания товаров такое выдало, что я подумал о восстании машин. "Перчатки сделаны из прочного пластика, который прослужит десятилетиями. Это будет длиться долго и сохранятся годами. Вы будете их носить на свадьбы ваших друзей и мероприятия. Перчатки очень прочные. Вы будете носить их годами. Это будет длиться вечно. Это создано что бы длиться тысячилетиями и будет длиться вечно. Единственная проблема что я не могу вытащить из них рук. "
Одно из 10 сообщений было более или менее интересным. Остальные бестолковые. Но и обрезал все после второй точки. А за второй точкой бывало что нибудь осмысленное начиналось
Одно из 10 сообщений было более или менее интересным. Остальные бестолковые. Но и обрезал все после второй точки. А за второй точкой бывало что нибудь осмысленное начиналось
У него ж вывод везде должен быть одинаков по длине. Все что после точки никак не связано с вводом. Я просто регуляркой резал.
У него ж вывод везде должен быть одинаков по длине. Все что после точки никак не связано с вводом. Я просто регуляркой резал.
Идея была такая: Пользователь ввел сообщение Бот взял его сообщение на вход в GPT-2 Сгенерировал длиннющий текст Отрезал от него начало (сообщение пользователя) Вставил в чат в качестве ответа
т.к. длиннющий текст читать никто не захочет, от результата оставлял только первые два предложения. Все что справа отрезал
Хотел сделать обучение на диалогах сообществ. Что бы для каждой группы была своя модель. Но руки не дошли. Распарсить переписку можно, а вот потом обучение на Русском не представляю сколько моих человекочасов займет. Боюсь больше нескольких месяцев
Ну а так он связно писал или высыпал бред? У меня помню при генерации описания товаров такое выдало, что я подумал о восстании машин. "Перчатки сделаны из прочного пластика, который прослужит десятилетиями. Это будет длиться долго и сохранятся годами. Вы будете их носить на свадьбы ваших друзей и мероприятия. Перчатки очень прочные. Вы будете носить их годами. Это будет длиться вечно. Это создано что бы длиться тысячилетиями и будет длиться вечно. Единственная проблема что я не могу вытащить из них рук. "
ну так дообучать надо на диалоговых парах. сама модель обучена на классической литературе и пелевине. поэтому такие тексты генерируются. если есть достаточно много пар (миллион), то будет что-то похожее на общение.
вся проблема в том, что для русского языка нет в отркытом доступе большого датасета разговорных пар. я дообучал на датасете Козиева, там худ. лит-ра, поэтому бот вышел аристократом, у которого флешбеки войны случаются
Хотел сделать обучение на диалогах сообществ. Что бы для каждой группы была своя модель. Но руки не дошли. Распарсить переписку можно, а вот потом обучение на Русском не представляю сколько моих человекочасов займет. Боюсь больше нескольких месяцев
простой запуск русского репозитория для гпт 2 почему не пробовали?