Она может либо занять значительно больше итераций для сходимости либо если совсем плохо подобран шаг град спуска (хотя тут вроде 1е-3 адекватно), то можно от точки минимума только отдалиться
Судя по большим по модулю оценкам и после нормализации, проблема ещё не решена скорее всего. Прогони рядышком аналитическое решение, чтоб было с чем сравнивать