Size: a a a

Natural Language Processing

2020 June 30

DY

Daniel Yavorovych in Natural Language Processing
+10375 - это валидное значение?
источник

DY

Daniel Yavorovych in Natural Language Processing
судя по всему - это Беларусь, в международнем формате это +375 код
источник

DY

Daniel Yavorovych in Natural Language Processing
если указывать без 10, то парсеры работают корректно:
In [22]: phone = '+375232441111'                                                                                                                                                                                                                                         

In [23]: x = phonenumbers.parse(phone, None)                                                                                                                                                                                                                            

In [24]: print(x)                                                                                                                                                                                                                                                        
Country Code: 375 National Number: 232441111
источник

DY

Daniel Yavorovych in Natural Language Processing
@egor_urvanov чей это номер на самом деле?
источник

EU

Egor Urvanov in Natural Language Processing
Тут хороший вопрос. Белорусь походу
источник

YS

Yehor Smoliakov in Natural Language Processing
Egor Urvanov
Тут хороший вопрос. Белорусь походу
Беларусь
источник

V

Vlad in Natural Language Processing
Daniel Yavorovych
судя по всему - это Беларусь, в международнем формате это +375 код
Я из Беларуси - у нас все мобильные номера имеют структуру +375 (код_из_двух_цифр) номер_телефона_из_7_цифр

Номеров на +10 ни разу не встречал, есть ещё 80 код_из_двух_цифр номер_телефона_из_7_цифр
источник

V

Vlad in Natural Language Processing
причём код_из_двух_цифр может быть 29, 33, 25 и 17
источник

IZ

Ivan Zhuk in Natural Language Processing
44 ещё может быть
источник

V

Vlad in Natural Language Processing
а, да
источник

V

Vlad in Natural Language Processing
Т.е. номера телефонов можно описать так: (+375|80) (17|25|29|33|44) XXX-XX-XX
источник

SD

Sergey D in Natural Language Processing
Это не может быть 8~10?

На https://en.m.wikipedia.org/wiki/List_of_international_call_prefixes написано, что ~ в данном случае означает wait for the next dial tone.
источник

EU

Egor Urvanov in Natural Language Processing
Вопрос в том, что люди их пишут как попало и хорошо бы понимать, что они пишут
источник

SS

Sergey Sikorskiy in Natural Language Processing
Интересной темой Вы занимаетесь. У Вас совершенно случайно своего чата посвященного этой теме нет?
источник

IZ

Ivan Zhuk in Natural Language Processing
Там первая цифра номера в связке с кодом дают оператора
источник

IZ

Ivan Zhuk in Natural Language Processing
источник

NK

Nikolay Karelin in Natural Language Processing
Ivan Zhuk
Там первая цифра номера в связке с кодом дают оператора
Не всегда. Номер может быть перенесен в сеть другого оператора.
источник

IZ

Ivan Zhuk in Natural Language Processing
Справедливо
источник

AK

Anton Kolonin in Natural Language Processing
Sergey Sikorskiy
Интересной темой Вы занимаетесь. У Вас совершенно случайно своего чата посвященного этой теме нет?
Более "узко-специфичного" чата нет 😊 Если только более "общий": https://t.me/agirussia
источник

DY

Daniel Yavorovych in Natural Language Processing
Egor Urvanov
Вопрос в том, что люди их пишут как попало и хорошо бы понимать, что они пишут
я это всегда решаю кастомными механизмами нормализации данных, основанные на конкретном датасете. общего решения, которое можно включить и все заработает, как правило, нет.
с точки зрения стандартов, phonenumbers решает свою задачу.
источник