кто нибудь сношался в python SDK azureml с таким объектом как Dataset.Tabular ? документация у майкоф на его счет отсутствует. Собственно проблема в том что вместо милых всем нормальным людям пандосовских датафреймов azureml использует Dataset.TabularDataset, который создается вышеупомянутым Dataset.Tabular из файлов с разделителями. Проблема в том что TabularDataset не имеет методов и полей которые бы могли бы кастить из float в int..
а SDK дальше по пайплайну, несмотря на издевательское указание что работает с различными объектами в том числе и pd.DataFrame в реальности работает только с TabularDataset. Вроде я нашел метод у фабрики создающей TabularDataset. Документация ужасающе противоречивая, на удивление хреново они ее поддерживают)
Подскажите, пожалуйста, суррогатные ключи(искусственные уникальные идентификаторы ID)в Spark SQL лучше генерировать с помощью функций генерации UUID ? В Spark SQL может есть ещё аналоги Sequences из мира классических RDBMS ?
всем привет, есть кто то, кто на реальных проектах имел дело с apache thrift и с gRPC и может рассказать свое мнение о том что лучше и какие там есть существенные различия между ними в скорости передачи данных, например?