Телеграмм чат группы pydata_chat страница 172

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Python для анализа данных

1463 membersпожаловаться на группу

2019 November 04

I

Igor in Python для анализа данных

Maksim Yasinski

это понятно, вот и хочу попросить помочь определить минимальное расстояние, оно какое? как определить? где-то оно больше, где-то меньше...

Проходим итерацию сопоставления, записываем данные расстояние в словарь "регион":"расстояние", выбираем ключ с минимальным значением, записываем значение ключа как регион в таблицу.

Это имелось в виду?

источник

10:59пожаловаться #1

MY

Maksim Yasinski in Python для анализа данных

Республика Башкортостан - эталон, если я правильно понимаю задачу надо понять куда отнести текущее значение, у нас есть Респ. Башкортостан, Башкортостан, Башкортостан Респ. и Башкортостан Республика, как их отнести к эталону? какое расстояние? возможно мы по разному задачу понимаем

источник

11:03пожаловаться #2

I

Igor in Python для анализа данных

Ну, не совсем так... Есть у нас, к примеру, значения эталонные - Республика Башкортостан, Омская область и т.д. И есть у нас разные значения - обл. Омская, Омская обл, ОМСК, Башкортостан респ, Башкортостан.. И вот мы проходим по всем последним значениям и сравниваем расстояние между двумя эталонными - "Республика Башкортостан" и "Омская область". Где меньше значение то и подставляем

источник

11:08пожаловаться #3

MY

Maksim Yasinski in Python для анализа данных

да, так гораздо лучше

источник

11:11пожаловаться #4

MY

Maksim Yasinski in Python для анализа данных

благодарю!

источник

11:12пожаловаться #5

MY

Maksim Yasinski in Python для анализа данных

единственный вопрос: учитывается ли порядок слов в алгоритме?

источник

11:14пожаловаться #6

MY

Maksim Yasinski in Python для анализа данных

к примеру к чему ближе:
Республика Башкортостан - эталон
Беларусь Республика - эталон
Башкортостан Республика - проверяем

источник

11:19пожаловаться #7

I

Igor in Python для анализа данных

Maksim Yasinski

единственный вопрос: учитывается ли порядок слов в алгоритме?

В таких случаях можно было бы сделать что то вроде определения ценности слова. К примеру в не эталонном списке часто употребляется слово Башкирская, а в эталонном - редко. В таком случае ценность слова возрастает для сравнения. Это называется tf-idf... Но об этом я бы рекомендовал самому ознакомиться, поскольку опыта с этим у меня нет...

источник

11:29пожаловаться #8

I

Igor in Python для анализа данных

Здесь k-means, я думаю, как раз очень подошёл бы)

источник

11:31пожаловаться #9

MY

Maksim Yasinski in Python для анализа данных

В таких случаях можно было бы сделать что то вроде определения ценности слова. К примеру в не эталонном списке часто употребляется слово Башкирская, а в эталонном - редко. В таком случае ценность слова возрастает для сравнения. Это называется tf-idf... Но об этом я бы рекомендовал самому ознакомиться, поскольку опыта с этим у меня нет...

Интересно, спасибо, Игорь!

источник

11:33пожаловаться #10

I

Igor in Python для анализа данных

Maksim Yasinski

Интересно, спасибо, Игорь!

Да, это действительно интересная область))

источник

11:38пожаловаться #11

2019 November 05

ВЛ

Владислав Литвинюк... in Python для анализа данных

Привет, кто-то использовал streamlit?
Не могу у себя запустить.

источник

13:40пожаловаться #12

ВЛ

Владислав Литвинюк... in Python для анализа данных

источник

13:40пожаловаться #13

AD

Andrew Dakhnovsky in Python для анализа данных

Владислав Литвинюк

Привет, кто-то использовал streamlit?
Не могу у себя запустить.

вот прям щас решился повторить код с хабра
и у меня все заработало
я ставил через обыычный pip install streamlit
потом пишешь скрипт
сохраняешь его как script_name.py
потом запускаешь его streamlit run script_name.py
вуаля - в браузере дергаешь свой ползунок

источник

13:52пожаловаться #14

AD

Andrew Dakhnovsky in Python для анализа данных

источник

13:52пожаловаться #15

ВЛ

Владислав Литвинюк... in Python для анализа данных

Andrew Dakhnovsky

источник

13:57пожаловаться #16

ВЛ

Владислав Литвинюк... in Python для анализа данных

Andrew Dakhnovsky

источник

13:57пожаловаться #17

AD

Andrew Dakhnovsky in Python для анализа данных

кириллица в пути?

источник

14:03пожаловаться #18

ВЛ

Владислав Литвинюк... in Python для анализа данных

Andrew Dakhnovsky

кириллица в пути?

нет, только диск D: , который я указал в консоле с юпитера

источник

14:04пожаловаться #19

AD

Andrew Dakhnovsky in Python для анализа данных

Владислав Литвинюк

нет, только диск D: , который я указал в консоле с юпитера

вот это добавь в веб.пи
в начало

#! /usr/bin/env python
# -*- coding: utf-8 -*-

источник

14:06пожаловаться #20