Телеграмм чат группы datasciencecourse страница 4416

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7650 membersпожаловаться на группу

2020 December 01

NC

Nikita Chepurenko in Machine learning

Alexander Petrenko

Всем привет!
Может кому будет интересно. Недавно начался челлендж от СИБУРа. В нем есть две задачи. В одной из них требуется обработка текста. Задача не очень сложная. Решение к ней интуитивное. Я долго не думал и решил запилить статью на Хабр. Если кто-то хочет попробовать себя в конкурсе, то он еще идет, вроде недели две точно будет, а моя статья будет в помощь :) по ней можно набить честный скор от 0.3 до 0.4, а если еще помаяться то может и 0.5 выйти, а не честный - сразу около 0.6. Надеюсь это не сочтут за рекламу и меня не забанят

https://habr.com/ru/post/530628/

Участвуем в соревновании по Data Science. Первый опыт

Привет, Хабр! Давно я не писал никаких статей и, вот думаю, пришло время написать о там, как мне пригодились знания по data science, полученные по ходу обучения...

Супер, я считаю, что любая статья имеет право на существование, также как я не являюсь специалистом, не могу сказать что и как верно или нет.
Честно больше по коду познакомился с методами и тд. Спасибо, сам хотел учавствовать, но не было времени и команды.
Жду результата, который вы обещали выложить 😉

источник

08:34пожаловаться #1

AP

Alexander Petrenko in Machine learning

Nikita Chepurenko

Супер, я считаю, что любая статья имеет право на существование, также как я не являюсь специалистом, не могу сказать что и как верно или нет.
Честно больше по коду познакомился с методами и тд. Спасибо, сам хотел учавствовать, но не было времени и команды.
Жду результата, который вы обещали выложить 😉

Спасибо:) результат не раньше чем через 3 недели, по завершению конкурса. Скоро будет соревнование от Альфы, оно обещает быть интересным. Если время будет, пробуйте там. Команда не главное. Я просто читал чат сорева и приходил к умным мыслям. Чат как большая ничейная команда:)

источник

08:46пожаловаться #2

NC

Nikita Chepurenko in Machine learning

Alexander Petrenko

Спасибо:) результат не раньше чем через 3 недели, по завершению конкурса. Скоро будет соревнование от Альфы, оно обещает быть интересным. Если время будет, пробуйте там. Команда не главное. Я просто читал чат сорева и приходил к умным мыслям. Чат как большая ничейная команда:)

Понял, спасибо за совет. Надо будет глянуть.

источник

08:47пожаловаться #3

KA

K Azef in Machine learning

не могу не поделиться:
выложили в открытый доступ лекции Yann LeCun'а для NYU:
https://cds.nyu.edu/deep-learning/

🙏

источник

09:03пожаловаться #4

AZ

Anton Zabelin in Machine learning

не могу не поделиться:
выложили в открытый доступ лекции Yann LeCun'а для NYU:
https://cds.nyu.edu/deep-learning/

Спасибо!

источник

09:40пожаловаться #5

E

Egor in Machine learning

не могу не поделиться:
выложили в открытый доступ лекции Yann LeCun'а для NYU:
https://cds.nyu.edu/deep-learning/

вау в текстовом формате так еще и с практикой

источник

10:40пожаловаться #6

RS

Renat Shakirov in Machine learning

Привет, у меня есть задача с кругами, нужно распознать сколько кругов на рисунке, круги явно выраженные и разноцветные, куда можно копать в этом плане?

источник

11:21пожаловаться #7

RS

Renat Shakirov in Machine learning

источник

11:22пожаловаться #8

RS

Renat Shakirov in Machine learning

вот пример

источник

11:22пожаловаться #9

RS

Renat Shakirov in Machine learning

мб есть статейки на похожие задачки

источник

11:23пожаловаться #10

i

igor in Machine learning

Похоже на элипсы

источник

11:37пожаловаться #11

RS

Renat Shakirov in Machine learning

возможно телега немного картинку растянула

источник

11:41пожаловаться #12

SC

Sergey Cholovsky in Machine learning

Один мой товарищ когда-то решал что-то подобное с помощью "сканирующей прямой/окружности"

источник

11:41пожаловаться #13

ПВ

Помощь Вам in Machine learning

class BBCIDataset(object):
"""
Loader class for files created by saving BBCI files in matlab (make
sure to save with '-v7.3' in matlab, see
https://de.mathworks.com/help/matlab/import_export/mat-file-versions.html#buk6i87
)
Parameters
----------
filename: str
load_sensor_names: list of str, optional
Also speeds up loading if you only load some sensors.
None means load all sensors.

Copyright Robin Schirrmeister, 2017
Altered by Vinay Jayaram, 2018
"""

def __init__(self, filename, load_sensor_names=None):
self.__dict__.update(locals())
del self.self

def load(self):
cnt = self._load_continuous_signal()
cnt = self._add_markers(cnt)
return cnt

def _load_continuous_signal(self):
wanted_chan_inds, wanted_sensor_names = self._determine_sensors()
fs = self._determine_samplingrate()
with h5py.File(self.filename, 'r') as h5file:
samples = int(h5file['nfo']['T'][0, 0])
cnt_signal_shape = (samples, len(wanted_chan_inds))
continuous_signal = np.ones(cnt_signal_shape,
dtype=np.float32) * np.nan
for chan_ind_arr, chan_ind_set in enumerate(wanted_chan_inds):
# + 1 because matlab/this hdf5-naming logic
# has 1-based indexing
# i.e ch1,ch2,....
chan_set_name = 'ch' + str(chan_ind_set + 1)
# first 0 to unpack into vector, before it is 1xN matrix
chan_signal = h5file[chan_set_name][
:].squeeze() # already load into memory
continuous_signal[:, chan_ind_arr] = chan_signal
assert not np.any(
np.isnan(continuous_signal)), "No NaNs expected in signal"

# Assume we cant know channel type here automatically
ch_types = ['eeg'] * len(wanted_chan_inds)
info = mne.create_info(ch_names=wanted_sensor_names, sfreq=fs,
ch_types=ch_types)
# Scale to volts from microvolts, (VJ 19.6.18)
continuous_signal = continuous_signal * 1e-6
cnt = mne.io.RawArray(continuous_signal.T, info)
return cnt

def _determine_sensors(self):
all_sensor_names = self.get_all_sensors(self.filename, pattern=None)
if self.load_sensor_names is None:

# if no sensor names given, take all EEG-chans
eeg_sensor_names = all_sensor_names
eeg_sensor_names = filter(lambda s: not s.startswith('BIP'),
eeg_sensor_names)
eeg_sensor_names = filter(lambda s: not s.startswith('E'),
eeg_sensor_names)
eeg_sensor_names = filter(lambda s: not s.startswith('Microphone'),
eeg_sensor_names)
eeg_sensor_names = filter(lambda s: not s.startswith('Breath'),
eeg_sensor_names)
eeg_sensor_names = filter(lambda s: not s.startswith('GSR'),
eeg_sensor_names)
eeg_sensor_names = list(eeg_sensor_names)
assert (len(eeg_sensor_names) in set(
[128, 64, 32, 16])), "check this code if you have different sensors..." # noqa
self.load_sensor_names = eeg_sensor_names
chan_inds = self._determine_chan_inds(all_sensor_names,
self.load_sensor_names)
return chan_inds, self.load_sensor_names

def _determine_samplingrate(self):
with h5py.File(self.filename, 'r') as h5file:
fs = h5file['nfo']['fs'][0, 0]
assert isinstance(fs, int) or fs.is_integer()
fs = int(fs)
return fs

@staticmethod
def _determine_chan_inds(all_sensor_names, sensor_names):
assert sensor_names is not None
chan_inds = [all_sensor_names.index(s) for s in sensor_names]
assert len(chan_inds) == len(sensor_names)

MAT-File Versions
- MATLAB & Simulink
- MathWorks Deutschland

There are several versions of MAT-files that each support an increasing set of features, starting with MAT-file Version 4.

источник

11:46пожаловаться #14

ПВ

Помощь Вам in Machine learning

, ("All"
"sensors"
"should be there.")
# TODO: is it possible for this to fail? the list
# comp fails first right?
assert len(set(chan_inds)) == len(chan_inds), ("No"
"duplicated sensors"
"wanted.")
return chan_inds

@staticmethod
def get_all_sensors(filename, pattern=None):
"""
Get all sensors that exist in the given file.

Parameters
----------
filename: str
pattern: str, optional
Only return those sensor names that match the given pattern.
Returns
-------
sensor_names: list of str
Sensor names that match the pattern or all
sensor names in the file.
"""
with h5py.File(filename, 'r') as h5file:
clab_set = h5file['nfo']['clab'][:].squeeze()
all_sensor_names = [''.join(chr(c) for c in h5file[obj_ref]) for
obj_ref in clab_set]
if pattern is not None:
all_sensor_names = filter(
lambda sname: re.search(pattern, sname),
all_sensor_names)
return all_sensor_names

def _add_markers(self, cnt):
with h5py.File(self.filename, 'r') as h5file:
event_times_in_ms = h5file['mrk']['time'][:].squeeze()
event_classes = h5file['mrk']['event']['desc'][:].squeeze().astype(
np.int64)

# Check whether class names known and correct order
# class_name_set = h5file['nfo']['className'][:].squeeze()
# all_class_names = [''.join(chr(c) for c in h5file[obj_ref])
# for obj_ref in class_name_set]

event_times_in_samples = event_times_in_ms * cnt.info['sfreq'] / 1000.0
event_times_in_samples = np.uint32(np.round(event_times_in_samples))

# Check if there are markers at the same time
previous_i_sample = -1
for i_event, (i_sample, id_class) in enumerate(
zip(event_times_in_samples, event_classes)):
if i_sample == previous_i_sample:
info = "{:d}: ({:.0f} and {:.0f}).\n".format(i_sample,
event_classes[
i_event - 1],
event_classes[
i_event])
log.warning("Same sample has at least two markers.\n"
+ info +
"Marker codes will be summed.")
previous_i_sample = i_sample

# Now create stim chan
stim_chan = np.zeros_like(cnt.get_data()[0])
for i_sample, id_class in zip(event_times_in_samples, event_classes):
stim_chan[i_sample] += id_class
info = mne.create_info(ch_names=['STI 014'],
sfreq=cnt.info['sfreq'],
ch_types=['stim'])
stim_cnt = mne.io.RawArray(stim_chan[None], info, verbose='WARNING')
cnt = cnt.add_channels([stim_cnt])
event_arr = [event_times_in_samples,
[0] * len(event_times_in_samples),
event_classes]
cnt.info['events'] = np.array(event_arr).T
return cnt

источник

11:46пожаловаться #15

ПВ

Помощь Вам in Machine learning

как его фунцкий использовать?

источник

11:46пожаловаться #16

i

igor in Machine learning

Каф трансформ для кругов подойдет?

источник

11:48пожаловаться #17

SC

Sergey Cholovsky in Machine learning

мб есть статейки на похожие задачки

Ещё можно объединять области одного цвета в вершину графа. Все вершины смежные с белым гарантированно дают окружности. Потом можно взять от распознанной окружности выпуклую оболочку. И дальше какие области смежны с ней, какие полностью попадают.

источник

11:48пожаловаться #18

ПП

Павлик Павлик... in Machine learning

ребят.
а я правильно понимаю отличия машинного обучения от статистики:
1. регуляризации
2. метрики
ну в общих чертах.
понятно что одних методик кросс валидации штук 5.

источник

11:59пожаловаться #19

AR

Anton Rogozin in Machine learning

Павлик Павлик

ребят.
а я правильно понимаю отличия машинного обучения от статистики:
1. регуляризации
2. метрики
ну в общих чертах.
понятно что одних методик кросс валидации штук 5.

В дата сайенсе статистику чаще используют для проверки гипотез и анализа данных (к примеру, АБ-тесты), машинное обучение чаще для создания моделей классификации и регрессии. Машинное обучение включает в себя немного статистики, но не всю. Это немного разные понятия

источник

12:02пожаловаться #20