Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 August 25

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
*surprised pikachu face*
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Стало так
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Переслано от k k
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Но я потерял первую строчку, обидно
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
КОгда загружаешь данные из файла надо указать, чтобы он не интерпретировал первую строку как заголовки
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
а, ну у тебя пандас эту первую строчку как заголовок принял просто
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
добавь в параметры header = None, когда загружаешь датасет в пандас
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
КОгда загружаешь данные из файла надо указать, чтобы он не интерпретировал первую строку как заголовки
У меня грузит pd.read_table там нет такого аргумента
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Sergei Zotov
добавь в параметры header = None, когда загружаешь датасет в пандас
У меня грузит pd.read_table там нет такого аргумента
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
pd.read_table(..., header=None)?
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Потому что файл был без расширения изначально, хотя я и добавил потом csv , как понимаю это ничего не ищменило, обычная команда pd.read_csv тогда не сработала
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
pd.read_table(..., header=None)?
Секунду..
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
там полно аргументов, они ж не все видны :D
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
header=0 можно попробовать, судя по доке
источник

SZ

Sergei Zotov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
чтобы не ждать загрузки всей сотни миллионов еще можно добавить "nrows = 100", например. Так проще будет сначала поиграться с данными
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Не, там написано " the behavior is identical to header=0 and column names are inferred from the first line of the file"
То есть как раз то что имеет место. Насколько я понимаю, надо header=None, или явно указать как names=['CID', 'SMILES']
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Sergei Zotov
чтобы не ждать загрузки всей сотни миллионов еще можно добавить "nrows = 100", например. Так проще будет сначала поиграться с данными
Ценный совет
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
Не, там написано " the behavior is identical to header=0 and column names are inferred from the first line of the file"
То есть как раз то что имеет место. Насколько я понимаю, надо header=None, или явно указать как names=['CID', 'SMILES']
Хм..то есть вместо columns писать names (?)..хм..попробую..
источник

КЧ

Кирилл Чертоганов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Кажется сработало....
источник