Size: a a a

Python для анализа данных

2020 November 21

K

K in Python для анализа данных
источник

LT

Lan Tal in Python для анализа данных
источник

LT

Lan Tal in Python для анализа данных
Хахаахха
источник

K

K in Python для анализа данных
источник

K

K in Python для анализа данных
что не получается?
источник

СИ

Сергей Ильин... in Python для анализа данных
Konstantin Mohov
Любовь, вы уже несколько раз спрашивали про ворд и питон)
Для работы с ним есть одна либа только, python_docx. Через нее можно получить содержимое документа, очищенное от xml тегов. в содержимом можно искать любые слова.
а есть что-то нормально работающее, только с .doc, а не .docx?
источник

LK

Lyubov K. in Python для анализа данных
Как я выяснила на своём опыте нет. Только конвертировать в docx/txt
источник

СИ

Сергей Ильин... in Python для анализа данных
В общем, кто бы подсказал?
у меня задача - по ссылке получить doc-файл, прочитать его содержимое в строку (или построчно, не суть важно) и потом уже я планирую из этой строки выдернуть регуляркой нужные мне данные.
короч, проблема - нихрена не выходит. Есть решение?
я делаю примерно так:

file = req.get(url, verify=False).content
file = BytesIO(file)
file = file.read()
file = file.decode('utf-8', 'ignore')


(понятно, что можно завернуть одно в другое, расписал для простоты понимания)

но не выходит каменный цветок - какая-то хрень, а не нормальные символы
источник

BL

Boris Litvyakov in Python для анализа данных
Сергей Ильин
В общем, кто бы подсказал?
у меня задача - по ссылке получить doc-файл, прочитать его содержимое в строку (или построчно, не суть важно) и потом уже я планирую из этой строки выдернуть регуляркой нужные мне данные.
короч, проблема - нихрена не выходит. Есть решение?
я делаю примерно так:

file = req.get(url, verify=False).content
file = BytesIO(file)
file = file.read()
file = file.decode('utf-8', 'ignore')


(понятно, что можно завернуть одно в другое, расписал для простоты понимания)

но не выходит каменный цветок - какая-то хрень, а не нормальные символы
потому что ты бинарный файл как текстовый читаешь, чтобы считать док нужна отдельная либа
источник

KM

Konstantin Mohov in Python для анализа данных
Сергей Ильин
а есть что-то нормально работающее, только с .doc, а не .docx?
Тоже не встречал.
источник

KM

Konstantin Mohov in Python для анализа данных
Lyubov K.
Да, простите. Выделить ключевые слова нужно. Есть список.

Их найти в файле и выделить цветом. Сейчас проблема именно как цветом обозначить
Насколько знаю, когда читаете документ у него есть параграфы. то есть будет
doc = Docx('myword.docx')
for par in doc.paragraphs:
   # тут у параметра par должен быть параметр "run", можно посмотреть функцией dir() - что вообще там есть
   print(dir(par))
   for r in par.runs:
       r.font.color.rgb = RGBColor(0x3f, 0x2c, 0x36)
источник

KM

Konstantin Mohov in Python для анализа данных
это первый вариант. второй вариант, не очищая ворд от XML тегов, найти ваши слова, и изменить теги таким образом, как написано в доке
источник
2020 November 22

BA

Badma Antonov in Python для анализа данных
И что там надо участвовать?
источник

BA

Badma Antonov in Python для анализа данных
Или написать напрямую Илону Маску?
источник

LT

Lan Tal in Python для анализа данных
Как они находят этот чат?))
источник

AD

Albus Dumbledore in Python для анализа данных
А я думал они уже бросили это дело...
источник
2020 November 23

AB

Anatolii Balakiriev in Python для анализа данных
@ax_makarov , Алексей, +1 спам👆
источник

AM

Andrey Moldovan in Python для анализа данных
зжБбжжббзб
источник

MD

Mikhail Damaskin in Python для анализа данных
Подскажите, пожалуйста, как подключиться по sftp к серверу с приватным ключом?
У меня есть логин, хост, порт, приватный ключ
источник

AS

Alex Savva in Python для анализа данных
Mikhail Damaskin
Подскажите, пожалуйста, как подключиться по sftp к серверу с приватным ключом?
У меня есть логин, хост, порт, приватный ключ
public key на сервере прописан?
источник