Size: a a a

2021 April 07
PythonDigest
Отбор признаков в задачах машинного обучения. Часть 1
https://habr.com/ru/post/550978/?utm_campaign=550978&utm_source=habrahabr&utm_medium=rss

Часто наборы данных, с которыми приходится работать, содержат большое количество признаков, число которых может достигать нескольких сотен и даже тысяч. При построении модели машинного обучения не всегда понятно, какие из признаков действительно для неё важны (т.е. имеют связь с целевой переменной), а какие являются избыточными (или шумовыми). Удаление избыточных признаков позволяет лучше понять данные, а также сократить время настройки модели, улучшить её точность и облегчить интерпретируемость.
источник
2021 April 08
PythonDigest
источник
PythonDigest
Django 3.2 - News on compressed fixtures and fixtures compression
https://www.paulox.net/2021/04/06/django-32-news-on-compressed-fixtures-and-fixtures-compression/
источник
PythonDigest
источник
PythonDigest
Как сделать полнотекстовую поисковую машину на 150 строках кода Python
https://habr.com/ru/post/551000/?utm_campaign=551000&utm_source=habrahabr&utm_medium=rss

Полнотекстовый поиск — неотъемлемая часть нашей жизни. Разыскать нужные материалы в сервисе облачного хранения документов Scribd, найти фильм в Netflix, купить туалетную бумагу на Amazon или отыскать с помощью сервисов Google интересующую информацию в Интернете — наверняка вы сегодня уже не раз отправляли похожие запросы на поиск нужной информации в невообразимых объёмах неструктурированных данных. И что удивительнее всего — несмотря на то что вы осуществляли поиск среди миллионов (или даже миллиардов) записей, вы получали ответ за считанные миллисекунды.
источник
PythonDigest
Сравнение ассортимента блюд трёх ресторанов Санкт-Петербурга
https://habr.com/ru/post/551294/?utm_campaign=551294&utm_source=habrahabr&utm_medium=rss

Мне никогда раньше не приходилось иметь дело с парсингом данных из интернета. Обычно все данные для работы (аналитик данных) приходят из выгрузок компании с использованием простого внутреннего интерфейса, либо формируются sql-запросами к таблицам напрямую из хранилища, если нужно что-то более сложное, чем “посмотреть выручку за предыдущий месяц”. 
источник
PythonDigest
The k-Nearest Neighbors (kNN) Algorithm
https://realpython.com/knn-python/
источник
2021 April 09
PythonDigest
Python Bytes: #228 Supreme Court decides API copyright battle
https://pythonbytes.fm/episodes/show/228/supreme-court-decides-api-copyright-battle
источник
2021 April 10
PythonDigest
Липкие сессии для самых маленьких [Часть 1]
https://habr.com/ru/post/548610/?utm_campaign=548610&utm_source=habrahabr&utm_medium=rss

Липкие сессии (Sticky-session) — это особый вид балансировки нагрузки, при которой трафик поступает на один определенный сервер группы. Как правило, перед группой серверов находится балансировщик нагрузки (Nginx, HAProxy), который и устанавливает правила распределения трафика между доступными серверами.
источник
PythonDigest
источник
PythonDigest
Обработка и анализ текстов на Python и Spark NLP
https://habr.com/ru/post/551518/?utm_campaign=551518&utm_source=habrahabr&utm_medium=rss

В наше время без анализа и обработки текстов, не обходится ни один проект, и так уж сложилось что Python обладает широким спектром библиотек и фреймворков для задач NLP. Задачи могут быть как тривиальные: анализ тональности(sentiment) текста, настроение, распознавание сущностей(NER) так и более интересные как боты, сравнение диалогов в саппорт-чатах - мониторить следует ли ваша тех.поддержка или сейлз текстовым скриптам, или постобработка текста после SpeechToText.
 
источник
PythonDigest
Test Automation Strategy for REST APIs with Python — Tooling
https://www.ludeknovy.tech/blog/test-automation-strategy-for-rest-api-with-python/

Overview of open source tooling for REST APIs testing
источник
PythonDigest
[Видео] Effective API schemas testing
https://youtu.be/VVLZ25JgjD4

Эффективное тестирование API схем при помощи property-based тестирования
источник
PythonDigest
Talk Python to Me: #311 Get inside the .git folder
https://talkpython.fm/episodes/show/311/get-inside-the-.git-folder

Audio
источник
2021 April 11
PythonDigest
HMM: ловим мошеннические транзакции
https://habr.com/ru/post/551618/?utm_campaign=551618&utm_source=habrahabr&utm_medium=rss

Австрийский банк. У него много клиентов, у клиентов открыт счет в этом банке. В течении года клиент тратит средства со своего счета. Ходит в магазины, гасит коммунальные платежи и пр. Каждое списание денег со счета назовем транзакцией. Дана последовательность транзакций за определенное время (скажем год). Надо обучить машину, чтобы она начала проверять новые транзакции как достоверные или подозрительные. И выдавала предупреждение в последнем случае. Для решения задачи надо использовать Hidden Markov Model.
источник
PythonDigest
The Real Python Podcast – Episode #55: Getting Started With Refactoring Your Python Code
https://realpython.com/podcasts/rpp/55/

Audio
источник
PythonDigest
источник
2021 April 12
PythonDigest
#python #pydigest

Сборник Python новостей уже перед вами.

В выпуске Python Дайджест вы найдете:

- Django 3.2
- Отбор признаков в задачах машинного обучения. Часть 1
- Оптимизация рабочего процесса при помощи fzf
- Как сделать полнотекстовую поисковую машину на 150 строках
- HMM: ловим мошеннические транзакции
- Сравнение ассортимента блюд трёх ресторанов Санкт-Петербурга
- Impala для Python-разработчика на примере определения фрода при анализе трафика в маркетинговой платформе
- PyCharm 2021.1
- [Видео] Effective API schemas testing

Заходите в гости - https://pythondigest.ru/issue/381/
Присылайте интересные новости через форму на сайте.
источник
PythonDigest
Creating Python desktop applications with QtQuick/QML (PyQt5/PyQt6/PySide2/PySide6)
https://www.learnpyqt.com/tutorials/qml-qtquick-python-application/
источник
2021 April 13
PythonDigest
источник