Size: a a a

2019 September 10
PythonDigest
Jupyter Notebook для начинающих: учебник
https://webdevblog.ru/jupyter-notebook-dlya-nachinajushhih-uchebnik/

Jupyter Notebook – невероятно мощный инструмент для интерактивной разработки и представления проектов в области наук о данных.
источник
PythonDigest
источник
2019 September 11
PythonDigest
Сравнение производительности numpy и pandas
https://zerowithdot.com/python-numpy-and-pandas-performance/
источник
PythonDigest
Podcast.__init__: Python Powered Journalistic Freedom With SecureDrop
https://www.pythonpodcast.com/securedrop-whistleblower-platform-episode-228/

Audio
источник
PythonDigest
источник
PythonDigest
источник
PythonDigest
AirGesture - Play games without touching keyboard
http://github.com/vietnguyen1991/AirGesture
источник
PythonDigest
Угадай меня, если сможешь: прогнозирование рейтинга фильма до его выхода
https://habr.com/ru/post/466967/?utm_campaign=466967&utm_source=habrahabr&utm_medium=rss

Недавно мне на глаза попался датасет на Kaggle (https://www.kaggle.com/rounakbanik/the-movies-dataset) с данными о 45 тысячах фильмов с Full MovieLens Dataset. Данные содержали не только информацию об актерах, съемочной команде, сюжете и т.п., но и оценки, выставленные фильмам пользователями ресурса (26 миллионов оценок от 270 тыс.пользователей).


Стандартная задача для таких данных — это рекомендательная система. Но мне в голову почему-то пришло прогнозирование рейтинга фильма на основе информации, доступной до его выхода. Я не знаток кинематографа, и поэтому обычно ориентируюсь на рецензии, выбирая что посмотреть из новинок. Но ведь рецензенты тоже несколько biased — они-то смотрят гораздо больше разных фильмов, чем рядовой зритель. Поэтому спрогнозировать, как оценит фильм обычная публика, показалось занятным.
источник
PythonDigest
Хабрастатистика: как живет Хабр без geektimes
https://habr.com/ru/post/466963/?utm_campaign=466963&utm_source=habrahabr&utm_medium=rss

Данная статья является логическим продолжением рейтинга Лучших статей Хабра за 2018 год (https://habr.com/ru/post/441236/). И хотя год еще не закончился, но как известно, летом произошли изменения в правилах, соответственно, стало интересно посмотреть, повлияло ли это на что-нибудь.
источник
2019 September 12
PythonDigest
Отслеживание трафика на Git репозиторий через Google Cloud Platform. Часть 1
https://medium.com/python4you/monitoring-traffic-of-your-github-repositories-using-python-and-google-cloud-platform-part-1-1a1f14870041?source=rss----5527f69f4771---4
источник
PythonDigest
Скоро Django 3
https://pythonz.net/articles/265/

Не так долго осталось ждать декабря, на который запланирован выпуск новой версия каркаса для веб-разработки Django. Уже сейчас можно ознакомиться с альфа версией готовящегося выпуска (https://pypi.org/project/Django/3.0a1/).


Рассмотрим, чего нам ждать от новинки.
источник
PythonDigest
Сравнение популярных CLI-библиотек для Python: click, cement, fire и другие
https://habr.com/ru/post/466999/?utm_campaign=466999&utm_source=habrahabr&utm_medium=rss

Для удобства чтения обзор разделён на два поста: в первом сравнивается шесть самых популярных библиотек, во втором — менее популярные и более специфичные, но всё же заслуживающие внимания.
источник
PythonDigest
Test and Code: 87: Paths to Parametrization - from one test to many
https://testandcode.com/87

Audio
источник
PythonDigest
источник
PythonDigest
JWT: Атака на цифровую подпись VS MAC-атака
https://habr.com/ru/post/467015/?utm_campaign=467015&utm_source=habrahabr&utm_medium=rss

Во время последнего пентеста я наткнулся на схему авторизации на основе JSON Web Token (https://en.wikipedia.org/wiki/JSON_Web_Token) (или просто JWT). JWT состоит из трех частей: заголовок, полезная нагрузка, информация для верификации. Первая часть заголовка содержит имя алгоритма, который в дальнейшем будет использоваться для верификационной части JWT. Это опасно, так как злоумышленник может изменить эту информацию и таким образом (возможно) проконтролировать, какая схема будет использоваться сервером для проверки.
источник
PythonDigest
Проектирование дашбордов для веб-аналитики e-commerce сайта. Часть 3: SEO-канал
https://habr.com/ru/post/467019/?utm_campaign=467019&utm_source=habrahabr&utm_medium=rss

Для аналитики динамики позиций поисковых фраз потребуется выгрузки из Яндекс.Вебмастера (https://webmaster.yandex.ru/welcome/) и Google Search Console (https://search.google.com/search-console/about). Для оценки «полезности» прокачивания позиции поисковой фразы будут полезны данные о частотности. Их можно получить из Яндекс.Директа (https://direct.yandex.ru/) и Google Ads (https://ads.google.com/). Ну а для анализа поведения технической стороны сайта воспользуемся Page Speed Insider (https://developers.google.com/speed/pagespeed/insights/?hl=RU).
источник
PythonDigest
Проектирование дашбордов для веб-аналитики e-commerce сайта. Часть 4: Youtube-канал
https://habr.com/ru/post/467035/?utm_campaign=467035&utm_source=habrahabr&utm_medium=rss

Легко посчитать, сколько трафика пришло с ютуб-канала. К примеру, зайти в счетчик Яндекс Метрики или Google Analytics. А вы попробуйте узнать, что происходило с вашим видео на канале. Кто его посмотрел, кто добавил в фавориты, а кто дислайкнул. Вот для выгрузки таких данных и потребуется скрипт на Python.
источник
PythonDigest
источник
2019 September 13
PythonDigest
Анализ эмоциональной окраски отзывов с Кинопоиска
https://habr.com/ru/post/467081/?utm_campaign=467081&utm_source=habrahabr&utm_medium=rss

Обработка естественного языка (NLP) является популярной и важной областью машинного обучения. В данном хабре я опишу свой первый проект, связанный с анализом эмоциональной окраски кино отзывов, написанный на Python. Задача сентиментного анализа является довольно распространенной среди тех, кто желает освоить базовые концепции NLP, и может стать аналогом 'Hello world' в этой области.


В этой статье мы пройдем все основные этапы процесса Data Science: от создания собственного датасета, его обработки и извлечения признаков с помощью библиотеки NLTK и наконец обучения и настройки модели с помощью scikit-learn. Сама задача состоит в классификации отзывов на три класса: негативные, нейтральные и позитивные.
источник
PythonDigest
Python Bytes: #147 Mocking out AWS APIs
https://pythonbytes.fm/episodes/show/147/mocking-out-aws-apis

Audio
источник