
Обрисую широкими мазками, т.к. подробности защищены NDA.
Я работаю в команде CSE (Custom Search Engine). Основное его применение – гугловый поиск по сайту. Я уверена, вы видели на некоторых сайтах поисковые строки, подписанные Powered by Google. Вот это оно.
Это некий сервис, который пользователи покупают за деньги. И, конечно же, у него есть свои правила использования.
К сожалению, они постоянно нарушаются, а хорошего инструмента для поиска потенциальных нарушителей нет (сейчас все смотрят на метрики и ищут "что-то странное"). Вот этот инструмент я и пишу.
О смешном: чтобы искать этих нарушителей, мне нужен доступ к логам. Логи – пользовательская информация, она очень сильно защищена, стажёров к ней не пускают. Поэтому мой хост генерит для меня фейковые данные, чтобы на них тренироваться :)