В Великобритании
упустили 16,000 кейсов covid-19 из-за ошибки в экселе: судя по всему, в одной из лабораторий достигли максимального размера файла (около миллиона строк в новых версиях и всего 65,000 – в старых), так что лишние данные просто обрезались. Несмотря на то, что цифры заболеваемости ежедневно анализируют миллионы людей по всему миру, подвох заметили далеко не сразу.
Забавно подумать о том, сколько важных решений в мире принимается на основании моделей, построенных в экселе – часто неуклюжих, неэффективных, а иногда и просто ошибочных. Представим себе следующую историю: джентльмены в дорогих костюмах обсуждают перспективы нового порта в Джибути – многомиллиардного проекта, способного определить будущее целого региона. В их дискуссии будет много разных аргументов, но главный из них – результаты сложной финансовой модели, которую команда банка готовила последние несколько недель.
Несмотря на то, что участие в сделке принимает СЕО банка и первые лица Джибути, магическая цифра окупаемости появится только после того, как молодой аналитик руками вобьет в экселе формулу: INDEX, MATCH, SUMIF… Ему 23 года, он изучал в Йеле античную историю, но решил, что раз уж в нашем несправедливо устроенном мире нельзя заработать себе на жизнь чтением Плиния-старшего, то можно хотя бы получить от жизни максимум, зарабатывая 200 тысяч долларов в год в инвестбанке через пару лет после выпуска. Он, конечно ошибался: брать «максимум» от жизни сложно, если у тебя остается только 8 свободных часов в сутки, большую часть которых нужно потратить на сон. На часах пять часов утра, и дрожащие после четвертой банки энергетика руки предательски соскальзывают с нужной клавиши: в модели появляется лишний ноль, а порт в Джибути, похоже, оказывается нерентабельным.
Такое, кстати, случалось: в 2012 году Morgan Stanley
потерял 6 миллиардов долларов (это примерно 10 годовых бюджетов Ивановской области), потому что аналитик использовал в формуле сумму двух ячеек, вместо их среднего. Еще несколько десятков таких же кейсов наверняка не стали достоянием публики, а еще о сотнях не узнали даже те, кто принимал участие в сделке – кому охота копаться в модели после того, как решение уже принято.
Сложные модели и расчеты обычно кажутся внешнему наблюдателю объективными и безошибочными, особенно если вы не понимаете, как они работают. Рейтинг Doing Business был важным ориентиром для политиков по всему миру: успехи Грузии приводили в качестве примера для всех молодых демократий, а Путин требовал от правительства войти в топ-20 рейтинга в рамках своих майских указов 2012 г.
обнаружили некие
irregularities, так что рейтинг отозвали для проверки. Учитывая репутационные издержки такого решения, похоже, что проблемы возникли действительно серьезные.
Сложности с данными возникают даже у ученых. Тут примеров тысячи (вы наверняка слышали, что едва ли не половина исследований в социальных науках просто не воспроизводятся), но есть один совсем забавный: в 2014 году Science, один из самых престижных научных журналов в мире, опубликовал статью: оказывается, разговор с агитатором-геем на тему однополых браков может серьезно повлиять на взгляды человека по этому вопросу. Исследование вызвало много шума, вот только чуть позже
оказалось, что аспирант сфальсифицировал данные – никогда не проводил опроса и просто выдумал результаты. Статью, конечно, отозвали, аспиранта осудили, но осадочек, что называется, остался.
Одним словом,
everybody lies.