Название: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных
Автор(ы): Дэвид Хэнд
Издательство: "Альпина Паблишер", — 2021
Описание:
Оригинал (англ.): "Dark Data: Why What You Don’t Know Matters" by David J. Hand
- Данные, которые мы упускаем, становятся причиной фатальных ошибок
- Что приводит к появлению темных данных и как этого не допустить
- Как обернуть незнание себе во благо, учась принимать более правильные решения и повышая эффективность своих действий
Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем?
Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, о результатах медицинского исследования, которые намеренно утаили или случайно исказили, или о данных, ставших темными из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект темных данных и как их можно обратить себе на пользу.
Целевая аудитория:
Книга будет интересна широкому кругу читателей, интересующихся дата-сайенс, программированием и статистикой.
ЦИТАТЫ ˅
«Темные данные скрыты от нас, и этот факт означает, что мы рискуем недооценить опасность, сделать неправильный вывод и принять неверное решение. Иначе говоря, наше неведение становится причиной ошибок».
* * *
«Темные данные ведут себя аналогично темной материи: мы не видим их, они не обнаруживаются, но все же способны оказывать существенное влияние на наши выводы, решения и действия. И, как я покажу на дальнейших примерах, если не осознать саму вероятность существования чего-то неизвестного, то последствия такой слепоты могут быть катастрофическими и даже фатальными».
* * *
«Хотя иметь много данных полезно, большие данные, то есть объем, — это еще далеко не все. И то, чего вы не знаете, те данные, которых у вас нет, могут быть важнее для понимания происходящего, чем те, которыми вы располагаете».
ОТ АВТОРА ˅
Перед вами необычная книга. Почти все, что издается на эту тему — будь то популярная литература о больших или открытых данных, обработке данных или пособия по статистическому анализу, — основывается на том, что у вас уже есть. Речь идет об информации, хранящейся в компьютере, ящиках рабочего стола или аудио-, видеозаписях вашего смартфона. Но эта книга совсем о другом. Она о данных, которых у вас нет. Возможно, вы пытаетесь получить их прямо сейчас или когда-то безуспешно пытались сделать это, а может быть, ошибочно полагаете, что они у вас имеются. Как бы то ни было, речь пойдет о данных, которых у вас нет.
Я утверждаю и далее продемонстрирую это на многих примерах, что отсутствующие данные важны не менее тех, которыми мы располагаем. Вы сможете сами убедиться, что неизвестные нам данные являются причиной многих заблуждений, порой имеющих катастрофические последствия. Я покажу, как и почему это происходит. Затем я расскажу, как этого можно избежать — на что именно стоит обращать внимание, чтобы обойти неприятности. А в завершение, когда вы поймете, как возникают темные данные и как они создают нам проблемы, я покажу, как с их помощью перевернуть с ног на голову традиционное представление об анализе данных и, если вы достаточно проницательны, глубже вникнуть в свою область, улучшить процесс принятия решений и выбора действий.
Об авторе:
Дэвид Хэнд (David J. Hand) — британский статистик, автор нескольких книг о статистике. Член Британской академии, президент Королевского статистического общества. Хэнд был удостоен звания офицера Ордена Британской империи за заслуги в области исследований и инноваций.
СОДЕРЖАНИЕ ˅
|