Как представить сложную информацию простыми образами
Автор: Нана Альгарад
Источник: Searchengines.ru
Где найти и как проверить данные? Что использовать для их извлечения и преобразования в удобный для обработки формат? Какой тип визуализации предпочесть, как графически обнаружить и показать зависимости, как написать легенду? Эти — и множество других вопросов рассматривает в своей книге магистр статистики, постоянный автор FlowingData Нейтан Яу (Nathan Yau).
В активе автора — кандидатская диссертация о визуализации персональных данных, книга «Data Points: visualization that means something» и работа с группами компаний New York Times, CNN, Mozilla и SyFy. Сотрудничая со СМИ, Нейтан Яу убедился, что инфографика отлично подходит не только для анализа данных, но и для сторителлинга. Читателям своей новой книги "Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами" (Visualize this. The FlowingData guide to design, visualization, and statistics) Яу предлагает освоить приемы визуализации данных — от элементарных статичных прямоугольников до довольно серьезных анимированных работ для Сети.
«Искусство визуализации» в большей степени посвящено темам подготовки и создания графических отображений данных, нежели собственно дизайну. «Наводить красоту» Яу предпочитает с помощью Adobe Illustrator; новичкам его советы вполне пригодятся. И это — чуть ли не единственная платная программа, которую автор предлагает для постоянного пользования. Весь остальной софт — с открытым исходным кодом.
Эта книга если не самоучитель, то практическое руководство. Автор на конкретных примерах шаг за шагом объясняет, что и как нужно делать, приводит отрывки кодов, разбирает их построчно и предлагает читателю повторить эти действия.
«В течение следующих нескольких абзацев вы впервые в жизни ощутите вкус создания кодов, — обращается Яу к читателям. — Многие люди предпочитают оставаться в рамках интерфейсов, где все делается одним кликом, но доверьтесь мне. Достаточно освоить самую малую толику программистских умений, и вы сможете открыть для себя целый мир новых возможностей в работе с данными».
Он предлагает читателю проделать полный путь создателя инфографики, от поиска, подбора и проверки данных до грамотной обработки готовых объектов — смысловой и графической. Ведь задача — методами визуализации «рассказать историю», сделать так, чтобы неподготовленный зритель смог без усилий понять смысл диаграммы.
Тем, кого возможность «открыть целый мир» не вдохновляет, автор предлагает использовать готовые решения — Excel, Google Spreadsheets или Many Eyes, и сравнивает их достоинства и недостатки. Для скрейпинга он рекомендует обратиться к Needlebase и PDF-конвертеру Able2Extract.
Помимо «учебных» данных, заготовленных на FlowingData, Яу дает ссылки на ресурсы со статистической информацией по темам.
Для извлечения данных и приведения их в удобный формат Яу предлагает использовать Python и библиотеку под названием Beautiful Soup. При этом он ориентируется на абсолютных новичков в программировании как таковом, объясняя действия, что называется, на пальцах, легко и доступно. Вообще, редко кто так «вкусно» пишет на подобные темы.
Нейтон Яу — большой почитатель и пропагандист проекта R для создания информационной графики. Это программная среда для статистических вычислений с открытым исходным кодом и очень хорошим графическим функционалом. По словам Яу, большинство статистиков предпочитают работать именно с R, т.к. язык специально создавался для анализа данных — статистиками и для статистиков. Существует множество R-пакетов, которые позволяют создавать инфографику с помощью всего нескольких строк кода. Загрузите ваши данные в R, и вы получите график или диаграмму, написав всего одну строчку, обещает автор, и детально разъясняет читателям, как эту строчку написать. При всей любви к R Яу признает, что он мало подходит для интерактивной графики и анимации, — Flash или Processing справятся с этим «куда элегантней». Еще есть Protovis — бесплатная библиотека, поддерживаемая Stanford Visualization Group, которая дает возможность создавать визуальные объекты, специально предназначенные для Сети, в том числе интерактивные.
В «Искусстве визуализации» Яу дает примеры и рекомендации по созданию инфографики от самых привычных и простых вариантов — круговых, кольцевых, столбцовых, штабельных диаграмм, точечных и пузырьковых графиков, — до куда менее распространенных, таких, как «лица Чернова» или диаграмма Найтингейл. Да, прославившаяся на Крымской войне британская медсестра Флоренс Найтингейл была способным математиком и статистиком. Отдельные главы книги посвящены маппингу — визуализации пространственных отношений, включая создание интерактивных и анимированных карт с ActionScript и Flash, визуализации пропорций и зависимостей — корреляции, сравнению и распределению; работе с несколькими переменными и т.д.
«Помните: данные — это отражение реальной жизни, — обращается к читателям Нейтан Яу. — Изучайте данные, и вы сможете рассказывать истории, о которых люди даже не догадываются, но которые им не терпится услышать. Теперь вы можете им это сказать. Наслаждайтесь».
Книга пригодится всем почитателям data-арта и ценителям графических историй, основанных на данных, кто хочет сменить статус — на статус их создателя.
|