Назва: Опануй числа! Наука про дані для нефахівців
Автор(и): Анналін Нг, Кеннет Су
Видавництво: "Фабула", — 2024
Опис:
Оригінал (англ.): "Numsense! Data Science for the Layman: No Math Added" by Annalyn Ng, Kenneth Soo
Сучасний світ перенасичений інформацією, зокрема даними. Величезною кількістю даних! Як серед них не загубитися? Як їх осягнути? Як використовувати в повсякденному житті та різноманітних галузях? Як аналізувати? Як інтерпретувати?
«Опануй числа!» — це зручний графічний опис ключових алгоритмів обробки даних, корисний як вступ для новачків у цій галузі, огляд для ділових людей, що працюють з аналітиками, чи стимул для тих, хто прагне знати, що відбувається з їхніми даними.
Про авторів:
Анналін Нг (Annalyn Ng) — спеціалістка зі штучного інтелекту в Google Cloud. Її кар’єра в галузі науки про дані охоплює комерційний і державний сектори; вона працювала в Amazon, Disney Research, а також в уряді Сінгапура, зокрема міністерстві праці та міністерстві оборони. Анналін отримала ступінь бакалавра в Мічиганському університеті (Анн-Арбор), де вона також працювала на волонтерських засадах викладачем статистики для студентів. Згодом здобула ступінь магістра в Кембриджському університеті.
Кеннет Су (Kenneth Soo) має 7-річний досвід застосування науки про дані в державній політиці в уряді Сінгапура, а зараз очолює командуз управління двосторонніми відносинами з європейськими партнерами. Під час пандемії COVID-19 він керував загальнонаціональними ініціативами з діджиталізації для сінгапурської програми «Розумна нація» та Офісу цифрового уряду, зокрема впровадженням системи відстеження контактів. Кеннет Су отримав ступінь магістра статистики в Стенфордському університеті та був найкращим студентом протягом усіх трьох років навчання на бакалавраті з математики, операційних досліджень, статистики та економіки (MORSE) в Університеті Ворика.
Зміст:
- Вступне слово
- Передмова
- Чому наука про дані?
- 1. Коротко про основи
- 1.1. Підготовка даних
- 1.2. Відбір алгоритму
- 1.3. Налаштування параметрів
- 1.4. Оцінювання результатів
- 1.5. Підсумки
- 2. Кластеризація методом k-середніх
- 2.1. Визначення кластерів клієнтів
- 2.2. Приклад. Особисті профілі кіноглядачів
- 2.3. Визначення кластерів
- 2.4. Обмеження
- 2.5. Підсумки
- 3. Метод головних компонент
- 3.1. Дослідження поживної цінності продуктів харчування
- 3.2. Головні компоненти
- 3.3. Приклад. Аналіз груп продуктів харчування
- 3.4. Обмеження
- 3.5. Підсумки
- 4. Асоціативні правила
- 4.1. Виявлення моделей закупівель
- 4.2. Підтримка, достовірність і підйом
- 4.3. Приклад. Трансакції з продажу продуктів харчування
- 4.4. Принцип апріорі
- 4.5. Обмеження
- 4.6. Підсумки
- 5. Аналіз соціальних мереж
- 5.1. Відображення взаємозв’язків
- 5.2. Приклад. Геополітика в торгівлі зброєю
- 5.3. Лувенський метод
- 5.4. Алгоритм Page Rank
- 5.5. Обмеження
- 5.6. Підсумки
- 6. Регресійний аналіз
- 6.1. Побудова лінії тренду
- 6.2. Приклад. Прогнозування цін на житло
- 6.3. Градієнтний спуск
- 6.4. Коефіцієнти регресії
- 6.5. Коефіцієнти кореляції
- 6.6. Обмеження
- 6.7. Підсумки
- 7. Метод k-найближчих сусідів і виявлення аномалій
- 7.1. Експертиза харчових продуктів
- 7.2. Птахи одного польоту
- 7.3. Приклад. Різниця в дистиляції вина
- 7.4. Виявлення аномалій
- 7.5. Обмеження
- 7.6. Підсумки
- 8. Метод опорних векторів
- 8.1. «Ні» чи «О, ні»?
- 8.2. Приклад. Прогнозування серцево-судинних захворювань
- 8.3. Визначення оптимальної межі
- 8.4. Обмеження
- 8.5. Підсумки
- 9. Дерево ухвалення рішень
- 9.1. Прогнозування виживання в умовах катастрофи
- 9.2. Приклад. Урятування з «Титаніка»
- 9.3. Створення дерева ухвалення рішень
- 9.4. Обмеження
- 9.5. Підсумки
- 10. Випадкові ліси
- 10.1. Мудрість натовпу
- 10.2. Приклад. Прогнозування злочинності
- 10.3. Ансамблі
- 10.4. Бутстрепова агрегація (Бегінг)
- 10.5. Обмеження
- 10.6. Підсумки
- 11. Нейропні мережі
- 11.1. Створення мозку
- 11.2. Приклад. Розпізнавання рукописних цифр
- 11.3. Компоненти нейронної мережі
- 11.4. Правила активації
- 11.5. Обмеження
- 11.6. Підсумки
- 12. А/В-тестування та багаторукі бандити
- 12.1. Основи A/В тестування
- 12.2. Обмеження A/В тестування
- 12.3. Стратегія зменшення епсилон
- 12.4. Приклад. Багаторукі бандити
- 12.5. Цікавий факт. Ставка на переможця
- 12.6. Обмеження стратегії зменшення епсилон
- 12.7. Підсумки
- Додатки
- Додаток А. Огляд алгоритмів навчання без учителя
- Додаток Б. Огляд алгоритмів навчання з учителем
- Додаток В. Список параметрів для налаштування
- Додаток Г. Інші метрики оцінювання
- Глосарій
- Джерела даних і посилання
- Про авторів
|