Название: Основы глубокого обучения. Создание алгоритмов для искусственного интеллекта следующего поколения
Автор(ы): Нихиль Будума, Николас Локашо
Издательство: "Манн, Иванов и Фербер", — 2020
Описание:
Оригинал (англ.): "Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms" by Nikhil Buduma, Nicholas Locascio
Глубокое обучение — машинное обучение, которое строится на идее обучения через примеры. Эта книга разбирает основные идеи этой сложной отрасли изучения искусственного интеллекта. Авторы ставят цель сформировать целостное представление о том, как решаются задачи в области глубокого обучения, какие понятия используются в этой среде и как внедрять соответствующие алгоритмы.
С оживлением нейросетей в 2000-е годы глубокое обучение стало чрезвычайно активно развивающейся областью исследования, прокладывающей путь современному машинному обучению. Эта книга предлагает примеры и толкования, которые помогут понять основные идеи в этой сложной отрасли знаний. Такие крупные компании, как Google, Microsoft и Facebook, обратили внимание на глубокое обучение и активно увеличивают штат своих подразделений, работающих в этой области. Для всех остальных оно остается все еще сложным, комплексным и трудноуловимым предметом. Исследования переполнены непонятным жаргоном, а разрозненные учебники, имеющиеся в сети, не дают должного представления о том, как решаются задачи в этой области. Цель этой книги — заполнить данный пробел.
Целевая аудитория:
Для всех, кто интересуется или занимается глубоким обучением.
ЦИТАТЫ ˅
Глубокое обучение
Создание машин с искусственным интеллектом требует решения сложнейших вычислительных задач в истории, которые, однако, наш мозг способен раскусить в доли секунды. Для этого нужно разработать иной способ программирования компьютеров при помощи методов, которые появились в основном в последние 10 лет.
Сложность моделей
Одна из главных проблем искусственных нейросетей — чрезвычайная сложность моделей. Рассмотрим сеть, которая получает данные от изображения 28x28 пикселов, передает их в два скрытых слоя по 30 нейронов, а затем в слой с мягким максимумом из 10 нейронов. Общее число ее параметров составляет около 25 тысяч.
Муравей
Представьте себе, что вы — муравей, живущий в континентальной части США. Вас выбросили где-то в случайном месте, и ваша задача — найти самую низкую точку на этой поверхности. Как это сделать?
Математика
Для математически подкованных читателей подробнее расскажем о том, как гессиан ограничивает оптимизацию только с помощью градиентного спуска. Определенные свойства матрицы Гессе (реальность и симметричность) позволяют успешно определить вторую производную (которая аппроксимирует кривизну поверхности) при движении в определенном направлении.
Локальная инвариантность
Локальная инвариантность — очень полезное свойство, если нас больше интересует то, есть ли вообще данный признак, а не то, где именно он находится. Но в больших объемах она может повредить способности нашей сети переносить важную информацию.
РНС
В период оптимальной работы модель демонстрирует эффективные результаты и показывает на тестовом наборе данных аккуратность примерно 86%. Поздравляем! Вы создали свою первую рекуррентную нейронную сеть.
Об авторе:
Нихиль Будума (Nikhil Buduma) исследует машинное обучение в MIT. Он золотой медалист нескольких международных олимпиад по биологии.
СОДЕРЖАНИЕ ˅
|