П’ять рекомендацій для успішного запуску машинного навчання у вашому бізнесі
Ерік Сігел (Eric Siegel), консультант, спікер і екс-викладач Колумбійського університету, де він отримав нагороду «Видатний факультет» за викладання аспірантських курсів із комп’ютерних наук у сфері машинного навчання та штучного інтелекту, поділилися п’ятьма ключовими інсайтами зі своєї нової книги «The AI Playbook: Mastering the Rare Art of Machine Learning Deployment» («Посібник зі штучного інтелекту: оволодіння рідкісним мистецтвом розгортання машинного навчання»).

1. Світ аж надто захоплюється машинним навчанням, що насправді перешкоджає його розгортанню
Ми фетишизуємо основну технологію — дивовижну здатність вчитися на основі даних, що відволікає нас від ретельного практичного планування, необхідного для її запуску. Ми захоплені тим, як це працює, самою ідеєю, а не тим, що це дасть вам — яку цінність матиме.
Так, машинне навчання (ML) — це дуже круто. Це найважливіша у світі технологія загального призначення. Вона може покращити практично будь-який масштабний процес. Але в певному сенсі воно стало занадто «гарячим» для свого ж блага. Попри весь галас навколо технології, яку часто називають «штучним інтелектом», деталі того, як її впровадження покращує бізнес-операції, часто залишаються поза увагою.
Хайп вводить людей в оману, підживлюючи поширену хибну думку, яка називається «помилкою машинного навчання» (The Machine Learning Fallacy). Ось у що люди помилково вірять: оскільки алгоритми ML працюють — їм вдається генерувати прогнозні моделі, які відповідають новим, небаченим ситуаціям (що є дивовижним і правдивим), — моделі, які вони генерують, мають внутрішню цінність (неправда).
Цінність машинного навчання проявляється лише тоді, коли його запускають для впровадження організаційних змін. Створивши модель за допомогою ML, ви розумієте її потенційну цінність лише тоді, коли розгортаєте її для активного покращення діяльності. Поки модель не використовується для зміни роботи вашої організації, вона в буквальному сенсі марна. Модель не вирішує жодних бізнес-проблем сама по собі, і вона не збирається розгортатися сама по собі. Машинне навчання може стати проривною технологією, але тільки якщо ви будете прориватися разом із ним.
На жаль, бізнесу часто не вдається подолати «культурний розрив» між бізнесом і технологіями, тобто розрив між фахівцями з аналізу даних і стейкхолдерами бізнесу. Багато бізнес-професіоналів схильні відкидати деталі як «занадто технічні» — частково тому, що вони спокусилися на цю приголомшливу технологію як на панацею, що сама по собі розв’язує проблеми. Вони звертаються до спеціалістів з аналізу даних, щоб дізнатися про особливості проєкту. Але коли вони врешті-решт стикаються з операційними змінами, які може спричинити розгорнута модель, вони виявляються захопленими зненацька і не наважуються змінювати операції, які є ключовими для прибутковості компанії.
Як результат, лише 22% аналітиків даних стверджують, що їхні моделі, розроблені для впровадження нового процесу або можливості, зазвичай розгортаються. Це так іронічно: люди, як правило, більше зосереджуються на технології, ніж на тому, як її застосувати, що нагадує захоплення розробкою ракети, а не її запуском!
2. Ретроспективне планування — ключ до успішного запуску машинного навчання
Першим кроком у практиці bizML є точне планування того, як машинне навчання буде впроваджуватися для покращення операцій. Це простий і водночас напрочуд мало використовуваний прийом.
Яскравий приклад — компанія UPS. Вона використовувала ML для оптимізації доставки 16 мільйонів пакунків на день. Таке використання ML є ключовим компонентом системи оптимізації, яка також прописує маршрути руху, що щорічно економить компанії 185 мільйонів миль пробігу, 8 мільйонів галонів пального, 350 мільйонів доларів і 185 000 метричних тонн викидів!
Ця величезна перемога була досягнута не просто завдяки передовим методам підрахунку чисел, а лише тоді, коли ця столітня компанія змогла змінити свої усталені шляхи. Це розгортання машинного навчання, кульмінаційний крок ML-проєкту, де прогнози починають діяти і вносять помітні зміни в повсякденну роботу.
Лідер цієї ініціативи, людина на ім’я Джек Левіс (Jack Levis), не лише керував формуванням ідеї та підрахунком цифр, але й взявся за набагато складнішу задачу: впровадження великих операційних змін. Йому довелося переконати керівників і за допомогою команди управління змінами, яка зросла до 700 осіб, навчити велику кількість персоналу, що працює на вантажних складах і за кермом вантажівок доставки, дотримуватися нових процедур, побудованих на прогнозах, отриманих за допомогою машинного навчання.
Що саме прогнозує UPS за допомогою ML і чому?
3. Бізнес-професіонали повинні підвищувати кваліфікацію до рівня напівтехнічного розуміння
Щоб тісно співпрацювати з ML-проєктами та робити важливий внесок у них, усім стейкхолдерам необхідно опанувати деякі напрочуд доступні та захопливі ноу-хау. Це означає, що доведеться трохи забруднити руки. Ви не можете просто сказати: «Давайте застосуємо круту технологію для вирішення цієї проблеми». Вам потрібно конкретно визначити, як прогнози, котрі дає машинне навчання, допоможуть активно покращити операційну діяльність.
У двох словах, ось що вам потрібно знати про кожен проєкт: що передбачено, наскільки точно, і що для цього зроблено. Наприклад, UPS вдосконалила свою систему, яка призначає пакунки вантажівкам, прогнозуючи, які адреси призначення отримають пакунок завтра. Ці прогнози доповнюють список відомих доставок, що дозволяє скласти більш оптимальний загальний план для вантажівок і пакунків, завантаживши їх на ніч, щоб вранці вони могли відправитися в дорогу.
Справа в тому, що стейкхолдери повинні турбуватися про «криваві деталі», щоб допомогти привести проєкт до успішного запуску. Це включає в себе повну інформацію про те, що саме має передбачати проєкт. Для UPS це зводилося до того, що для кожного пункту призначення потрібно визначити, скільки посилок потрібно доставити через скільки зупинок вантажівок. Наприклад, «група з трьох офісних будівель із 24 бізнес-люксами на Мейн-стріт, 123, потребує двох зупинок із трьома пакунками на кожній до 8:30 ранку».
Така інформаційна грамотність стосується кожного — це як навчання водінню, а не школа автомеханіків. Після того, як ви наберете обертів, такі не-датаналітики, як ви, — це саме те, що потрібно для ML-проєктів.
Ще один приклад, наведений у книзі, — компанія FICO, яка розробила прогностичну модель, що використовується для перевірки всіх транзакцій із 2,6 мільярда платіжних карток по всьому світу — це дві третини всіх карток у світі, включаючи близько 90% карток у США та Великій Британії. Для кожної карткової транзакції вона прогнозує, чи є вона шахрайською. Що робиться з кожним прогнозом? Система вашого банку автоматично миттєво приймає рішення, дозволити чи призупинити платіж.
4. Якщо ви не вимірюєте цінність, ви не переслідуєте її
Після того, як ви визначили, що передбачатиме машинне навчання, наступне питання полягає в тому, наскільки добре воно це робитиме. На щастя, щоб оцінити його ефективність, не потрібно ставати технічним експертом, оскільки ви можете порівняти ML-модель безвідносно до її внутрішньої роботи. Ми можемо судити про те, наскільки добре вона прогнозує, не обов’язково знаючи, як саме.
Ви часто чуєте про точність — простий підрахунок того, як часто модель робить правильні прогнози. Але точність — це не лише неправильний показник для більшості ML-проєктів, але й поширена помилка, яка дуже сильно спотворює очікування. Моделі, як правило, не передбачають навіть близько так добре, як ідеальна магічна «кришталева куля» — тож яку значущу, корисну цифру ви можете поставити для оцінки точності прогнозування моделей? Є два способи.
Перший, який важливий для аналітиків даних, пов’язаний із технічними метриками, такими як точність (яка часто вводить в оману), і більш корисною, яка називається «ліфт», що є своєрідним «прогностичним мультиплікатором» (у скільки разів краще, ніж вгадування, прогнозує модель)? Існує багато таких метрик, і вони допомагають аналітикам даних кількісно оцінити відносну прогностичну ефективність моделі, але їх недостатньо, оскільки вони не дають прямого уявлення про абсолютну бізнес-цінність, яку може принести модель.
Інша річ, яка важлива для стейкхолдерів із боку бізнесу, — це бізнес-метрики, або ключові показники ефективності, такі як прибуток, заощадження, рентабельність інвестицій і кількість збережених клієнтів. Вони зрозумілі будь-кому зі стейкхолдерів і безпосередньо пов’язані з бізнес-цілями. Вони показують справжню цінність недосконалих прогнозів, які дає машинне навчання.
Однак виявляється, що технічні метрики домінують у практиці ML. Це фактично єдиний вид метрик, з яким навчені працювати більшість фахівців з аналізу даних. Це призводить до смертельного розриву, через який стейкхолдери не бачать цінності. Вони не можуть зрозуміти, наскільки якісною є модель! Оскільки вони не можуть прийняти обґрунтоване рішення про дозвіл на розгортання, це часто призводить до повного зриву проєкту.
Хоча подолання цього розриву трапляється рідко, це переборна проблема — просто переконайтеся, що у вас є спеціаліст з аналізу даних, який готовий це зробити. Як тільки ці найкращі практики будуть впроваджені, зірки зійдуться для розгортання — але на додаток до забезпечення хороших бізнес-показників проєкту, переконайтеся, що ваше розгортання також йде добре.
5. Ми маємо поставитися до відповідального машинного навчання як до форми соціального активізму
Коли ви використовуєте ML, ви не просто оптимізуєте моделі та впорядковуєте бізнес. Ви управляєте. По суті, моделі втілюють і реалізують політику, яка контролює доступ до можливостей і ресурсів, таких як кредит, працевлаштування, житло — і навіть свобода, коли йдеться про моделі прогнозування арештів, які впливають на умовно-дострокове звільнення і винесення вироку. Моделі страхових ризиків визначають, скільки кожен страхувальник повинен заплатити, а цільовий маркетинг вирішує, хто отримає знижки, ексклюзивні пропозиції і навіть поінформованість про певні фінансові продукти.
Коли ML виступає в ролі вартового цих можливостей, вона може увічнити або посилити соціальну несправедливість, негативно впливаючи на незахищені групи населення, незаслужено відмовляючи їм у доступі до них у непропорційно великій мірі.
Для початку я виступаю за дотримання наступних стандартів, які є необхідними, але недостатніми:
- Забороніть дискримінаційні моделі — тобто не дозволяйте моделям приймати рішення або впливати на них, якщо вони хоча б частково ґрунтуються на захищених класах, таких як раса та етнічна приналежність.
- Переконайтеся, що дорогі помилки — коли система приймає неправильне рішення, яке ставить людину в невигідне становище — не відбуваються більше для однієї захищеної групи, ніж для іншої.
- Також відстоюйте право людини на пояснення алгоритмічних рішень, принаймні в державному секторі.
Річ у тім, що компанії зазвичай відмовляються займати позицію в таких питаннях. Вони здебільшого обмежуються пустопорожньою косметикою, якої вимагає корпоративний піар. Часто лише для того, щоб зайняти позицію, фірми закликають до «справедливого, неупередженого, підзвітного та відповідального» впровадження машинного навчання. Це розпливчасті банальності, які самі по собі не керують конкретними діями. Проголошуючи їх, корпорації розігрують етичний спектакль, захищаючи свій імідж, а не громадськість. Рідко можна почути, щоб фірма однозначно стала на той чи інший бік вищезгаданих стандартів, наприклад.
Це означає, що доля мільйонів людей, на яких вплине машинне навчання, перебуває в руках окремих людей та активних лідерів, які забезпечують відповідальне впровадження цієї технології. Встановлюючи етичні стандарти як форму соціального активізму, ми можемо зайняти позицію, яка приносить позитивні зміни, а не просто доносить розпливчасті банальності.
За матеріалами Next Big Idea Club
|