SLMs vs. LLMs: що малі та великі мовні моделі значитимуть для бізнесу у 2025 році

Розділ: Інформаційні технології
Автор(и): Сувік Дас (Souvik Das)
Джерело: The New Stack
розміщено: 23.01.2025
звернень: 180

Малі мовні моделі (SLMs), у порівняннні з широкопрофільними великими мовними моделями (LLMs), пропонують економічно ефективні рішення, орієнтовані на конкретну сферу. Про це пише Сувік Дас (Souvik Das), директор із продуктів і технологій компанії Clearwater Analytics.
SLMs vs. LLMs: що малі та великі мовні моделі значитимуть для бізнесу у 2025 році Оскільки розвиток генеративного штучного інтелекту (GenAI) продовжує трансформувати операції та процеси з шаленою швидкістю, організації перебувають у вирішальному моменті.

Нещодавній звіт McKinsey показав, що 65% респондентів регулярно використовують генеративний ШІ принаймні в одній бізнес-функції — це майже вдвічі більше, ніж за десять місяців до цього.

Проте поки одні компанії пожинають перші плоди, інші борються зі складнощами впровадження там, де правила ще тільки пишуться. З огляду на це середовище Дикого Заходу, виклик очевидний: оскільки GenAI готовий прискорити роботу, яку виконують люди в кожній галузі, бізнес-лідери повинні вибрати, як ефективно використати його потенціал.

Згідно з результатами дослідження IBM, 62% CEO готові йти на більші ризики, впроваджуючи ШІ, ніж їхні конкуренти, причому половина (51%) визнає, що страх відставання змушує їх інвестувати в деякі технології ще до того, як вони чітко зрозуміють їхню цінність. Враховуючи цей контекст, компанії стикаються з потоком рішень про те, як найкраще впровадити та ввести в експлуатацію GenAI — від вибору правильних постачальників інфраструктури та моделей до управління організаційними змінами в своїх організаціях.

Щоб допомогти керівникам приймати важливі рішення щодо найбільш ефективного використання інвестицій у GenAI, Сувік Дас із колегами вирішили поділитися ключовими уроками, які вони засвоїли працюючи у цьому швидкозмінному середовищі.

Тренди впровадження GenAI

Після виділення бюджету технічні директори та розробники додатків мають розглянути безліч доступних постачальників GenAI. Особи, які приймають рішення, повинні оцінити переваги та ризики кожної моделі або інфраструктури, а також цінові показники, оскільки інструменти GenAI/LLM не є рівноцінними. Крім того, такі гіганти індустрії, як Google та Amazon, постійно оновлюють та інноваційно розвивають свої моделі. Кожна модель має різні сильні сторони, можливості та особливості, з різним рівнем масштабованості та кастомізації. Компанії в різних секторах матимуть унікальні потреби, а різні відділи всередині компаній — специфічні вимоги.

Опитування Gartner показало, що використання GenAI, вбудованого в існуючі програми (наприклад, Microsoft Copilot for 365 або Adobe Firefly), є основним методом реалізації сценаріїв використання GenAI. За ним слідують кастомізація моделей GenAI за допомогою промпт-інжинірингу (25%), навчання або доопрацювання спеціальних моделей GenAI (21%) або використання автономних інструментів GenAI, таких як ChatGPT або Gemini (19%). Але як вибрати, наприклад, між OpenAI, Anthropic або Llama з відкритим вихідним кодом від Meta?

Оцінка моделей генеративного ШІ для використання в бізнесі

Рекомендується рухатися методично — але не настільки, щоб бути паралізованим. Команда з оцінки моделей на підприємстві або окрема людина в невеликій організації має дослідити, які моделі найкраще оптимізовані для конкретних застосувань і запитів. В ідеалі, команді слід отримати практичне розуміння ефективності та результативності різних моделей. Команда з оцінки моделі також повинна передбачити помилкові кроки і залишатися відкритою для випробування різних моделей після випробування, оскільки моделі GenAI продовжують вдосконалюватися.

Наскільки промпт-інжиніринг є необхідним?

Обираючи підхід до інтеграції інструментів GenAI, керівники мусять врахувати, скільки часу і ресурсів їм потрібно присвятити навчанню своїх моделей. Попередньо навчені моделі, призначені для загальних завдань, потребують мінімального промпт-інжинірингу. Організації, що працюють у високорегульованих секторах, таких як фінанси, енергетика чи охорона здоров’я, виявлять, що їхні сценарії використання потребують значної оперативної розробки для створення захисних механізмів для їхніх моделей. Тим, хто займається створенням контенту, маркетингом і обслуговуванням клієнтів, знадобиться легша підготовка, щоб забезпечити професійність, неупередженість і узгодженість із стратегіями брендингу. Фірми, що надають фінансові послуги або працюють у сфері охорони здоров’я, повинні переконатися, що технологія працює для їхніх сценаріїв використання та потреб клієнтів.

Більшість компаній потребують принаймні певного рівня промпт-інжинірингу, щоб точно налаштувати інструмент для своїх сфер діяльності. Простіше кажучи — що краще ви навчите GenAI, то кращими будуть результати. Цілком можливо, що більшість галузей віддадуть перевагу більш індивідуальним моделям, пристосованим до їхніх потреб, а не готовим рішенням. Вже зараз для енергетичних компаній основною стратегією (60%) розвитку GenAI є створення власних моделей або їх значна кастомізація. У сфері фінансових послуг та охорони здоров’я 47% роблять те саме.

Поєднання галузевої експертизи з ШІ-технологіями

У Clearwater Analytics ми працюємо з глобальними фінансовими установами, ретельно розробляючи промпти (підказки), щоб забезпечити розуміння детального контексту запитів. Спеціалізовані аналітики підказок є безцінними на цьому етапі для компаній, які намагаються використовувати складні сценарії використання в таких галузях, як фінанси, технології та енергетика. Ці аналітики оцінюють відповіді моделей і вдосконалюють промпти, щоб забезпечити належні результати. Людський контроль все ще відіграє важливу роль у впровадженні інструментів штучного інтелекту.

За допомогою GenAI ми вирішили два-три серйозні кейси для наших клієнтів. Однак ми усвідомлюємо, що цей шлях ще триває. Компанії мають постійно створювати більше сценаріїв використання для своїх операцій, а клієнти — отримувати повну віддачу від GenAI-агентів. У наших ранніх експериментах із багатоагентними робочими процесами агенти працювали повільно і з низькою продуктивністю, але ми продовжували працювати над ними. Ми виявили, що чим ширше сфера застосування, тим більш проблематичними стають ці агенти.

Переваги малих мовних моделей (SLMs)

Якщо ви звужуєте сферу застосування моделей, вони стають більш чутливими і компетентними у відповідях на конкретні питання. Наприклад, якщо я створюю робочий процес GenAI для управління інвестиціями або сценарій використання клієнта, мені не потрібно 90% того, на чому навчають великі мовні моделі (LLMs). Мені потрібні більш вузькопрофільні агенти, які глибоко розуміють сферу, що має відношення до інвестиційних менеджерів. Щоб досягти цього, мені потрібен фахівець зі штучного інтелекту з досвідом роботи у сфері фінансових послуг. Основними причинами поширення SLMs є доступність та економія ресурсів.

Високоналаштовані LLMs вимагають мільярдів параметрів, настільки масивних, що їм не вистачає даних в інтернеті. Дивовижно, чи не так? Навчання таких LLMs вимагає багато часу та значних витрат енергії, про що свідчить реанімація Microsoft сумнозвісної атомної електростанції Три-Майл-Айленд і стрімке зростання ринкової капіталізації NVIDIA та її графічних процесорів. Більшість компаній не можуть дозволити собі масштабні інвестиції в інфраструктуру, необхідні для таких моделей. Саме тому венчурні капіталісти фінансують SLMs, як, наприклад, нещодавнє фінансування Arcee в рамках серії А на суму $24 млн.

Інтеграція синтетичних і курованих даних для SLMs

Незважаючи на те, що SLMs навчаються на значно меншому обсязі даних, провайдери стикаються з труднощами, оскільки моделі є настільки ж якісними, наскільки якісними є їхні базові набори даних. Отже, провайдери витрачають багато часу на те, щоб визначити, які набори даних використовувати для навчання. Однак стартапи вступають у гру, створюючи вузьконалаштовані синтетичні набори даних, на яких компанії можуть навчати моделі з високою точністю для своїх унікальних потреб.

Низка компаній розробляє інструменти для кожного рівня стеку GenAI, щоб підвищити його ефективність і результативність. Це ще раз підтверджує ідею про те, що організаціям слід залишатися гнучкими і не покладатися на будь-якого конкретного постачальника мовних моделей, будь то ChatGPT, Claude або Anthropic. Кожен постачальник моделей буде розвиватися незалежно, тому дуже важливо, щоб ваша інфраструктура дозволяла легко змінювати моделі за потреби.

Збереження гнучкості при впровадженні GenAI

Зараз саме час для організацій скористатися бумом генеративного ШІ. Активно залучаючи цю трансформаційну технологію, залишаючись пильними щодо потенційних підводних каменів, компанії зможуть успішно долати складнощі впровадження ШІ.

Почніть із малого, випробуйте пілотні сценарії використання, запровадьте культуру ітерацій і навчання — шлях до максимального використання потенціалу GenAI тільки починається і розгортається прямо у нас на очах.

Ілюстрація: insight.co.za



ЧИТАЙТЕ ТАКОЖ:
КНИГИ НА ТЕМУ:
AI. Наддержави штучного інтелекту. Китай, Кремнієва долина і новий світовий ладAI. Наддержави штучного інтелекту. Китай, Кремнієва долина і новий світовий лад
Штучний інтелект 2041: десять передбачень майбутньогоШтучний інтелект 2041: десять передбачень майбутнього
Кібервійни, кібертероризм, кіберзлочинність (концепції, стратегії, технології)Кібервійни, кібертероризм, кіберзлочинність (концепції, стратегії, технології)

МЕТОДОЛОГІЯ: Стратегія, Маркетинг, Зміни, Фінанси, Персонал, Якість, IT
АКТУАЛЬНО: Новини, Події, Тренди, Інсайти, Інтерв'ю, Рецензії, Бізнес-навчання, Консалтинг
СЕРВІСИ: Бізнес-книги, Робота, Форуми, Глосарій, Цитати, Рейтинги, Статті партнерів
ПРОЄКТИ: Блог, Відео, Візія, Візіонери, Бізнес-проза, Бізнес-гумор

Сторінка Management.com.ua у Facebook    Менеджмент.Книги: телеграм-канал для управлінців    Management Digest у LinkedIn    Відслідковувати нас у Twitter    Підписатися на RSS    Поштова розсилка


Copyright © 2001-2025, Management.com.ua

Менеджмент.Книги

телеграм-канал Менеджмент.Книги Менеджмент.Книги — новинки, книжкові огляди, авторські тези і цінні думки з бізнес-книг. Підписуйтесь на телеграм-канал @books_management



➥ Дякую, я вже підписана(-ий)