MLOps

MLOps — парадыгма распрацоўкі праграмнага забеспячэння, накіраваная на надзейнае і эфектыўнае разгортванне і падтрыманне мадэлей машыннага навучання для практычнага выкарыстання. Слова з’яўляецца спалучэннем «машыннага навучання» (англ.: Machine Learning, ML) і практыкі распрацоўкі DevOps.

MLOs пачынаўся як набор перадавых практык, і цяпер паступова ператвараецца ў незалежны падыход да кіравання жыццёвым цыклам сістэм машыннага навучання. MLOps прымяняецца на ўсіх этапах жыццёвага цыкла — ад распрацоўкі да аркестроўкі^[en], разгортвання^[en] і маніторынгу мадэлей.

Гісторыя[правіць | правіць зыходнік]

У пачатку 2000-х для распрацоўкі бізнес-рашэнняў на базе машыннага навучання выкарыстоўвалася такое прапрыетарнае праграмнае забеспячэнне^[en] як SAS^[en], SPSS^[en] і FICO^[en]. З пашырэннем адкрытага праграмнага забеспячэння^[en], усё больш распрацоўшчыкаў пачалі выкарыстоўваць бібліятэкі Python і R для трэніроўкі мадэлей. Для разгортвання мадэлей з мэтай іх практычнага выкарыстання ужываліся такія інструменты як Docker і Kubernetes^[en]. З цягам часу паўсталі так званыя MLOps-платформы, якія пакрываюць увесь цыкл эксперыментавання, трэніроўкі, разгортвання і маніторынгу мадэлей^[2].

Рост папулярнасці MLOps абумоўлены патрэбнасцю ў стандартызацыі працэсаў распрацоўкі машыннага навучання. Рынак MLOps-інструментаў ацэньваўся ў $1.1 млрд у 2022 годзе, з прагнозам росту да $5.9 млрд да 2027 года, то бок у сярэднім на 41 % штогод^[3].

Параўнанне з DevOps[правіць | правіць зыходнік]

Асаблівасць сістэм з машынным навучаннем заключаецца ў наяўнасці трох узаемазвязаных кампанентаў: даных, мадэлі машыннага навучання і кода^[2]. Пры распрацоўцы звычайнага праграмнага забеспячэння мадэль, а часам і даныя адсутнічаюць.

Акрамя таго, існуе шэраг характэрных праблем, якія ўплываюць на працэс распрацоўкі рашэнняў з машынным навучаннем^[2]:

Паступовае зніжэнне якасці мадэлі пасля разгортвання, што выклікае неабходнасць у зборы найноўшых даных і ператрэніроўцы мадэлі.
Недастатковасць даных для развязання пастаўленай задачы.
Неадпаведнасць даных для трэніроўкі тым даным, з якімі мадэль мусіць працаваць пасля разгортвання. Напрыклад, калі мадэль прымяняецца ў тым рэгіёне, даныя з якога не ўваходзілі ў трэніровачны набор.
Збор новых або абнаўленне разметкі^[en] ў старых даных, што патрабуе ператрэніроўкі мадэлі.
Некарэктнасць дапушчэнняў, зробленых на этапе стварэння мадэлі.
Змена патрабаванняў да мадэлі ў часе распрацоўкі.

Неабходнасць вырашэння гэтых праблем адрознівае MLOps ад звычайных DevOps-працэсаў.

Асноўныя прынцыпы[правіць | правіць зыходнік]

Пашырэнне прадуктаў і сэрвісаў з машынным навучаннем прывяло да неабходнасці стварэння практык эфектыўнага тэсціравання, разгортвання, кіравання і маніторынгу такіх сістэм для змяншэння іх тэхнічнага доўгу^[en]^[4]. MLOps імкнецца да таго, каб рэсурсы, звязаныя з машынным навучаннем (мадэль, яе параметры і гіперпараметры, код для навучання мадэлі, даныя для навучання і тэсціравання), разглядаліся нароўні з іншымі рэсурсамі ў CI/CD^[en] асяроддзі, а мадэлі машыннага навучання разгортваліся ў рамках уніфікаванага працэсу разам з сэрвісамі, што іх выкарыстоўваюць і забяспечваюць выкарыстанне^[5].

Аўтаматызацыя[правіць | правіць зыходнік]

Аўтаматызаванымі могуць быць такія працэсы, як напрыклад навучанне, тэсціраванне і разгортванне мадэлі. Аўтаматызацыя паскарае распрацоўку мадэлі, а аўтаматызаванае тэсціраванне дазваляе хутка і своечасова знаходзіць і вырашаць праблемы. Аўтаматычнае навучанне і разгортванне мадэлі могуць быць выкліканы рэгулярна па раскладзе або ў выніку пэўных падзей, напрыклад змяншэння якасці мадэлі да крытычнага значэння ці змены кода мадэлі^[4].

Існуюць наступныя ўзроўні аўтаматызацыі^[4]:

Ручны працэс. Поўная адсутнасць аўтаматызацыі, характэрная для першых, эксперыментальных этапаў распрацоўкі. Часта выкарыстоўваюцца інструменты для хуткай распрацоўкі, такія як Jupyter Notebooks^[en].
Пайплайн машыннага навучання. Аўтаматызавана навучанне мадэлі ў выпадку з’яўлення новых даных. Сюды ж уваходзяць аўтаматычная валідацыя даных і мадэлі.
CI/CD пайплайн. Існуе CI/CD працэс для разгортвання мадэлі машыннага навучання ў production-асяроддзі. Аўтаматызавана зборка, тэсціраванне і разгортванне ўсіх кампанентаў сістэмы.

Бесперапыннасць[правіць | правіць зыходнік]

Шэраг прынцыпаў бесперапыннасці забяспечвае стабільнасць і даступнасць для выкарыстання мадэлі, кода і даных^[4]:

Бесперапынная інтэграцыя^[en] (англ.: Continuous Integration, CI) — тэсціраванне і валідацыя, што пашыраецца не толькі на код, але і на мадэль і даныя.
Бесперапынная дастаўка^[en] (англ.: Continuous Delivery, CD) — стварэнне пайплайна навучання мадэлі, які аўтаматычна разгортвае сэрвіс для прадказвання.
Бесперапыннае навучанне (англ.: Continuous Training, CT) — аўтаматычнае рэгулярнае навучанне мадэлей для разгортвання.
Бесперапынны маніторынг (англ.: Continuous Monitoring, CM) — кантроль за данымі і вынікамі працы мадэлі ў production-асяроддзі, у тым ліку падлік бізнес-метрык.

Кантроль версій[правіць | правіць зыходнік]

Акрамя стандартнага кантролю версій^[en] для кода, MLOps прадугледжвае аналагічнае версіянаванне для мадэлей і даных. Гэта абумоўлена тым, што як даныя, так і мадэль змяняюцца з часам пад уплывам розных фактараў, напрыклад абнаўлення крыніц даных і паўторнага навучання мадэлі. Кантроль версій дапамагае хутка адкаціць мадэль або даныя да папярэдняй версіі, калі абнаўленне прынесла непажаданыя вынікі. Захоўванне ўсіх версій мадэлі і даных можа таксама быць патрабаваннем з боку кампаніі або дзяржавы для таго, каб сістэму можна было праверыць на адпаведнасць заканадаўству і іншым стандартам^[4].

Улік эксперыментаў[правіць | правіць зыходнік]

У адрозненне ад класічнага праграмнага забеспячэння, машыннае навучанне патрабуе вялікай колькасці эксперыментаў каб зразумець, якую мадэль лепей выкарыстоўваць. Вядзенне ўліку эксперыментаў дазваляе пабачыць, з якімі параметрамі пэўны эксперымент запускаўся і як ён паўплываў на якасць мадэлі, а таксама правесці параўнанне паміж вынікамі вялікай колькасці эксперыментаў. Адзін з падыходаў да ўліку — стварэнне асобнай git^[en]-галіны для кожнага эксперыменту. Існуюць таксама інструменты для аўтаматычнага запісу гіперпараметраў і метрык для ўсіх эксперыментаў, напрыклад Weights & Biases^[4].

Тэсціраванне[правіць | правіць зыходнік]

Тэсціраванне^[en] сістэм з машынным навучаннем складаецца з трох кампанентаў: тэсціраванне даных, мадэлі і інфраструктуры^[4].

Тэсціраванне даных уключае этапы валідацыі даных (аўтаматызаваная праверка на адпаведнасць структуры), падліку важнасці прыкмет^[en] для адсейвання неістотных даных, праверку на адпаведнасць рэгуляцыям, такім як GDPR^[en]. Сюды ж уваходзіць юніт-тэсціраванне^[en] кода для падліку прыкмет^[4].

Для тэсціравання мадэлі ацэньваецца яе якасць з дапамогай адмысловых метрык (сярэднеквадратычная памылка^[en], лагістычная памылка^[en] і г.д.), якія павінны мець карэляцыю з бізнес-метрыкамі (прыбытак, зацікаўленасць карыстальнікаў і г.д.) Такія метрыкі падлічваюць на адкладзеным наборы даных для тэсціравання, што не выкарыстоўваецца ў часе навучання мадэлі. Складаныя мадэлі мусяць параўноўвацца з больш простай, так званай бэйзлайн-мадэллю. Напрыклад, няма рацыі ў выкарыстанні нейроннай сеткі^[en], калі лінейная рэгрэсія паказвае нягоршыя вынікі для пэўнай задачы. Акрамя таго, правяраецца сумленнасць мадэлі^[en], то бок яе карэктная праца для розных катэгорый карыстальнікаў. Для параўнання розных версій мадэлі можа прымяняцца A/B-тэсціраванне^[en]^[4].

Тэсты для інфраструктуры правяраюць такія ўласцівасці як дэтэрмінаванасць^[en] навучання (навучанне з аднолькавымі наборамі даных павінна даваць аднолькавыя параметры мадэлі), памяншэнне значэння функцыі страт^[en] у ходзе навучання, адпаведнасць памылкі ў асяроддзі навучання памылцы ў production-асяроддзі. Існуюць таксама краш-тэсты, якія правяраюць аднаўленне стану мадэлі ў кантрольным пункце, калі ў працэсе навучання здарыўся збой. Інтэграцыйныя тэсты праганяюць увесь пайплайн цалкам і правяраюць, што кожны этап навучання завяршаецца паспяхова^[4].

Маніторынг[правіць | правіць зыходнік]

Каб праверыць, ці працуе мадэль як запланавана пасля разгортвання, ажыццяўляецца яе маніторынг. Сістэма маніторынгу павінна паведамляць пра павольны або рэзкі спад якасці мадэлі. Пры атрыманні такога сігналу можа аўтаматычна запускацца перанавучанне і абнаўленне версіі мадэлі^[4].

Акрамя гэтага, маніторынг можа закранаць змены ў даных і кодзе, абнаўленні ў залежнасцях, выхад значэнняў у даных за звычны дыяпазон, адпаведнасць прыкмет у працоўным і навучальным асяроддзях, вылічальную ўстойлівасць^[en] мадэлі (адсутнасць бесканечных і NaN^[en]-значэнняў у падліках), хуткасць падлікаў, выкарыстанне вылічальных рэсурсаў (памяць^[en], месца на дыску, сеткавы трафік^[en] і інш.), час з апошняга абнаўлення мадэлі і гэтак далей^[4].

Рабочы працэс MLOps[правіць | правіць зыходнік]

Распрацоўка праграмнага забеспячэння з машынным навучаннем уключае ў сябе такія этапы як аналіз задачы, інжынірынг даных, распрацоўка і інтэграцыя мадэлі.

Аналіз бізнес-задачы і патрабаванняў[правіць | правіць зыходнік]

Першапачатковы этап праекта па распрацоўцы праграмнага забеспячэння мае сваёй мэтай зразумець задачу і той працэс, у якім будзе выкарыстоўвацца гатовае рашэнне. У выпадку з машынным навучаннем, патрабаванні да рашэння мусяць быць перакладзены ў патрабаванні да мадэлі, яе структуры і якасці.

У пачатку такога аналізу пэўны бізнес-працэс^[en] разбіваецца на асобныя задачы^[en]. З гэтых задач вылучаюцца тыя, для выканання якіх патэнцыйна можа выкарыстоўвацца машыннае навучанне. Для кожнай задачы ацэньваецца акупнасць інвестыцый^[en] у яе аўтаматызацыю. Задачы з найбольшай акупнасцю разглядаюцца больш падрабязна^[6].

Абмеркаванне дапамагае зразумець сапраўдныя мэты і магчымыя выдаткі. Адным з вынікаў гэтага этапу можа быць рашэнне не распрацоўваць мадэль машыннага навучання, напрыклад таму што працэс не дапускае некарэктных адказаў мадэлі, рашэнне будзе мець нізкую акупнасць, або сістэму не магчыма будзе падтрымліваць.

AI Canvas[правіць | правіць зыходнік]

Адзін з метадаў аналізу бізнес-задач з пункту гледжання машыннага навучання, AI Canvas, быў прапанаваны Аджаем Агравалам^[en] у кнізе «Машыны прагназавання. Простая эканоміка штучнага інтэлекту» (англ.: Prediction Machines. The Simple Economics of Artificial Intelligence). AI Canvas складаецца з сямі пытанняў, якія павінны дапамагчы ў прыняцці рашэння аб распрацоўцы^[6]^[7]:

Прадказанне. У чым заключаецца нявызначанасць, якую можна вырашыць з дапамогай машыннага навучання?
Ацэнка. Як ацаніць эфект магчымых вынікаў, як станоўчых, так і памылковых?
Дзеянне. Якія дзеянні могуць быць абраныя?
Вынік. Як можна зразумець, што задача была выканана карэктна?
Навучанне. Якія даныя патрэбны для навучання мадэлі?
Уваход. Якія даныя патрэбны для таго, каб гатовая мадэль магла зрабіць прагноз?
Зваротная сувязь. Як можна выкарыстаць вынікі для паляпшэння якасці мадэлі?

Напрыклад разгледзім праблему лжывых спрацоўванняў ахоўнай сігналізацыі^[en]. Калі доля лжывых спрацоўванняў высокая, шмат рэсурсаў паліцыі або аховы марнуецца. Пры разгляданні магчымасці вырашыць гэтую праблему з дапамогай машыннага навучання, адказы на пытанні AI Canvas могуць гучаць наступным чынам^[7]:

Прадказанне. Прадказаць, ці сапраўды за спрацоўваннем сігналізацыі стаіць пагроза.
Ацэнка. Параўнаць кошт рэагавання на лжывае спрацоўванне сігналізацыі з коштам адсутнасці рэакцыі на сапраўднае спрацоўванне.
Дзеянне. Выклікаць або не выклікаць ахову ў адказ на спрацоўванне.
Вынік. Спраўдзіць, ці абранае дзеянне было слушным.
Навучанне. Гістарычныя даныя датчыкаў і адпаведных ілжывых і карэктных спрацоўванняў сігналізацыі.
Уваход. Даныя з датчыкаў у той момант, калі спрацавала сігналізацыя.
Зваротная сувязь. Падзяліць новыя даныя з датчыкаў на дзве катэгорыі: ілжывыя і карэктныя спрацоўванні. Дадаць гэтыя даныя да гістарычных і абнавіць мадэль.

Machine Learning Canvas[правіць | правіць зыходнік]

Яшчэ адзін метад аналізу задачы — Machine Learning Canvas. Ён складаецца з дзесяці блокаў, кожны з якіх з дапамогай пытанняў дазваляе паглядзець на задачу з таго ці іншага боку^[7].

Асноўны блок — значная прапанова. У межах гэтага блока разглядаюцца пытанні аб тым, у чым заключаецца праблема, чаму гэта важна і хто будзе канчатковым карыстальнікам^[en] рашэння. У выніку фармулюецца прапанова, у якой згадваецца праблема і прадукт або сэрвіс, які плануецца распрацаваць для яе рашэння.

Іншыя блокі бяруць пад увагу крыніцы даных, тып задачы (класіфікацыя, рэгрэсія^[en], кластарызацыя^[en] і г.д.), прыкметы^[en] для мадэлі, ацэнку якасці, працэс прыняцця рашэнняў^[en] на аснове адказаў мадэлі, працэдуру выкарыстання мадэлі (на запыт, паводле раскладу і інш.), збор^[en] новых даных, абнаўленне і маніторынг мадэлі.

Інжынірынг даных[правіць | правіць зыходнік]

Асноўныя задачы інжынірынгу даных^[en] — збор і падрыхтоўка^[en] набору даных^[en] для далейшага навучання мадэлі. Гэты этап мае вялікае значэнне, бо недастатковая якасць даных^[en] можа прывесці да некарэктнай працы мадэлі. Залежнасць паміж якасцю даных і мадэлі апісваецца прынцыпам «смецце на ўваходзе, смецце на выхадзе^[en]» (англ.: Garbage In, Garbage Out). Звычайна даныя збіраюцца з некалькіх крыніц у розных фарматах^[en]. У працэсе падрыхтоўкі даных праводзіцца іх даследаванне, ачыстка, камбінаванне і трансфармацыя^[8]^[9].

Інжынірынг даных падзяляецца на наступныя элементы:

Прыём даных — збор неапрацаваных даных^[en] у розных фарматах. Можа таксама ўключаць генерацыю сінтэтычных даных^[en] і ўзбагачэнне даных.
Даследаванне і валідацыя — прафіляванне даных^[en], неабходнае для разумення іх структуры і зместу. Валідацыя можа праводзіцца з дапамогай функцый^[en], якія правяраюць даныя на прадмет памылак і анамалій.
Ачыстка^[en] і першасная апрацоўка даных — працэс выпраўлення памылак, выдалення выкідаў^[en], запаўнення пропускаў^[en] у даных.
Разметка даных^[en] — прысваенне элементам даных пэўных метак у залежнасці ад задачы, напрыклад аднясенне іх да той ці іншай катэгорыі^[en].
Падзел даных — раздзяленне даных на наборы для навучання, валідацыі і тэсціравання^[en] мадэлі.

Распрацоўка мадэлі[правіць | правіць зыходнік]

Распрацоўка мадэлі складаецца з некалькі этапаў, у выніку якіх ствараецца мадэль, гатовая да інтэграцыі^[8]:

Навучанне мадэлі — працэс прымянення алгарытму машыннага навучання да набору навучальных даных. Сюды ж уваходзяць стварэнне прыкмет для мадэлі і падбор гіперпараметраў^[en].
Ацэнка мадэлі — валідацыя мадэлі з падлікам метрык, што ацэньваюць якасць яе работы.
Тэсціраванне мадэлі — фінальная праверка мадэлі на адкладзеным наборы даных^[en].
Пакетызацыя мадэлі — перавод мадэлі ў патрэбны для прымянення фармат (напрыклад PMML^[en], PFA^[en], ONNX^[en] і інш.)

Інтэграцыя мадэлі[правіць | правіць зыходнік]

Распрацаваная мадэль інтэгруецца ў гатовы прадукт, напрыклад мабільную або настольную праграму. Інтэграцыя ўключае ў сябе наступныя этапы^[8]:

Разгортванне мадэлі — прыстасаванне мадэлі да production-асяроддзя^[en].
Маніторынг мадэлі — назіранне за дзейнасцю і якасцю мадэлі ў працэсе яе выкарыстання. Вынікі маніторынгу могуць дапамагчы зразумець, калі патрабуецца паўторнае навучанне мадэлі на абноўленых даных.
Лагаванне^[en] — запіс і захоўванне ўсіх запытаў да мадэлі.

Шаблоны архітэктуры[правіць | правіць зыходнік]

Архітэктура сістэмы машыннага навучання залежыць ад спосабу навучання і генерацыі прадказанняў мадэлі.

Існуюць два віды навучання^[9]:

Афлайнавае (навучанне батчамі, статычнае навучанне), пры якім мадэль навучаецца на загадзя сабраным наборы даных. Такая мадэль застаецца нязменнай пасля разгортвання, таму з часам можа страціць актуальнаць. Зніжэнне якасці можна адсачыць з дапамогай маніторынгу, і паўторна навучыць мадэль як толькі яно адбудзецца.
Анлайнавае^[en] (дынамічнае) навучанне мае месца, калі працэс перанавучання запускаецца рэгулярна з прыходам новых данных, напрыклад у патоку^[en].

Генерацыя прадказанняў таксама падзяляецца на два тыпы^[9]:

Прадказванне батчамі адбываецца раз на некаторы прамежак часу для сабраных за гэты час даных.
Прадказванне ў рэальным часе праводзіцца тады, калі адказ мадэлі патрэбен у той самы момант, калі быў атрыманы запыт.

Камбінацыя відаў навучання і прадказвання вызначае архітэктуру сістэмы і ступень яе аўтаматызацыі.

Прагноз[правіць | правіць зыходнік]

Такі тып архітэктуры прадугледжвае аднаразовае навучанне мадэлі на гістарычных даных і генерацыю прагнозу на іншым, але таксама гістарычным наборы даных. Гэта самы просты тып архітэктуры, які выкарыстоўваецца ў даследаваннях і ў адукацыйных мэтах пры вывучэнні машыннага навучання, але яго часта бывае недастаткова для выкарыстання на практыцы^[9].

Вэб-сэрвіс[правіць | правіць зыходнік]

Архітэктура вэб-сэрвісу (або мікрасэрвісу^[en]) гэта камбінацыя афлайнавага навучання з прадказваннем у рэальным часе. У гэтым падыходзе мадэль працуе з кожным запытам асобна, атрымлівае на ўваход даныя запыту і вяртае прадказанне для гэтага запыту на выхадзе. Пры гэтым сама мадэль не змяняецца да той пары, пакуль не будзе паўторна навучана і разгорнута. Архітэктура сэрвісу падзяляецца, адпаведна, на дзве часткі: навучанне і прадказванне. Артэфактам^[en] навучання выступае гатовая мадэль, якая на этапе прадказвання ўзаемадзейнічае з кліентам, напрыклад праз REST API^[en]^[9].

Анлайнавае навучанне[правіць | правіць зыходнік]

У архітэктуры анлайнавага навучання мадэль абнаўляецца як толькі новыя даныя прыходзяць у сістэму. Звычайна даныя арганізаваны ў выглядзе патоку, які можа складацца з індывідуальных назіранняў або міні-батчаў (невялікіх груп). Як правіла, першаснае навучанне мадэлі праводзіцца на гістарычных даных асобна ад анлайн-сістэмы, у якой праходзіць толькі інкрэментнае паляпшэнне мадэлі з дапамогай новых даных. Мадэль можа быць разгорнута як сэрвіс на Kubernetes кластары або падобным чынам^[9].

Загана анлайнавага навучання ў тым, што якасць мадэлі можа хутка сапсавацца, калі ў сістэму будуць прыходзіць няякасныя даныя^[9].

Серыялізацыя мадэлі[правіць | правіць зыходнік]

Часта бывае так, што навучанне і выкарыстанне мадэлі машыннага навучання адбываюцца ў розных асяроддзях. Напрыклад, калі мадэль, навучаную з дапамогай бібліятэкі scikit-learn^[en] трэба запусціць у выглядзе Spark^[en] задачы. У такіх выпадках мадэль пераводзіцца ў адзін з адмысловых фарматаў, прыгодных для распаўсюджання. Фарматы серыялізацыі бываюць як універсальнымі, так і спецыфічнымі для пэўнай платформы або інструмента^[9].

Амальгамацыяй называецца спосаб экспарту мадэлі праз аб’яднанне ў адзін пакет параметраў мадэлі і ўсяго неабходнага коду для яе запуску. Такі пакет потым можа быць скампіляваны на патрэбнай платформе як асобная праграма. Гэты спосаб найбольш прыдатны для невялікіх і простых мадэлей, такіх як лагістычная рэгрэсія^[en] або дрэва рашэнняў^[en]. Напрыклад, для scikit-learn мадэлей такі пакет можна згенерыраваць з дапамогай бібліятэкі SKompiler. Пасля гэтага ён можа быць трансліраваны ў код на такіх мовах праграмавання як C, Javascript, Rust, Julia^[en] і г.д.^[9]

Універсальныя фарматы[правіць | правіць зыходнік]

PMML^[en] — фармат на аснове XML, файлы захоўваюцца з пашырэннем .pmml. Падтрымлівае толькі частку алгарытмаў машыннага навучання^[9].
PFA^[en] (Portable Format for Analytics) — мадэль захоўваецца ў JSON фармаце. Распрацоўваўся як замена PMML^[9].
ONNX^[en] (Open Neural Network eXchange) — фармат, які дазваляе запускаць мадэль незалежна ад фрэймворка^[en] распрацоўкі. Серыялізаваная з дапамогай ONNX мадэль можа рабіць прадказанні ў асяроддзях з адмысловымі бібліятэкамі. Сумяшчальны з большасцю інструментаў для глыбокага навучання^[en]. Падтрыманы шэрагам вялікіх кампаній, такіх як Microsoft, Facebook і Amazon^[9].

Разгортванне мадэлі[правіць | правіць зыходнік]

Разгортванне сістэмы машыннага навучання складаецца з разгортвання пайплайна для навучання мадэлі і забеспячэння API^[en], праз які мадэллю можна карыстацца для атрымання прадказанняў для новых даных. Працэс ператварэння запыта да мадэлі ў прадказанне завецца вывядзеннем. Вывядзенне патрабуе наяўнасці мадэлі, інтэрпрэтатара^[en] для выканання кода і ўваходных даных^[9].

Часта мадэлі машыннага навучання разгортваюцца ў кантэйнерах^[en], напрыклад з дапамогай Docker. Аркестроўка^[en] кантэйнераў ажыццяўляецца такімі інструментамі, як Kubernetes, AWS Fargate і іх альтэрнатывамі. Правайдэры воблачных сэрвісаў часта маюць уласныя платформы машыннага навучання з магчымасцю разгортвання мадэлей, напрыклад Amazon SageMaker^[en], Google Cloud AI Platform, Azure Machine Learning Studio і IBM Watson Machine Learning. Альтэрнатыўна, мадэлі могуць быць разгорнуты як бессерверныя функцыі ў Azure Functions, AWS Lambda^[en], Google Cloud Functions і інш. У такім выпадку код для выкарыстання мадэлі можа быць упакаваны ў .zip архіў, што перадаецца ў адпаведны сэрвіс^[9].

Шаблоны разгортвання[правіць | правіць зыходнік]

Model-as-Service[правіць | правіць зыходнік]

Мадэль можа быць разгорнута як сэрвіс (англ.: Model-as-Service). У такім выпадку мадэль і інтэрпрэтатар аб’ядноўваюцца ў адзіны вэб-сэрвіс, карыстацца якім можна паводле REST API або gRPC^[en]^[9].

Model-as-Dependency[правіць | правіць зыходнік]

У шаблоне Model-as-Dependency мадэль разглядаецца як залежнасць прыкладной праграмы, якая яе выкарыстоўвае. Напрыклад гэта можа быць стандартная jar-залежнасць^[en], якая мае асобны метад^[en] для вывядзення, даступны праграме^[9].

Precompute[правіць | правіць зыходнік]

У некаторых выпадках прадказанні мадэлі для ўваходных даных магчыма падлічыць яшчэ да атрымання гэтых даных, напрыклад калі набор усіх магчымых запытаў адносна невялікі. Тады навучаная мадэль выкарыстоўваецца для такога падліку толькі адзін раз і яе адказы запісваюцца ў базу даных. Пасля гэтага кожны запыт да мадэлі перанакіроўваецца ў базу даных для атрымання адпаведных прадказанняў^[9].

Model-on-Demand[правіць | правіць зыходнік]

Для мадэлі ў шаблоне Model-on-Demand характэрны ўласны цыкл выпуску, незалежны ад іншых сэрвісаў. Мадэль і яе асяроддзе выканання^[en] аб’ядноўваюцца ў асобны кампанент пад назвай апрацоўшчык падзей. Узаемадзеянне з апрацоўшчыкам адбываецца праз брокер паведамленняў^[en], які мае дзве чаргі: уваходную і выхадную. Сэрвіс, якому неабходныя прадказанні ад мадэлі, запісвае запыты ў уваходную чаргу. Апрацоўшчык падзей забірае запыты з уваходнай чаргі групамі, прымяняе да іх мадэль і запісвае вынікі ў выхадную чаргу. З выхадной чаргі прадказанні перадаюцца назад у той сэрвіс, што пасылаў запыты^[9].

Hybrid-Serving (федэратыўнае навучанне)[правіць | правіць зыходнік]

Шаблон Hybrid-Serving, вядомы таксама як федэратыўнае навучанне^[en], прадугледжвае наяўнасць уласнай мадэлі для кожнага карыстальніка, якая захоўваецца лакальна на карыстальніцкай прыладзе, напрыклад на смартфоне. Акрамя лакальных мадэлей існуе навучаная на гістарычных даных глабальная мадэль на серверы, паводле якой ствараюцца лакальныя мадэлі. Лакальныя мадэлі дадаткова навучаюцца на карыстальніцкіх даных без адпраўкі гэтых даных на сервер. Перыядычна параметры лакальных мадэлей адпраўляюцца назад на сервер, глабальная мадэль камбінуе іх і абнаўляецца, а вынікі камбінавання перадаюцца лакальным мадэлям для іх удасканалення. Тэсціраванне мадэлі адбываецца лакальна на прыладах, дзе захоўваюцца даныя карыстальнікаў^[9].

Перавагі такога метаду ў тым, што ён не патрабуе адпраўкі карыстальніцкіх даных, магчыма канфідэнцыяльных, на сервер, але ўсё адно дазваляе выкарыстоўваць іх для навучання мадэлі. Пры гэтым накладаюцца абмежаванні як на тэхнічныя характарыстыкі лакальных прылад, так і на памер і іншыя тэхнічныя патрабаванні самой мадэлі, таму федэратыўнае навучанне не заўсёды магчыма на практыцы^[9].

Зноскі

↑ ML Ops: Machine Learning as an Engineering Discipline (англ.). Towards Data Science. Праверана 6 July 2021.
↑ ^а ^б ^в MLOps: Motivation (англ.). ML Ops: Machine Learning Operations. Праверана 15 лістапада 2023.
↑ MLOps Market Size, Share and Global Market Forecast to 2027 (англ.). MarketsandMarkets. Праверана 15 лістапада 2023.
↑ ^а ^б ^в ^г ^д ^е ^ё ^ж ^з ^і ^к ^л MLOps Principles (англ.). ML Ops: Machine Learning Operations. Праверана 25 лістапада 2023.
↑ MLOps Roadmap 2022 (англ.). Праверана 25 снежня 2023.
↑ ^а ^б MLOps: Phase Zero (англ.). ML Ops: Machine Learning Operations. Праверана 20 лістапада 2023.
↑ ^а ^б ^в Ajay Agrawal, Joshua Gans, Avi Goldfarb. A Simple Tool to Start Making Decisions with the Help of AI (англ.). Harvard Business Review (17 красавіка 2018). Праверана 20 лістапада 2023.
↑ ^а ^б ^в End-to-end Machine Learning Workflow (англ.). ML Ops: Machine Learning Operations. Праверана 4 снежня 2023.
↑ ^а ^б ^в ^г ^д ^е ^ё ^ж ^з ^і ^к ^л ^м ^н ^о ^п ^р ^с ^т ^у Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.

[tds1-1] ML Ops: Machine Learning as an Engineering Discipline (англ.). Towards Data Science. Праверана 6 July 2021.

[mlops-motivation-2] а ^б ^в MLOps: Motivation (англ.). ML Ops: Machine Learning Operations. Праверана 15 лістапада 2023.

[3] MLOps Market Size, Share and Global Market Forecast to 2027 (англ.). MarketsandMarkets. Праверана 15 лістапада 2023.

[mlops-principles-4] а ^б ^в ^г ^д ^е ^ё ^ж ^з ^і ^к ^л MLOps Principles (англ.). ML Ops: Machine Learning Operations. Праверана 25 лістапада 2023.

[5] MLOps Roadmap 2022 (англ.). Праверана 25 снежня 2023.

[mlops-phase-zero-6] а ^б MLOps: Phase Zero (англ.). ML Ops: Machine Learning Operations. Праверана 20 лістапада 2023.

[hbr-7] а ^б ^в Ajay Agrawal, Joshua Gans, Avi Goldfarb. A Simple Tool to Start Making Decisions with the Help of AI (англ.). Harvard Business Review (17 красавіка 2018). Праверана 20 лістапада 2023.

[mlops-workflow-8] а ^б ^в End-to-end Machine Learning Workflow (англ.). ML Ops: Machine Learning Operations. Праверана 4 снежня 2023.

[three-levels-9] а ^б ^в ^г ^д ^е ^ё ^ж ^з ^і ^к ^л ^м ^н ^о ^п ^р ^с ^т ^у Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]