Даследаванне даных

З Вікіпедыі, свабоднай энцыклапедыі

Даследаванне даных — пачатковы этап аналізу даных[en], у ходзе якога выяўляюцца характарыстыкі, выкіды[en] і заканамернасці ў даных з дапамогай статыстычных метадаў і візуалізацыі[en]. Можа праводзіцца як уручную, так і з дапамогай аўтаматызаваных метадаў[1]. Вынік даследавання — набор візуалізацый і метаданых[en], напрыклад максімум, мінімум і сярэдняе значэнне атрыбутаў даных[2].

Прадметы даследавання[правіць | правіць зыходнік]

У працэсе даследавання даных, пра кожны з іх атрыбутаў (напрыклад, слупок у табліцы[en]) збіраюцца і дакументуюцца наступныя звесткі[2]:

Акрамя гэтага, даследуецца карэляцыя паміж атрыбутамі і ствараюцца візуалізацыі.

Інструменты[правіць | правіць зыходнік]

Найбольш распаўсюджаныя мовы праграмаваня для даследавання даных — Python і R. Для візуалізацыі выкарыстоўваюцца такія інструменты, як Microsoft Power BI[en], Qlik[en], Tableau[en] і Jupyter[en][2]. Падобныя інструменты даюць магчымаць эфектыўней прэзентаваць вынікі праз інтэрактыўныя візуалізацыі[1].

Крыніцы[правіць | правіць зыходнік]

  1. а б What is data exploration? (англ.). TechTarget. Праверана 13 снежня 2023.
  2. а б в Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.