Возера даных
Возера дадзеных — сістэма або бібліятэка даных , якія захоўваюцца ў натуральным/неапрацаваным фармаце[1], звычайна ў выглядзе вялікіх бінарных вялікіх аб'ектаў або файлаў. Возера даных звычайна ўяўляе сабой адзінае сховішча даных, якое ўключае неапрацаваныя копіі зыходных сістэмных даных, даныя датчыкаў, сацыяльныя даныя і г. д.[2] і ператвораныя даныя, якія выкарыстоўваюцца для такіх задач, як справаздачнасць , візуалізацыя , пашыраная аналітыка і машыннае навучанне. Возера даных можа ўключаць структураваныя дадзеныя з рэляцыйных баз дадзеных (радкі і слупкі), паўструктураваныя даныя (CSV , логі, XML, JSON), неструктураваныя даныя (электронныя лісты, дакументы, PDF-файлы) і бінарныя даныя (выявы, аўдыё , відэа )[3]. Возера даных можа быць створана «лакальна» (у цэнтрах апрацоўкі даных арганізацыі) або «у воблаку» (з выкарыстаннем воблачных сэрвісаў ад такіх пастаўшчыкоў, як Amazon, Microsoft або Google).
Дрэнна кіраваныя азёры даных жартам называюць балотамі даных[4].
Зноскі
- ↑ The growing importance of big data quality . The Data Roundtable. Праверана 1 June 2020.
- ↑ What is a data lake? . aws.amazon.com. Праверана 12 October 2020.
- ↑ Top Five Differences between DataWarehouses and Data Lakes(недаступная спасылка). Blue-Granite.com. Архівавана з першакрыніцы 15 верасня 2017. Праверана 19 May 2017.
- ↑ Olavsrud, Thor (June 8, 2017). "3 keys to keep your data lake from becoming a data swamp". CIO(англ.).