Першасная апрацоўка даных
Першасная апрацоўка даных — этап падрыхтоўкі даных, у ходзе якога трансфармуецца іх фармат і структура, што можа прывесці да змены схемы даных[1]. Праводзіцца перад аналізам даных каб павысіць іх надзейнасць і паўнату, зрабіць прыдатнымі для ўжывання[2].
Прыклады[правіць | правіць зыходнік]
Прыклады аперацый, якія могуць выконвацца ў працэсе першаснай апрацоўкі даных[1]:
- Змена парадку слупкоў у табліца .
- Стварэнне новых атрыбутаў на аснове ўжо прысутных.
- Аб’яднанне атрыбутаў.
- Выдаленне (фільтрацыя) непатрэбных запісаў.
- Змена гранулярнасці набору даных праз агрэгацыю і звядзенне .
- Запаўненне пропускаў у даных (напрыклад нулямі, сярэднім, медыянай) або выдаленне запісаў з пропускамі.
Крыніцы[правіць | правіць зыходнік]
- ↑ а б Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.
- ↑ What Is Data Wrangling? Definition, Steps, and Why It Matters (англ.). Coursera. Праверана 14 снежня 2023.