Čištění dat je pravděpodobně to, co většina z nás v Excelu nesnáší. Špinavá data dokážou potrápit i velmi zkušené uživatele Excelu. Je to jedna z nejzdlouhavějších, nejméně zábavných, a přitom zároveň nejnebezpečnějších částí práce v Excelu. Stačí jedna drobná chyba — třeba nadbytečná mezera — a část tržeb se nezapočítá. Nebo špatně vyhodnotíte výsledky jen proto, že má zákazník ve jméně překlep nebo jiný formát zápisu. V Excelu totiž neplatí, že chyba musí být velká, aby byla drahá. A právě proto je jistota, že pracujete se 100 % čistými daty, základem sebevědomé práce bez chyb. Doteď jsme k čištění dat používali kombinaci excelových funkcí nebo Power Query. Nově se v Excelu objevilo tlačítko Vyčistit data — Clean Data, které slibuje rychlé opravy na jedno kliknutí.
Excelový soubor ke stažení:
Tento nástroj je dostupný pro uživatele Microsoft 365 s licencí Copilot a využívá umělou inteligenci k tomu, aby automaticky našel a navrhl opravy běžných problémů v datech — od přebytečných mezer, přes nekonzistentní texty až po špatné formátování čísel.
A teď ta hlavní otázka: Opravdu tohle tlačítko zvládne vyčistit data tak, jak potřebujeme v praxi? Pojďme se podívat, jak si tlačítko Vyčistit data poradí s pěti nejčastějšími problémy, které v Excelu řešíme.
Tlačítko Clean Data (česky Vyčistit data) v Excelu s licencí Microsoft 365 Copilot je nová AI-funkce, která automaticky identifikuje a opravuje některé běžné nekonzistence a chyby v datech. Nástroj se zaměřuje na standardní drobné nekonzistence, které mohou ovlivnit analýzu nebo výpočty.
Abychom nástroj Vyčistit data mohli použít, musí být splněny základní podmínky:
- musíte mít aktivní licenci Copilot
- musíte mít zapnuté automatické ukládání souboru na OneDrive nebo SharePoint
- a data musí být ideálně v excelové tabulce
Klikneme do excelové tabulky a na kartě Data zapneme nástroj Vyčistit data neboli Clean data. Otevře se pravý panel Vyčistit data, kde se objevilo několik upozornění na nekonzistentní nebo špinavá data v tabulce. Projdeme si je postupně.
Odstranění nadbytečných mezer
První upozornění je na nadbytečné mezery. Klikneme do prvního sloupce, kde máme nadbytečné mezery, a to jak na začátku a konci buňky, tak mezi slovy. Když myší najedeme na tlačítko Použít, tak se nám dokonce barevně obarví buňky, kterých se tato změna týká.
Posuvníkem vedle tlačítka se můžeme mezi těmito buňkami posouvat a vizuálně je zkontrolovat. Pokud chceme nadbytečné mezery odstranit, tak potvrdíme, že chceme použít odstranění nadbytečných mezer a nadbytečné mezery se odstraní. A to jak na začátku a konci buňky, tak i mezi slovy. Tento úkol tedy nástroj Vyčistit data zvládnul.
Nekonzistentní text
Další návrh na úpravu se týká nekonzistentního textu ve sloupci Společnost. Ve sloupci společnost máme uvedenou jednu společnost Amazon, nicméně v některých názvech máme překlepy. Někde máme zdvojená písmena, někde nám některá písmena chybí a někde máme dokonce v názvu omylem mezeru.
Podíváme se na to, jak si nástroj Vyčistit data poradí s úpravou tohoto sloupce. Nekonzistentní text se dokonce označil a dokonce zde máme na výběr jakou formou chceme tyto ostatní slova nahradit.
Potvrdíme a nekonzistentní text se nahradil. Tento úkol nástroj Vyčistit data rovněž zvládnul.
Nesoulad ve formátu čísla
Nástroj Vyčistit data pro nás má další úpravu. Upozorňuje nás na nesoulad ve formátu textu a čísla ve sloupci C, což poznáme od pohledu podle zelených trojúhelníků u některých čísel.
Takto označená čísla nejsou ve skutečnosti čísla, ale jelikož před čísly máme apostrof, tak se jedná o text, což poznáme i podle zarovnání hodnot k levé straně buňky.
Nesoulad ve formátu datumu
V předposledním sloupci máme datumy, nicméně několik datumů máme ve špatném regionálním formátu. Nejprve máme rok, pak den a měsíc s různými oddělovači jako lomítko a pomlčka a na posledním řádku máme dokonce nejprve měsíc, pak den a rok.
Nesoulad ve velikosti písma
Co se týče nekonzistentního textu ve velikosti písmen, tak v tabulce máme dva příklady, v prvním sloupci, ze kterého jsme odstranili nadbytečné mezery máme nesoulad ve velikosti písma, stejně tak v posledním sloupci, kde máme uvedenou společnost Microsoft, která je rovněž napsaná různou velikostí písma.
Nicméně nástroj Vyčistit data zdá se chytl pouze poslední sloupec, kde máme v podstatě jedno slovo. Potvrdíme změnu. Nástroj Vyčistit data tedy zdá se rozpoznal nekonzistentnost ve velikosti písma jen pokud se jedná o jedno slovo, nicméně u příjmení a jména se zdá se, že to nástroj Vyčistit data nechytl.
A co se stane, když po vyčištění dat přidáme nový řádek, kde máme rovněž špinavá data? Z mé zkušenosti to chce většinou znovu uložit soubor a někdy dokonce zavřít a znovu otevřít soubor, aby se nástroj Vyčistit data znovu chytil a nabídl změny. Někdy se chytne hned, někdy mu to trochu trvá. Každopádně se nabídne opět panel, kde máme možnost provést v podstatě ty samé úpravy nově přidaných datech jako v předchozích příkladech.
Nezapomeňte rovněž, že jste zapnuli automatické ukládání na OneDrive, takže se změny uloží na OneDrive, pokud chcete soubor uložit třeba na plochu, tak soubor uložte jako kopii na plochu nebo kamkoliv kam potřebujete.
Limity tlačítka:
- V určitých situacích nedokáže detekovat nesoulad v písmenech (mix malých a velkých písmen)
- Zdá se že nedokáže detekovat chyby v datumech
- Nedokáže detekovat duplicitní řádky
Jak jste viděli, tlačítko Vyčistit data – Clean Data není špatný nástroj. Pro rychlé, základní úpravy dokáže pomoct a ušetřit čas. Zároveň ale platí, že jedno kliknutí vás samo o sobě nespasí. Jakmile pracujete s většími daty, složitější strukturou nebo potřebujete mít nad úpravami plnou kontrolu, bez klasických funkcí a Power Query se neobejdete.



