Odebrat duplicitní řádky dat v aplikaci Excel

01 z 02

Odebrání duplicitních datových záznamů v aplikaci Excel

Odstranit duplikáty - hledání identických záznamů podle názvu pole. © Ted French

Tabulkové programy, jako je například aplikace Excel, se často používají jako databáze pro věci, jako jsou inventář součástí, prodejní záznamy a seznamy.

Databáze v aplikaci Excel jsou tvořeny tabulkami dat, které jsou obvykle uspořádány do řádků dat nazývaných záznamy.

V záznamu jsou související údaje v každé buňce nebo v poli v řádku - například název, adresa a telefonní číslo společnosti.

Obvyklý problém, ke kterému dochází, když databáze roste, je velikost duplicitních záznamů nebo řádků dat.

Tato duplikace může nastat, pokud:

Ať tak či onak, duplicitní záznamy mohou způsobit celou řadu problémů - například zasílání více kopií dokumentů stejné osobě, když se informace o databázi používají při hromadné korespondenci - takže je dobré skenovat a odstranit duplicitní záznamy na pravidelných základ.

A zatímco je snadné vybírat duplicitní záznamy v malém vzorku, jako je ten na obrázku výše, mohou tabulky s údaji snadno obsahovat stovky, ne-li tisíce záznamů, což velmi ztěžuje výběr duplicitních záznamů - zejména částečně odpovídajících záznamů.

Pro usnadnění tohoto úkolu má aplikace Excel vestavěný datový nástroj nazvaný, ne překvapivě, Remove Duplicates , který lze použít k nalezení a odstranění shodných i částečně shodných záznamů.

Jak je však nástroj odstranění duplikátů navržen, identické a částečně shodné záznamy musí být řešeny samostatně.

Důvodem je, že dialogové okno Odebrat duplikáty zobrazuje názvy polí pro vybranou datovou tabulku a vybíráte, která políčka budou zahrnovat do hledání odpovídajících záznamů:

Názvy polí a písmena sloupců

Jak bylo uvedeno, nástroj Odebrat duplikáty se skládá z dialogového okna, ve kterém vyberete odpovídající pole, která chcete vyhledat, a to tak, že zrušíte požadované názvy polí nebo sloupců.

Informace, které se zobrazí dialogové okno - názvy polí nebo sloupce - závisí na tom, zda vaše data obsahují řádek nadpisů - nebo záhlaví - v horní části tabulky dat, jak je vidět na obrázku výše.

Pokud ano, ujistěte se, že v pravé části dialogového okna - Moje údaje má záhlaví - je zaškrtnuto a aplikace Excel zobrazí v dialogovém okně jména v tomto řádku jako názvy polí.

Pokud vaše data neobsahují řádek hlavičky, dialogové okno zobrazí příslušná písmena sloupců v dialogovém okně pro vybraný rozsah dat.

Souvislý rozsah dat

Aby nástroj Odstranit duplikáty fungoval správně, musí být datová tabulka souvislý rozsah dat - to znamená, že nesmí mít žádné prázdné řádky, sloupce a pokud je to vůbec možné, žádné prázdné buňky umístěné v tabulce.

Neexistence polotovarů v tabulce dat je dobrá praxe, pokud jde o správu dat obecně, a to nejen při vyhledávání duplicitních dat. Další nástroje aplikace Excel - například třídění a filtrování - fungují nejlépe, když je datová tabulka souvislý rozsah dat.

Odstranit duplicitní záznamy dat Příklad

Ve výše uvedeném obrázku tabulka obsahuje dvě identické záznamy pro A. Thompsona a dvě částečně shodné záznamy pro R. Holta - kde se všechna pole shodují s číslem studenta.

Následující kroky podrobně popisují použití nástroje Úpravy duplicitních dat:

  1. Odstraňte druhou ze dvou identických záznamů pro A. Thompsona.
  2. Odeberte druhou částečně odpovídající záznam pro R. Holta.

Otevření dialogového okna Odebrat duplikáty

  1. Klepněte na libovolnou buňku obsahující data v ukázkové databázi.
  2. Klepněte na kartu Data na pásu karet.
  3. Klepnutím na ikonu Odstranit duplikáty zvýrazněte všechna data v tabulce s údaji a otevřete dialogové okno Odebrat duplikáty .
  4. V dialogovém okně Odstranit duplikáty se zobrazí všechny nadpisy sloupců nebo názvy polí z našeho vzorku dat
  5. Značky zaškrtnutí vedle názvů polí označují sloupce, ve kterých se aplikace Excel pokusí shodit při hledání duplicitních záznamů
  6. Ve výchozím nastavení, když se otevře dialogové okno všechny názvy polí, jsou zaškrtnuty

Hledání shodných záznamů

  1. Vzhledem k tomu, že v tomto příkladu hledáme zcela shodné záznamy, necháme všechny hlavičky sloupců zkontrolovat
  2. Klepněte na tlačítko OK

V tomto okamžiku je třeba vidět následující výsledky:

02 z 02

Vyhledejte a odeberte částečně odpovídající záznamy s odstraněním duplikátů

Odstranit duplikáty - Hledání částečně odpovídajících záznamů podle názvu pole. © Ted French

Kontrola jednoho pole najednou

Vzhledem k tomu, že aplikace Excel odstraňuje pouze záznamy dat, které přesně odpovídají vybraným polím dat, nejlepší způsob, jak najít všechny částečně shodné datové záznamy, je odstranit značku zaškrtnutí pouze pro jedno pole najednou, jako je tomu v níže uvedených krocích.

Následné hledání záznamů, které odpovídají ve všech polích kromě jména, věku nebo programu, odstraní všechny možné kombinace pro částečně shodné záznamy.

Hledání částečně shodných záznamů

  1. V případě potřeby klikněte na libovolnou buňku obsahující data v tabulce dat
  2. Klepněte na kartu Data na pásu karet .
  3. Klepnutím na ikonu Odstranit duplikáty zvýrazněte všechna data v tabulce s údaji a otevřete dialogové okno Odebrat duplikáty .
  4. Jsou vybrány všechny názvy polí nebo záhlaví sloupců pro tabulku dat.
  5. Chcete-li vyhledat a odebrat záznamy, které nemají shodu v každém poli, odeberte zaškrtnutí vedle názvů polí, které aplikace Excel ignoruje.
  6. V tomto příkladu klikněte na zaškrtávací políčko vedle záhlaví sloupce Student ID pro zrušení zaškrtnutí.
  7. Aplikace Excel nyní vyhledá a odebere pouze záznamy, které mají odpovídající data v polích Příjmení , Počáteční a Program .
  8. Klepněte na tlačítko OK
  9. Dialogové okno by mělo být uzavřeno a nahrazeno zprávou s nápisem: 1 nalezené a odstraněné duplicitní hodnoty; Zůstanou 6 jedinečných hodnot.
  10. Řádek obsahující druhý záznam pro R. Holta se Student ID ST348-252 bude odstraněn z databáze.
  11. Klepnutím na tlačítko OK zavřete okno zprávy

V tomto okamžiku by tabulka příkladů dat neměla obsahovat všechna duplicitní data.