Skip to main content

Премахване на дублирани редове от данни в Excel

Как да разбера къде греша, при използването на Remove Duplicates? (Април 2025)

Как да разбера къде греша, при използването на Remove Duplicates? (Април 2025)
Anonim
01 от 02

Премахване на дублирани записи на данни в Excel

Програмите за електронни таблици, като например Excel, често се използват като бази данни за неща като инвентаризация на части, записи за продажби и пощенски списъци.

Бази данни в Excel се състоят от таблици с данни, които обикновено се организират в редици от данни, наречени записи.

В запис данните във всяка клетка или поле в реда са свързани - например име, адрес и телефонен номер на компанията.

Често срещан проблем, възникващ при нарастване на размера на базата данни, е този на дублиращи се записи или редове от данни.

Това дублиране може да се случи, ако:

  • Цялата документация се въвежда в базата данни повече от веднъж, което води до две или повече идентични записи
  • Няколко записи имат едно или повече полета - например име и адрес - съдържащи едни и същи данни.

Така или иначе, дублиращите се записи могат да причинят множество проблеми - като например изпращане на няколко копия на документи на едно и също лице, когато информацията за база данни се използва в обединяване на пощата - затова е добра идея да сканирате и премахвате дублиращи се записи на редовни основа.

И докато е лесно да се избират дублиращи се записи в малка извадка като тази на изображението по-горе, таблиците с данни могат лесно да съдържат стотици, ако не и хиляди записи, което прави много трудно да се изберат дублирани записи - особено частично съвпадащи записи.

За да бъде по-лесно да се изпълни тази задача, Excel има вграден инструмент за данни, наречен, не е изненадващо, Премахване на дублираните, които могат да бъдат използвани за намиране и премахване на идентични, както и частично съвпадащи записи.

Въпреки това, начина, по който Премахване на дублираните инструмент е проектиран, идентични и частично съвпадение на записите трябва да се разглеждат отделно.

Това е така, защото Премахване на дублираните диалоговия прозорец показва имената на полетата за избраната таблица с данни и избирате кои полета да включите в търсенето на съответстващи записи:

  • За идентични записи търсете всички полета - оставете отметки до всички имена на колони или полета;
  • За частично съвпадение на записите - оставете отметки само до тези полета.

Име на полета срещу писмото на колоната

Както бе споменато, Премахване на дублираните Инструментът се състои от диалогов прозорец, в който изберете кои полета за съвпадение да търсите, като отметнете желаното име на поле или колона.

Информацията, която диалоговият прозорец показва - имена на полета или колони - зависи от това дали данните ви съдържат ред от заглавия - или заглавията - в горната част на таблицата с данни, както е показано на изображението по-горе.

Ако това се случи - уверете се, че опцията в дясната страна на диалоговия прозорец - Данните ми имат заглавки - е отметнато и Excel ще покаже имената в този ред като имена на полета в диалоговия прозорец.

Ако данните ви нямат заглавен ред, диалоговият прозорец ще покаже съответните букви на колони в диалоговия прозорец за избрания диапазон от данни.

Съседен диапазон от данни

За Премахване на дублираните инструментът да работи правилно, таблицата с данни трябва да бъде съседен диапазон от данни - това означава, че не трябва да има празни редове, колони и, ако изобщо е възможно, няма празни клетки, разположени в таблицата.

Без да имате празни места в таблицата с данни е добра практика, когато става дума за управление на данни като цяло, а не само за търсене на дублирани данни. Другите инструменти за данни на Excel - като сортиране и филтриране - работят най-добре, когато таблицата с данни е съседен диапазон от данни.

Премахване на дублиращи се записи на данни Пример

В горното изображение таблицата с данни съдържа две еднакви записи за А. Томпсън и две съвпадащи записи за R. Holt - където всички полета съвпадат с номера на ученика.

Посочените по-долу стъпки подробно описват начина на използване на Премахване на дублираните инструмент за данни на:

  1. Премахнете втората от две идентични записа за А. Томпсън .
  2. Премахнете втория частично съвпадащ запис за R. Holt .

Отваряне на диалоговия прозорец Премахване на дублирания

  1. Кликнете върху всяка клетка, съдържаща данни в примерната база данни.
  2. Кликнете върху Данни на лентата.
  3. Кликнете върху Премахване на дублираните за да маркирате всички данни в таблицата с данни и да отворите Премахване на дублираните диалогов прозорец.
  4. Най- Премахване на дублираните диалоговия прозорец показва всички заглавия на колони или имена на полета от нашата извадка с данни
  5. Маркерите за отметки до имената на полетата показват кои колони Excel ще се опитат да съвпадат при търсене на дублирани записи
  6. По подразбиране, когато се отвори диалоговият прозорец, всички имена на полетата са отметнати

Намиране на идентични записи

  1. Тъй като търсим напълно идентични записи в този пример, ще оставим проверка на всички заглавия на колоните
  2. Кликнете Добре

На този етап трябва да се видят следните резултати:

  • Диалоговият прозорец трябва да се затвори и да бъде заменен от съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 7 уникални стойности.
  • Редът, съдържащ дубликата А. Томпсън записът ще бъде премахнат от базата данни
  • Въпреки че има две частично съвпадащи записи за R. Hol t, защото не съвпадат всички полета - студентният номер за двете записи се различава - Excel счита, че това е уникален запис на данни
02 от 02

Намерете и премахнете частично съвпадащи записи с премахване на дублираните

Проверка на едно поле всеки път

Тъй като Excel премахва само записи за данни, които съвпадат точно за избраните полета, най-добрият начин да намерите всички частично съвпадащи записи на данни е да премахнете отметката само за едно поле в даден момент, както е направено в стъпките по-долу.

Следващите търсения на записи, съвпадащи във всички полета, с изключение на име, възраст или програма, ще премахнат всички възможни комбинации за частично съвпадение на записите.

Намиране на частично съвпадащи записи

  1. Кликнете върху всяка клетка, съдържаща данни в таблицата с данни, ако е необходимо
  2. Кликнете върху Данни на лентата.
  3. Кликнете върху Премахване на дублираните за да маркирате всички данни в таблицата с данни и да отворите Премахване на дублираните диалогов прозорец.
  4. Всички имена на полета или заглавия на колони за таблицата с данни са избрани.
  5. За да намерите и премахнете записи, които нямат съвпадение във всяко поле, премахнете отметката от тях, освен тези имена на полета, които Excel трябва да игнорират.
  6. За този пример кликнете върху квадратчето до Идент. № на студентите заглавието на колоната, за да премахнете отметката.
  7. Сега Excel ще търси и премахне записи, които имат съвпадащи данни в Фамилия , първоначален , и програма полета.
  8. Кликнете Добре
  9. Диалоговият прозорец трябва да се затвори и да бъде заменен от съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 6 уникални стойности.
  10. Редът, съдържащ втория запис за R. Holt със студентския идентификационен номер на ST348-252 ще бъдат премахнати от базата данни.
  11. Кликнете Добре за да затворите полето за съобщения

На този етап таблицата с примерни данни не трябва да съдържа всички дублирани данни.