Премахване на дублирани записи на данни в Excel
Програмите за електронни таблици, като например Excel, често се използват като бази данни за неща като инвентаризация на части, записи за продажби и пощенски списъци.
Бази данни в Excel се състоят от таблици с данни, които обикновено се организират в редици от данни, наречени записи.
В запис данните във всяка клетка или поле в реда са свързани - например име, адрес и телефонен номер на компанията.
Често срещан проблем, възникващ при нарастване на размера на базата данни, е този на дублиращи се записи или редове от данни.
Това дублиране може да се случи, ако:
- Цялата документация се въвежда в базата данни повече от веднъж, което води до две или повече идентични записи
- Няколко записи имат едно или повече полета - например име и адрес - съдържащи едни и същи данни.
Така или иначе, дублиращите се записи могат да причинят множество проблеми - като например изпращане на няколко копия на документи на едно и също лице, когато информацията за база данни се използва в обединяване на пощата - затова е добра идея да сканирате и премахвате дублиращи се записи на редовни основа.
И докато е лесно да се избират дублиращи се записи в малка извадка като тази на изображението по-горе, таблиците с данни могат лесно да съдържат стотици, ако не и хиляди записи, което прави много трудно да се изберат дублирани записи - особено частично съвпадащи записи.
За да бъде по-лесно да се изпълни тази задача, Excel има вграден инструмент за данни, наречен, не е изненадващо, Премахване на дублираните, които могат да бъдат използвани за намиране и премахване на идентични, както и частично съвпадащи записи.
Въпреки това, начина, по който Премахване на дублираните инструмент е проектиран, идентични и частично съвпадение на записите трябва да се разглеждат отделно.
Това е така, защото Премахване на дублираните диалоговия прозорец показва имената на полетата за избраната таблица с данни и избирате кои полета да включите в търсенето на съответстващи записи:
- За идентични записи търсете всички полета - оставете отметки до всички имена на колони или полета;
- За частично съвпадение на записите - оставете отметки само до тези полета.
Име на полета срещу писмото на колоната
Както бе споменато, Премахване на дублираните Инструментът се състои от диалогов прозорец, в който изберете кои полета за съвпадение да търсите, като отметнете желаното име на поле или колона.
Информацията, която диалоговият прозорец показва - имена на полета или колони - зависи от това дали данните ви съдържат ред от заглавия - или заглавията - в горната част на таблицата с данни, както е показано на изображението по-горе.
Ако това се случи - уверете се, че опцията в дясната страна на диалоговия прозорец - Данните ми имат заглавки - е отметнато и Excel ще покаже имената в този ред като имена на полета в диалоговия прозорец.
Ако данните ви нямат заглавен ред, диалоговият прозорец ще покаже съответните букви на колони в диалоговия прозорец за избрания диапазон от данни.
Съседен диапазон от данни
За Премахване на дублираните инструментът да работи правилно, таблицата с данни трябва да бъде съседен диапазон от данни - това означава, че не трябва да има празни редове, колони и, ако изобщо е възможно, няма празни клетки, разположени в таблицата.
Без да имате празни места в таблицата с данни е добра практика, когато става дума за управление на данни като цяло, а не само за търсене на дублирани данни. Другите инструменти за данни на Excel - като сортиране и филтриране - работят най-добре, когато таблицата с данни е съседен диапазон от данни.
Премахване на дублиращи се записи на данни Пример
В горното изображение таблицата с данни съдържа две еднакви записи за А. Томпсън и две съвпадащи записи за R. Holt - където всички полета съвпадат с номера на ученика.
Посочените по-долу стъпки подробно описват начина на използване на Премахване на дублираните инструмент за данни на:
- Премахнете втората от две идентични записа за А. Томпсън .
- Премахнете втория частично съвпадащ запис за R. Holt .
Отваряне на диалоговия прозорец Премахване на дублирания
- Кликнете върху всяка клетка, съдържаща данни в примерната база данни.
- Кликнете върху Данни на лентата.
- Кликнете върху Премахване на дублираните за да маркирате всички данни в таблицата с данни и да отворите Премахване на дублираните диалогов прозорец.
- Най- Премахване на дублираните диалоговия прозорец показва всички заглавия на колони или имена на полета от нашата извадка с данни
- Маркерите за отметки до имената на полетата показват кои колони Excel ще се опитат да съвпадат при търсене на дублирани записи
- По подразбиране, когато се отвори диалоговият прозорец, всички имена на полетата са отметнати
Намиране на идентични записи
- Тъй като търсим напълно идентични записи в този пример, ще оставим проверка на всички заглавия на колоните
- Кликнете Добре
На този етап трябва да се видят следните резултати:
- Диалоговият прозорец трябва да се затвори и да бъде заменен от съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 7 уникални стойности.
- Редът, съдържащ дубликата А. Томпсън записът ще бъде премахнат от базата данни
- Въпреки че има две частично съвпадащи записи за R. Hol t, защото не съвпадат всички полета - студентният номер за двете записи се различава - Excel счита, че това е уникален запис на данни
Намерете и премахнете частично съвпадащи записи с премахване на дублираните
Проверка на едно поле всеки път
Тъй като Excel премахва само записи за данни, които съвпадат точно за избраните полета, най-добрият начин да намерите всички частично съвпадащи записи на данни е да премахнете отметката само за едно поле в даден момент, както е направено в стъпките по-долу.
Следващите търсения на записи, съвпадащи във всички полета, с изключение на име, възраст или програма, ще премахнат всички възможни комбинации за частично съвпадение на записите.
Намиране на частично съвпадащи записи
- Кликнете върху всяка клетка, съдържаща данни в таблицата с данни, ако е необходимо
- Кликнете върху Данни на лентата.
- Кликнете върху Премахване на дублираните за да маркирате всички данни в таблицата с данни и да отворите Премахване на дублираните диалогов прозорец.
- Всички имена на полета или заглавия на колони за таблицата с данни са избрани.
- За да намерите и премахнете записи, които нямат съвпадение във всяко поле, премахнете отметката от тях, освен тези имена на полета, които Excel трябва да игнорират.
- За този пример кликнете върху квадратчето до Идент. № на студентите заглавието на колоната, за да премахнете отметката.
- Сега Excel ще търси и премахне записи, които имат съвпадащи данни в Фамилия , първоначален , и програма полета.
- Кликнете Добре
- Диалоговият прозорец трябва да се затвори и да бъде заменен от съобщение, което казва: 1 намерени и премахнати дублирани стойности; Остават 6 уникални стойности.
- Редът, съдържащ втория запис за R. Holt със студентския идентификационен номер на ST348-252 ще бъдат премахнати от базата данни.
- Кликнете Добре за да затворите полето за съобщения
На този етап таблицата с примерни данни не трябва да съдържа всички дублирани данни.