Doppelte Zeilen automatisch in Excel entfernen


Excel ist eine vielseitige Anwendung, die weit über ihre früheren Versionen als einfache Tabellenkalkulationslösung hinausgewachsen ist. Als Rekordhalter, Adressbuch, Prognoseinstrument und vielem mehr nutzen viele Leute Excel sogar in einer Weise, wie es nie beabsichtigt war.

Wenn Sie Excel viel zu Hause oder im Büro verwenden, wissen Sie Manchmal können die Excel-Dateien aufgrund der bloßen Anzahl von Datensätzen, mit denen Sie arbeiten, schnell unhandlich werden.

Glücklicherweise verfügt Excel über integrierte Funktionen, mit denen Sie doppelte Datensätze finden und entfernen können. Leider gibt es ein paar Einschränkungen für die Verwendung dieser Funktionen, seien Sie also vorsichtig oder löschen Sie unwissentlich Datensätze, die Sie nicht entfernen möchten. Außerdem entfernen beide der folgenden Methoden Duplikate, ohne dass Sie sehen können, was entfernt wurde.

Ich werde auch eine Möglichkeit erwähnen, die Zeilen zu markieren, die zuerst dupliziert werden, so dass Sie sehen können, welche entfernt werden durch die Funktionen, bevor Sie sie ausführen. Sie müssen eine benutzerdefinierte Bedingte Formatierungsregel verwenden, um eine Zeile zu markieren, die vollständig dupliziert ist.

Funktion zum Entfernen von Duplikaten

Angenommen, Sie verwenden Excel, um Adressen nachzuverfolgen, die Sie vermuten dass Sie doppelte Datensätze haben. Sehen Sie sich das folgende Excel-Arbeitsblatt an:

Remove Duplicate Excel Records

Beachten Sie, dass der Datensatz "Jones" zweimal angezeigt wird. Um solche doppelten Datensätze zu entfernen, klicken Sie in der Multifunktionsleiste auf die Registerkarte Datenund suchen Sie im Abschnitt Datentoolsnach der Funktion Remove Duplicates. Klicke auf Duplikate entfernenund ein neues Fenster öffnet sich.

Click on Remove Duplicates Button

Hier musst du eine Entscheidung treffen, abhängig davon, ob du Verwenden Sie Überschriften an den Oberseiten Ihrer Spalten. Wenn Sie dies tun, wählen Sie die Option Meine Daten enthält Kopfzeilen. Wenn Sie keine Überschriftenbeschriftungen verwenden, verwenden Sie die standardmäßigen Spaltenbezeichnungen von Excel, wie z. B. Spalte A, Spalte B usw.

Excel Delete Duplicate Records Options

Für In diesem Beispiel wählen wir nur Spalte A und klicken auf die Schaltfläche OK. Das Optionsfenster wird geschlossen und Excel entfernt den zweiten "Jones" -Datensatz.

Excel Removed the Duplicate Record

Natürlich war das nur ein einfaches Beispiel. Alle Adressdatensätze, die Sie weiterhin mit Excel verwenden, sind wahrscheinlich sehr viel komplizierter. Angenommen, Sie haben beispielsweise eine Adressdatei, die so aussieht.

Excel Address Book Duplicate Records

Beachten Sie, dass, obwohl es drei "Jones" -Einträge gibt, nur zwei sind identisch. Wenn wir die obigen Verfahren zum Entfernen doppelter Datensätze verwenden, bleibt nur ein "Jones" -Eintrag bestehen. In diesem Fall müssen wir unsere Entscheidungskriterien so erweitern, dass sowohl die Vor- als auch die Nachnamen in den Spalten A und B enthalten sind.

Klicken Sie dazu noch einmal auf DatenRegisterkarte auf der Multifunktionsleiste und klicken Sie dann auf Remove Duplicates. Dieses Mal, wenn das Optionsfenster angezeigt wird, wählen Sie die Spalten A und B. Klicken Sie auf die Schaltfläche OKund beachten Sie, dass Excel diesmal nur einen der "Mary Jones" -Datensätze entfernt hat.

More Options When Removing Duplicates

Excel wird Ihnen mitteilen, wie viele Duplikate entfernt wurden. Es wird Ihnen jedoch nicht angezeigt, welche Zeilen gelöscht wurden! Scrollen Sie bis zum letzten Abschnitt, um zu sehen, wie Sie die doppelten Zeilen zuerst markieren, bevor Sie diese Funktion ausführen.

Erweiterte Filtermethode

Die zweite Möglichkeit zum Entfernen von Duplikaten besteht in der Verwendung der erweiterten Filteroption. Wählen Sie zuerst alle Daten auf dem Blatt aus. Als nächstes klicken Sie auf der Registerkarte Daten in der Multifunktionsleiste auf Erweitertim Sortieren & amp; Filter-Abschnitt.

Vergewissern Sie sich, dass im angezeigten Dialogfeld nur die Option Nur eindeutige DatensätzeKontrollkästchen.

Sie können die Liste entweder direkt filtern oder die nicht duplizierten Elemente in einen anderen Teil derselben Tabelle kopieren . Aus irgendeinem seltsamen Grund können Sie die Daten nicht auf ein anderes Blatt kopieren. Wenn Sie es auf einem anderen Blatt haben möchten, wählen Sie zuerst einen Ort auf dem aktuellen Blatt und schneiden Sie dann diese Daten aus und fügen Sie sie in ein neues Blatt ein.

Mit dieser Methode erhalten Sie nicht einmal eine Nachricht, wie viele Zeilen wurden entfernt. Die Zeilen werden entfernt und das ist es.

Doppelte Zeilen in Excel hervorheben

Wenn Sie sehen möchten, welche Datensätze doppelt vorhanden sind, bevor Sie sie entfernen, müssen Sie ein wenig manuell arbeiten . Leider hat Excel keine Möglichkeit, Zeilen zu markieren, die vollständig dupliziert sind. Es verfügt über eine Funktion unter bedingter Formatierung, die doppelte Zellen hervorhebt, aber in diesem Artikel geht es um doppelte Zeilen.

Das erste, was Sie tun müssen, ist eine Formel in einer Spalte rechts neben Ihrem Satz hinzuzufügen Daten. Die Formel ist einfach: Verknüpfen Sie einfach alle Spalten für diese Zeile.

= A1 & B1 & C1 & D1 & E1

In meinem Beispiel unten habe ich Daten in den Spalten A bis F. Die erste Spalte ist jedoch eine ID-Nummer, also schließe ich das aus meiner Formel unten aus. Stellen Sie sicher, dass Sie alle Spalten einschließen, deren Daten auf Duplikate überprüft werden sollen.

Ich habe diese Formel in Spalte H eingefügt und dann gezogen es für alle meine Reihen runter. Diese Formel kombiniert einfach alle Daten in jeder Spalte als ein großes Stück Text. Überspringen Sie nun ein paar weitere Spalten und geben Sie die folgende Formel ein:

=COUNTIF($H$1:$H$34, $H1) > 1

Hier verwenden wir die Funktion COUNTIF und der erste Parameter ist die Menge der Daten, die wir suchen wollen beim. Für mich war das die Spalte H (die die Kombinationsdatenformel hat) von Zeile 1 bis 34. Es ist auch eine gute Idee, die Kopfzeile vorher loszuwerden.

Sie werden auch wollen Stellen Sie sicher, dass Sie das Dollarzeichen ($) vor dem Buchstaben und der Zahl verwenden. Wenn Sie über 1000 Datenzeilen verfügen und Ihre kombinierte Zeilenformel beispielsweise in Spalte F ist, würde Ihre Formel stattdessen so aussehen:

=COUNTIF($F$1:$F$1000, $F1) > 1

Der zweite Parameter hat nur den Dollar Melden Sie sich vor dem Spaltenbuchstaben, damit dieser gesperrt ist, aber wir möchten die Zeilennummer nicht sperren. Auch hier ziehen Sie dies für alle Datenzeilen nach unten. Es sollte wie folgt aussehen und die doppelten Zeilen sollten TRUE haben.

Markieren wir nun die Zeilen, die TRUE enthalten sind die doppelten Zeilen. Wählen Sie zunächst das gesamte Datenblatt aus, indem Sie auf das kleine Dreieck am oberen linken Schnittpunkt von Zeilen und Spalten klicken. Wechseln Sie nun zur Registerkarte Start, klicken Sie dann auf Bedingte Formatierungund klicken Sie auf Neue Regel.

Klicken Sie im Dialogfeld auf Verwenden Sie eine Formel, um festzulegen, welche Zellen formatiert werden sollen.

Geben Sie im Feld unter Werte formatieren, für die diese Formel wahr ist:die folgende Formel ein und ersetzen Sie Pdurch Ihre Spalte Das hat die Werte TRUE oder FALSE. Stellen Sie sicher, dass das Dollarzeichen vor dem Spaltenbuchstaben steht.

=$P1=TRUE

Sobald Sie das getan haben, klicken Sie auf Format und klicken Sie auf die Registerkarte Füllung. Wählen Sie eine Farbe und diese wird verwendet, um die gesamte doppelte Zeile hervorzuheben. Klicken Sie auf OK und Sie sollten nun sehen, dass die doppelten Zeilen hervorgehoben sind.

Wenn dies nicht für Sie funktionierte, beginnen Sie erneut und wiederholen Sie den Vorgang langsam. Es muss genau richtig gemacht werden, damit das alles funktioniert. Wenn Sie ein einzelnes $ -Symbol auf dem Weg verpassen, wird es nicht richtig funktionieren.

Vorbehalte mit dem Entfernen von doppelten Datensätzen

Es gibt natürlich ein paar Probleme mit Excel automatisch zu lassen Entfernen Sie doppelte Datensätze für Sie. Zunächst müssen Sie vorsichtig sein, wenn Sie zu wenige oder zu viele Spalten für Excel als Kriterium für die Identifizierung doppelter Datensätze auswählen.

Zu wenig und Sie können Datensätze, die Sie benötigen, versehentlich löschen. Es werden zu viele oder versehentlich eine Bezeichnerspalte und keine Duplikate gefunden.

Zweitens geht Excel immer davon aus, dass der erste eindeutige Datensatz, auf den er stößt, der Masterdatensatz ist. Alle nachfolgenden Datensätze werden als Duplikate angenommen. Dies ist ein Problem, wenn Sie beispielsweise eine Adresse einer der Personen in Ihrer Datei nicht geändert haben, sondern stattdessen einen neuen Datensatz erstellt haben.

Wenn der neue (korrekte) Adressdatensatz nach dem alten erscheint ( veraltete Datensätze) wird Excel davon ausgehen, dass der erste (veraltete) Datensatz der Master ist, und alle nachfolgenden Datensätze löschen, die er findet. Deshalb müssen Sie vorsichtig sein, wie großzügig oder konservativ Sie Excel entscheiden lassen, was ein doppelter Datensatz ist oder nicht.

In diesen Fällen sollten Sie die Hervorhebungsduplikatmethode verwenden, über die ich geschrieben habe, und die Datei manuell löschen entsprechenden doppelten Datensatz.

Schließlich werden Sie in Excel nicht aufgefordert, zu überprüfen, ob Sie einen Datensatz wirklich löschen möchten. Mit den gewählten Parametern (Spalten) ist der Prozess vollständig automatisiert. Dies kann gefährlich sein, wenn Sie eine große Anzahl an Datensätzen haben und Sie davon ausgehen, dass die von Ihnen getroffenen Entscheidungen korrekt sind und Excel die doppelten Datensätze automatisch für Sie entfernen lässt.

Achten Sie auch darauf, dass Sie auschecken unser vorheriger Artikel zu Löschen von Leerzeilen in Excel. Viel Spaß!

Excel - Doppelte Werte - Duplikate

Zusammenhängende Posts:


6.04.2010