Excel 2016: Datenanalyse

Duplikate entfernen

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Es gibt eine Reihe von Möglichkeiten, um Duplikate aus einer Liste zu entfernen. Dabei kommt es vor allem darauf an, wie radikal das Löschen ausfallen soll.

Transkript

Ich kann in Excel mit einer solchen Formel Duplikate finden. Wenn die Nachbarzelle identisch ist mit dem dadrüber, erkläre ich das zu einem Duplikat, dann [] ich den Wert 0 oder was Sie wollen FALSE (falsch) oder irgendwas Anderes oder wenn das nicht der Fall ist, wenn die sich unterscheiden, gibt es den Wert 1. Ich habe mit 1 also jetzt alle gekennzeichnet, die hier kein Duplikat sind. Da könnte ich jetzt einfach eine Summe bilden und wüsste, wie viel eindeutige Orte da stehen. Was mache ich jetzt mit den Duplikaten? Ich könnte zum Beispiel sagen, alle, die so eine Null drinstehen haben, beispielsweise diese Datensätze, die will ich loswerden. Das ist hier natürlich nicht wirklich sinnvoll, weil da noch mehr Daten drinstehen. Aber ich tue mal so, als sei das ein unerwünschter Datensatz. Jetzt gibt es verschiedene Methoden, die da herauszufinden. Die will ich natürlich nicht alle einzeln markieren. Ich könnte zum Beispiel hier filtern. Also würde an der Stelle sagen, alle die nur Null haben, sind meine Duplikate. Nach dem "OK" sind die rausgefiltert. Jetzt ist die Versuchung sehr groß, einfach zu sagen, da markieren wir die kurz alle, Strg+A, und jede andere Form der Markierung hilft übrigens auch nicht und würde die jetzt entfernen. Da habe ich eine schlechte Nachricht. Es würde alle Daten entfernen. Alle, die hier irgendwie markiert sind, sind nämlich auch die, die im Hintergrund weggefiltert sind. Sie sehen das an solchen Stellen wie hier zwischen Zeilen 14 und 15, da ist keine Doppellinie, weil es hier auch die Nachbarzeile ist. Aber zwischen 15 und 18 sehe ich im Zeilenkopfschnitt Doppellinie, aber hier nicht, also 16, 17 sind noch mitmarkiert. Ich nutze an der Stelle immer die F5-Taste. Das können Sie aber auch hier oben auswählen, nämlich mit "Gehe zu". Das ist die Gleiche und wechsle dort auf "Inhalte". Und da gibt es die Möglichkeit, innerhalb der Markierung nur die sichtbaren Zellen anzuzeigen. Achten Sie mal auf diese einfache Linie, die eine einfache Linie bleiben wird, und auf diese, die zu einer Doppellinie wird. Mit dem "OK" nehme ich jetzt. Jetzt erst sind wirklich nur die sichtbaren Zellen, nämlich die gefilterten markiert. Das merke ich spätestens dann, wenn ich jetzt den Filter einfach aufhebe und sehe, was wirklich markiert war. Die könnte ich jetzt entfernen, bunt färben oder auch was ich sonst immer Lust habe. Also das ist die eine Möglichkeit. Ich habe jetzt alle Duplikate, alles, das was ich für ein Duplikat halte, markiert und kann dann sozusagen normal weiterarbeiten. Was ich nicht kann, ist jetzt die gesamte Zeile entfernen. Da wehrt sich Excel bei so einer Mehrfachmarkierung. Ich müsste die also doch irgendwie einzeln behandeln. Dann kommt die nächste gute Idee. Ich hebe mal die Markierung wieder auf. Ich kann die doch einfach nach dieser Spalte sortieren. Da habe ich eine schlechte Nachricht, denn diese Formel prüft die Nachbarzelle und vergleicht die mit darüber. Wenn Sie nach dieser Spalte sortieren, verlieren Sie diese Sortierung und zum Beispiel diese beiden finden nicht mehr den Wert davor. Es ist eine andere davor Zelle. Das heißt, diese Spalte dürfen Sie auf keinen Fall sortieren, wenn die Werte nicht fixiert sind. Das werde ich also zuerst machen. Hier mit Strg+ eine neue Spalte einfügen. Weil das hier so eine Layout-Tabelle ist, hat die irgendwie diesen provisorischen Namen Spalte 1. Das nenne ich dann mal "Eindeutig fixiert". Ich werde nichts Anderes machen, als dafür sorgen, dass dieser Wert, der hier drinsteht, auf jeden Fall unverändert bleibt und im Grunde dann auch gelöscht werden kann, also die Daten hier oben anklicken, markieren, dann kopieren und jetzt da muss ich noch aufpassen, dass ich in der obersten Zelle stehe, nicht einfach so einfügen. Es geht auch hier im PopART-Menü sondern nur die Werte. Das können Sie auch da oben haben. Das ist dieses 123 ohne irgend Prozent oder Pinsel dabei. Wenn ich das gemacht habe, stehen hier erst mal die gleichen Zahlen. Mit der ESC-Taste hebe ich diese Ameisen-Kolonien-Markierung auf. Jetzt sehe ich hier, es ist berechnet und da ist es echt. Und wenn ich jetzt nämlich sortiere einfach nach Größe, dann werden Sie verstehen, hier sind sauber alle Nullen sortiert. Das sind die Duplikate, und da kommen jetzt die ganzen Einsen. Hier hingegen ist die Formel angepasst worden, und das heißt, die beiden Babenhausen stehen noch schön hintereinander, aber das ist schon der zweite und das ist der dritte. Der wird gar nicht mehr für ein Duplikat gehalten, obwohl das alles, was hier mit diesen Nullen festgehalten und sortiert ist, alles Duplikate sind. Und nur manche davon werden durch diese dynamische Formel noch erkannt, weil Sie nämlich die Reihenfolge geändert haben. Deswegen müssen Sie vorher fixieren. Diese Spalte ist natürlich überflüssig jetzt. Die funktioniert nur, wenn der Ort richtig sortiert ist. Deswegen musste ich das vorher nur die Werte in der Nachbarspalte kopieren. Jetzt könnte ich tatsächlich hingehen, und dann muss ich mal den Letzten mit einer Null angucken, mit Umschalt+Klick markieren, und jetzt wäre auch möglich, mit Strg+- alle Daten zu entfernen. Das mache ich mal rückgängig, das heißt, diese Spalte können wir ruhig drin lassen, aber diese sollte sortiert sein. Sofern es ein halbherzig ist, rückgängig mit Strg Position 1, springe ich wieder an Anfang und jetzt sollten die alle funktionieren. Die Reihenfolge hat sich hier geändert, aber einer von denen ist immer noch der gültige. Es war also offensichtlich, diese Nummer, da müsste ich nämlich zuerst die Startnummer sortieren, die den gültigen Datensatz und die anderen beiden, die die ungültigen markiert. Excel selber kennt aber auch noch eine Lösung und dies ist so einfach wie radikal. Das heißt, ich habe wieder meine Liste. Die Reihenfolge ist sogar egal. Und finde ich jetzt hier bei Daten etwas versteckt "Duplikate entfernen". Wenn ich dadrauf klicke, dann muss ich angeben, welche von denen jetzt als Duplikat gelten, also erst mal nichts markieren, und ich würde im Moment sagen, der Ort alleine reicht, mehr Duplikate habe ich nicht, kann natürlich an der Stelle auch noch das Bundesland angeben, denn wenn es die Orte eindeutig gibt, dann gehören die so zusammen. Ein Bachenberg gibt es nur in Rheinland-Pfalz oder ein Aachen nur in Nordrein-Westfalen. Aber es kann natürlich Orte geben so wie Neustadt, die so häufig sind, dass sie in verschiedenen Bundesländern vorkommen. Und wenn ich jetzt das mit "OK" bestätige, dann sind die so was von schnell weg. Ich sehe auch hinterher nur, was schief gegangen ist. Sie sollten auf jeden Fall vorher die Datei speichern. Und mit dem "OK" kriege ich hinterher nur gesagt, was alles gelöscht worden ist. 65 Daten sind noch da. 43 sind weg, ohne dass ich jetzt erfahren habe, welche. Und nach dem "OK" können Sie bestenfalls noch ungespeichert rausgehen. Es geht also nicht mehr bis Zeile 114, sondern nur noch bis Zeile 71. Dafür ist das insgesamt die effektivste Methode des Löschens, aber leider wirklich weg.

Excel 2016: Datenanalyse

Werten Sie Ihre Listen, Tabellen und Datenbanken mit Hilfe von Microsoft Excel 2016 nach allen Regeln der Kunst aus.

3 Std. 6 min (38 Videos)
Derzeit sind keine Feedbacks vorhanden...

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!