Excel 2016: Datenanalyse

Duplikate finden

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Die Suche nach Duplikaten ist ein kompliziertes Problem, bei dem die ZÄHLENWENN-Funktion mit ein paar Tricks helfen kann.

Transkript

Duplikate sind ein ebenso wichtiges, wie schwieriges Thema. Angenommen, Sie suchen alle, die Müller heißen, dann ist nur, weil der Nachname Müller ist, natürlich nicht deswegen schon ein Duplikat da. Sie müssen den Vornamen noch prüfen. Und selbst ein Michael Müller muss nicht der gleiche Datensatz sein, auch in dem gleichen Ort, angenommen es sei Berlin, dann hätten Sie sinnvollerweise mehrere Michael Müller, die Sie sich beispielsweise im Jahrgang oder im Geburtsdatum unterscheiden, müssen Sie aber nicht. In so großen Städten ist die Wahrscheinlichkeit, dass häufige Namen auch gleich Geburtsdaten haben, durchaus groß. Ich werde das hier jetzt so ein bisschen vereinfachen, indem ich mir nur die Orte angucke. Ich möchte also alle Datensätzen rausschmeißen aus dem gleichen Ort. Das ist jetzt hier inhaltlich nicht so sinnvoll, weil natürlich unterschiedliche Personen dahinter stecken. Aber es könnte eher sein, dass ich mir hier diese Liste herauskopiere, diesen mittleren Teil und alle Orte einfach haben will. Das bedeutet, ich muss die jetzt irgendwie erkennen. Im einfachsten Fall werde ich die erst mal sortieren, also den Ort anklicken, A bis Z sortieren, und ich sehe jetzt, Aachen gibt es einmal, dann Babenhausen dreifach, Daasdorf am Berge doppelt. Und jeweils einen davon möchte ich kennzeichnen sozusagen als den guten Datensatz, und die anderen ein oder zwei, wenn es die denn gibt, würde ich auch sortieren. Die muss ich also irgendwie filtern können. Dafür brauche ich zuerst mal eine Hilfsspalte, also hier drauf geklickt, Strg+, weil das eine Layout-Tabelle ist, muss hier irgendwas drin stehen, Das könnte ich schon mal als eindeutig kennzeichnen, auch wenn es nicht von Anfang an eindeutig ist. Vielleicht schreiben wir, solange da was Anderes gerechnet wird, auch noch was Anderes rein. "Anzahl vorkommen" ist also das, was ich zuerst aufrechnen kann. Und an dieser Stelle kann ich die ZÄHLENWENN-Funktion einsetzen, die in diesem Bereich, in diesem gesamten Spaltenbereich für den Ort, Semikolon, dieses Kriterium erfüllt. Und wenn Sie genau sehen, sehen Sie hier, Ort ohne Klammeraffe ist die gesamte Spalte, Ort mit Klammeraffe ist das Feld in dergleichen Zeile. Das heißt, ich prüfe, ob in diesem Ort dieser Ort nochmal vorkommt, in dieser gesamten Spalte dieser Eintrag. Klammer zu, und nach dem RETURN wird die Zeile hier nach unten kopiert. Und Sie sehen hier, Babenhausen kommt offenbar dreimal vor, Daasdorf am Berge zweifach und Aachen nur einmal. Das wäre jetzt eigentlich schon guter Ansatz. Es interessieren mir nur noch die Orte, die mehr als einmal vorkommen. Aber bei denen habe ich dann das Problem, dass die jetzt dreimal auftauchen. Ich könnte natürlich prüfen. Das können wir nochmal eben einbauen. Wenn dieses ZÄHLENWENN1 ist, dann zähle ich eine Eins, ansonsten eine Null, Klammer zu. Und mit dem RETURN sehe ich jetzt alle Orte, die mehrfach auftauchen, könnte ich mit dem Filter 1 erwischen. Und falls ich es drauf anlege, könnte ich hier ganz schnöde eine Summe bilden, nämlich über die gesamte Spalte. Das könnte ich hier unten auch in der Ergebniszeile machen, und mit dem RETURN sehe ich jetzt, es gibt 79 eindeutige Orte. Das hilft mir aber beim Filtern überhaupt nicht. Deswegen nehme ich das wieder raus, denn hier habe ich immer noch den gleichen Ort mehrfach. Das ist in Ordnung, wenn Sie rauskriegen wollen, welche das ist. Aber ich will jetzt einen von denen aussortieren, genau genommen will ich Orte, die einfacher auftreten, erwischen und Orte, die mehrfach auftreten, davon will ich nur einen erwischen. Deswegen muss ich da jetzt ganz anders rangehen, also jetzt erst kommt da dieses eindeutig wirklich hin, und die Formel wird völlig anders sein. Der Trick ist, ich werde prüfen, wenn diese Zelle gleich der dadrüber ist, auch wenn da jetzt eine Überschrift drinsteht, das ist allerdings ungeschickt. Die sollte ich gerade nicht nehmen. Dann nehmen wir besser die zweite. Jetzt werden wir gleich sehen, wie viel anders das aussieht. Also =WENN(, diese Zelle gleich der dadrüber ist, dann habe ich ein Duplikat, und Sie sehen, da steht jetzt nur noch die relative Adressierung und nicht der Eintrag Klammer auf für Rot. Wenn die also gleich sind, dann es ist ein Duplikat. Dann sage ich, es ist eine Null oder wenn ich nur die Duplikate sehen will, würde ich es jetzt umgekehrt machen. Semikolon, ansonsten 1, dann es ist ein Ort, den ich haben will, der offensichtlich eindeutig ist. Klammer zu und mit RETURN wird jetzt die Zelle überall mit der Formel gefüllt, auch die, jetzt sehen Sie, da steht nicht mehr Kopfzeile, das kam eben durch das Markieren, sondern die Zelle dadrüber. [unverständlich] auch zu Fuß reinschreiben können, aber in einer der anderen Zellen es ist einfacher. Und jetzt sehen Sie direkt, alle eindeutigen Orte sind hier mit einer 1 versehen, und jetzt kommen die beiden mehrfach auftauchen, denn wie oft ist mir völlig wurscht. Und ich kann an der Stelle filtern beziehungsweise erkennen, je nachdem wie ich es machen möchte, also nehmen wir die mit der 1. Alle eindeutigen Orte sind dabei, und die mehrfachen sind jetzt unterschieden, obwohl Babenhausen selber dreimal vorkommt. Es ist also ein völlig anderer Ansatz, ob Sie nur wissen wollen, wie viele es sind und welche davon doppelt sind oder ob Sie gezielt, dann muss ich jetzt den Filter wieder aufheben, ob Sie gezielt sagen wollen: "Von den dreien will ich einen anders behalten als den vorherigen". Und ich frage einfach hier ab, ob der dadrüber das Gleiche ist, und das gilt für die folgenden Orte, und zwar nur dann, wenn sie sortiert sind, gilt das eben, dass der Ort schon mal vorgekommen ist.

Excel 2016: Datenanalyse

Werten Sie Ihre Listen, Tabellen und Datenbanken mit Hilfe von Microsoft Excel 2016 nach allen Regeln der Kunst aus.

3 Std. 6 min (38 Videos)
Derzeit sind keine Feedbacks vorhanden...

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!