· 

Power Query: Zellinhalte trennen bzw. zusammenfügen

Dieser Artikel zielt darauf ab, das Prinzip des Trennens und Zusammenführens von Zellinhalten zu demonstrieren. Einen schnellen Weg, das Datumsformat anzupassen, beschreibe ich im Blog "Datumsformate anpassen".

Datum aus amerikanischer in deutsche Notation überführen

Beim Einlesen von externen Daten kann es immer wieder vorkommen, dass man Zellinhalte trennen muss. Ein Bespiel ist, wenn Vor- und Nachnamen zusammen in einem Feld stehen, aber getrennt behandelt werden sollen. Vor besondere Probleme ist man gestellt, wenn beispielsweise das Datum in amerikanischer Notation, also MM/DD/YYYY, geliefert wird. Das kann von Power Query nicht als Datum erkannt werden. Da muss man erst die Elemente trennen, also die Tages-, Monats- und Jahresinformation in jeweils ein eigenes Feld laden und danach in der deutschen Form wieder zusammensetzen. Genau das wollen wir einmal durchspielen.

 Datum einlesen und in die Bestandteile auftrennen

 Angenommen, wir bekommen die Absatzinformation einer amerikanischen Kooperationsfirma in folgender Form als csv-Datei geliefert:

Date,Product ID,Order

 9/20/2021,K-1501,23

5/20/2021,K-3101,25

2/14/2021,K-1502,20

3/21/2021,K-1504,9

7/4/2021,K-2601,14

 

Wir können die Struktur also so beschreiben:

  • ·       Die erste Zeile ist die Überschrift
  • ·       Als Trennzeichen wird ein Komma genutzt
  • ·       Das Datum ist im Format MM/DD/YYYY angegeben

Wenn wir diese Tabelle über Daten – Daten abrufen und transformieren – Daten abrufen – Aus Datei –Aus Text/CSV – Daten importieren – Daten transformieren einlesen, teilt Power Query die Felder sofort nach dem genutzten Trennzeichen auf und identifiziert die erste Zeile als Überschrift:

Wenn wir jetzt das Feld „Date“ als Datentyp „Datum“ verstanden haben möchten, so bekommen wir in den meisten Fällen nur „Error“ als Ergebnis. Die Ursache ist klar: Im ersten Datensatz hätten wir als Monatszahl 20, wenn das deutsche Datumsformat zugrunde liegen würde. Wir haben aber nur 12 Monate, also wird eine Fehlermeldung ausgegeben. Wir trennen also diese Spalte in drei auf. Das machen wir im Power Query Editor mit Start – Spalte teilen – Nach Trennzeichen. Dort geben wir das Trennzeichen – in unserem Falle „/“ – ein und erklären, das bei jedem Vorkommen des Trennzeichens getrennt werden soll und bestätigen das. Die entstandene Spalten behalten den ursprünglichen Namen, also Date, gefolgt von einem Punkt und einer von links nach rechts aufsteigenden Nummerierung.

 Aufbereiten und wieder zusammenfügen

 Die benennen wir nach Doppelklick auf den Namen um in Monat, Tag und Jahr. Dann ziehen wir die Tagesspalte vor die mit dem Monat und bekommen dies Bild:

 

Diese drei Spalten markieren wir nun auch, so dass sie wie im Bild grünlich hinterlegt sind. Es ist wichtig, dass die Spalten die angegebene Reihenfolge haben!

 

Jetzt können wir diese Spalten wieder zusammenfügen mit Transformieren – Spalten zusammenführen. Im Dialogfeld wählen wir als benutzerdefiniertes Trennzeichen den Punkt und benennen die Spalte z.B. in „Datum“ um. Dieser Spalten können wir nun über Transformieren – Datentyp: Datum das Datumsformat zuweisen und ab jetzt die Möglichkeiten der Datumsauswertung nutzen.

 

Kommentar schreiben

Kommentare: 0