Schlagwort-Archive: Excel

Excel – jede Zeile als eigene Seite ausdrucken

Selten kommt es vor, dass man Daten aus Excel ausdrucken möchte. Möchte man nur die Tabelle ausdrucken, muss lediglich die Seite korrekt eingerichtet werden. Anders sieht es aus, wenn man aus irgendeinem Grund jede Zeile der Tabelle auf einem eigenen Blatt ausdrucken möchte. Excel bietet dafür keine Funktion. Der eleganteste Weg wäre natürlich, ein kleines Skript in Visual Basic zu schreiben, dass kann aber nicht jeder – ich sowieso nicht.
Ein recht einfacher Weg führt über Word. Dort können wir die Funktion Seriendruck verwenden. Der Serienbrief ist normalerweise dafür gedacht, einen Standardbrief an viele Empfänger zu versenden, also nur die Adressdaten auszutauschen. Diese Daten werden normalerweise aus einer Datenbank oder Tabelle importiert und im Dokument angeordnet. Die Funktion kann aber auch dazu verwendet werden, beliebige Daten auszudrucken. Dazu gehen wir folgendermaßen vor:
Wir öffnen ein leeres Dokument in Word und starten den Assistenten für Seriendruck. Diesen finden wir unter Extras, in Word 2003 dort unter „Briefe und Sendungen“. Dort wählen wir „Serienbrieferstellung“. Anschließend öffnet sich der Aufgabenbereich, dort wählen wir Briefe und klicken auf „Weiter“. Wir verwenden das aktuelle Dokument und klicken auf „Weiter“. Auf der folgenden Seite wählen wir „Vorhandene Liste verwenden“ und suchen nach unser Excel-Tabelle.
Jetzt sagen wir zu allem „Ja“ und „Weiter“, bis sich das Dialogfeld und das Auswahlfeld für die Daten schließt. Anschließend können wir Daten einfügen, was wir auch machen, dazu wählen wir aus dem Aufgabenbereich die Option „Weitere Elemente“. Es öffnet sich ein Dialogfeld, wo wir die Spaltenköpfe unserer Tabelle lesen können. Hier klicken wir bei den Spalten, die wir eingefügt haben wollen auf „Einfügen“, diese erscheinen im Dokumentenfenster, sie sind grau unterlegt, da es sich um Datenfelder handelt. Anschließend klicken wir auf „Schließen“.
Jetzt wollen wir das Ganze mal anständig formatieren. Der Text, den wir jenseits der grauen Felder einfügen, wird auf jeder Seite des Dokumentes angezeigt. Diesen Text können wir natürlich auch formatieren. Mit Return oder Leerzeichen solltest du außerdem dafür sorgen, dass nicht alle Datenfelder zusammenkleben, achte dabei darauf, dass die Klammern zu den Datenfeldern gehören und nicht abgetrennt werden sollen. Im Aufgabenbereich kannst du zwischen Vorschau und Dokumentbearbeitungsansicht hin und her wechseln, bis du mit der Ansicht zufrieden bist.
Ich empfehle vor dem Ausdruck vieler Seiten ein testweise drüberschauen, da sich immer Fehler einschleichen können. Ein guter und einfacher Trick ist, das ganze Dokument zuerst als PDF auszudrucken. Dazu musst du natürlich ein Programm zur Erstellung von PDF-Dateien installiert haben, dass sich über den Druckerdialog der Textverarbeitung ansprechen lässt. Viel Erfolg.

Daten aus einem PDF in eine Excel-Tabelle übertragen

Leider kommt es recht häufig vor, dass Daten in einem PDF geliefert werden. Es ist leider kaum möglich, diese Daten einfach in eine Tabelle zu übertragen, um sauber mit ihnen arbeiten zu können. PDF ist eigentlich ein Format für den Druck und enthält deshalb kaum Strukturinformationen.

Ein recht einfacher Weg ist, die Daten in ein CSV-Format zu übertragen. Das klappt beispielsweise recht gut, wenn nach jedem Datum ein Zeilenumbruch vorhanden ist und jeder Datenabschnitt durch zwei Zeilenumbrüche gekennzeichnet ist. Zum Beispiel

Name: Mustermann
Vorname: Max
Telefon: 0221 000000

Name: Mustermann
Vorname: Erika
Telefon: 02106 00000

Um herauszufinden, ob das bei eurem Dokument der Fall ist, speichert ihr das PDF-Dokument über euer Leseprogramm im reinen Textformat txt. Der oben beschriebene Weg klappt auch, wenn statt einem Zeilenumbruch immer doppelte Leerzeichen oder etwas in der Art vorhanden ist.

In jeder Textverarbeitung kann man gezielt nach Absätzen oder ähnlichen Textformatierungen suchen. Über die Suchen-und-Ersetzen-Funktion kann man diese Absätze gezielt suchen und durch ein Semikolon ersetzen lassen.

Wichtig ist dabei, eventuell vorhandene Semikola vor dieser Aktion zu entfernen, damit diese nicht als Markierung einer Tabellenzelle gewertet werden. Sind die Semikola wichtig, müssen sie vorher maskiert werden.

Zunächst sollten wir nach doppelten Absätzen suchen und diese durch doppelte Semikola ersetzen. Dadurch vermeiden wir fehlerhafte Ersetzungen. Haben wir alle doppelten Zeilenumbrüche entfernt, suchen wir nach einfachen Zeilenumbrüchen und ersetzen diese jeweils durch ein Semikolon.

Das Resultat sollte so aussehen:

Name: Mustermann;Vorname: Max;Telefon: 0221 000000;;Name:Mustermann;Vorname: Erika;Telefon: 02106 00000

Ich empfehle hier das reine Textformat und kein RTF- oder sonstige Dateiformate zu verwenden, weil es da Probleme mit der Zeichencodierung oder sonstigen Sonderzeichen geben kann. Wir schließen also das Textdokument und ändern das Dateiformat von .txt. in .csv.

Wir könnten an dieser Stelle schon hingegen und die überflüssigen Inhalte aus den Zellen entfernen, um sie als Spaltennamen zu verwenden. Das kann aber auch in der Tabellenkalkulation erledigt werden. Das geschieht ebenfalls durch die Suchen-und-Ersetzen-Funktion, diesmal suchen wir zum Beispiel nach der exakten Zeichenkette „Vorname: “. Um Nacharbeiten zu vermeiden, solltet ihr darauf achten, in einem Schritt mit dem überflüssigen begriff auch die Leer- und Satzzeichen zu entfernen. Ansonsten kann es zu Problemen kommen, wenn ihr zum Beispiel eine Spalte nach Postleitzahlen oder Anfangsbuchstaben sortieren wollt. Achtet darauf, dass auch leere Werte in die Tabelle übernommen werden, ansonsten rutschen euch sämtliche Werte durcheinander und die Tabelle ist praktisch unbrauchbar.

Da die meisten PDF-Dateien nicht sauber strukturiert sind, werden hier einige Nacharbeiten nötig sein, dennoch hoffe ich, dass ihr durch die oben beschriebenen Schritte ein wenig Zeit spart. Viel Erfolg.

Werkstattbericht: Besucherstatistik aufbereiten

So ein Tracking-System wirft schon nach kurzer Zeit unglaubliche Mengen an Daten aus – von denen viele uninteressant sind. Ich habe jetzt mal für einen Auftraggeber diese Daten in einer Präsentation aufbereiten dürfen und erzähle hier ein wenig über die Schwierigkeiten, die damit verbunden waren.

Aufbereitung für das Publikum

Am Anfang steht zunächst einmal die Entscheidung, für wen die Präsentation gedacht ist. Der Abteilungsleiter soll andere Indikatoren gezeigt bekommen als das Team, der Vorstand bekommt eine andere Präsentation als die Agentur.
Unter diesem Gesichtspunkt werden die zu präsentierenden Daten ausgewählt. Praktisch immer dabei sind folgende Indikatoren

  • Zahl der Besucher und Zahl der wiederkehrenden Besucher
  • Entwicklung in einem bestimmten Zeitraum
  • Besuchsdauer pro Besuch und ansichtszeit pro Seite
  • Besuchstiefe bzw. Zahl der aufgerufenen Seiten pro Besucher
  • die am meisten besuchten Seiten
  • Herkunft der Besucher im Verhältnis, also Suchmaschinen, Referrer und direkte Zugriffe
  • Suchbegriffe, mit denen die Menschen auf die Site gekommen sind
  • Links, mit denen die Menschen auf die Site gekommen sind

Web-Analytics-Spezialisten würden an dieser Stelle mit Segmentierung und Key Performance Indicators loslegen, die lasse ich mal weg,
Nach dem Motto one fits all stellt man fürs erste alle nötigen Daten zusammen und passt die fertige Universal-Präsentation den Bedürfnissen des jeweiligen Publikums an.
Wichtig ist auch, dass die Präsentation sozusagen als Stand-Alone auch ohne verbundenen Vortrag verständlich ist. Das gilt zumindest für jene Leute, die mit den Grundbegriffen der Webstatistik nicht vertraut sind.

Summary by Month
Month Daily Avg Monthly Totals
Hits Files Pages Visits Sites kB F kB In kB Out Visits Pages Files Hits
Jan 2011 3001 2521 1852 501 4403 1101607 16 264 15058 55572 75645 90038
Dec 2010 3033 2542 2006 453 4222 1097806 10 194 14060 62202 78809 94030
Nov 2010 3504 2951 2208 505 4894 1477157 8 110 15162 66269 88532 105126
Oct 2010 2771 2305 1894 411 3550 1129190 5 73 12758 58719 71483 85927
Sep 2010 3108 2638 1932 357 3822 1661796 2 31 10732 57965 79140 93241
Aug 2010 2569 2114 1488 306 3195 1609455 9 157 9489 46144 65546 79641
Jul 2010 2729 2215 1639 356 3032 1647896 2 39 11039 50823 68687 84622
Jun 2010 3239 2592 1809 387 3591 1577980 4 47 11629 54284 77774 97175
May 2010 2856 2286 1570 464 3709 1253466 0 0 14412 48677 70874 88566
Apr 2010 3083 2408 1790 490 3400 1255565 3 40 14707 53716 72262 92519
Mar 2010 4010 3317 2093 479 4560 1700109 3 13 14866 64886 102833 124320
Feb 2010 3584 3065 2046 407 3472 1352102 5 20 11396 57290 85824 100379
Totals 16864128 66 987 155308 676547 937409 1135584

Die Tabellenkalkulation ist der Königsweg

Anfänger werden eventuell versucht sein, eine Tabelle aus dem Browser direkt in das Präsentationstool zu kopieren, das dürfte in der Regel schief gehen. Wer schon mal versucht hat, eine Tabelle aus einem PDF zu kopieren, kennt das Ärgernis, es klappt ums Verrecken nicht. doch selbst eine HTML-Tabelle kann man nicht ohne Weiteres in Excel 2000 importieren, zumindest hat es bei mir nie unfallfrei funktioniert.
Man exportiert also den ganzen Wust an Daten aus der Webanwendung – in meinem Fall eTracker – heraus und verwendet dafür unbedingt das Format Excel! Alles andere bringt später Probleme.

Die grapphische Aufbereitung

eTracker bietet eine gewisse Zahl an Visualisierungen in Form von Kreis-, Balken- oder Kurvendiagrammen. Man kann sich ein passendes Diagramm auswählen und als Pixelgraphik speichern. Mein Tip: Laßt es bleiben, macht die Diagramme in Excel. Die Diagramme aus eTracker sind zur Nachbearbeitung ungeeignet, Excel bietet dafür bessere Möglichkeiten. Excel ist vom Handling her außerdem wesentlich bequemer als sämtliche webbasierten Interfaces.

Bereinigung der Tabellen

Wenn man die Daten für ein Jahr exportiert, entsteht eine recht große Datei. Bei sehr großen Websites könnten zumindest ältere Excelversionen ins Stolpern kommen, weil sie nicht mehr als 66.000 Zeilen pro Tabellenblatt vorsehen. Wie dem auch sei, der erste Schritt besteht darin, die Arbeitsmappe von überflüssigem Quatsch zu reinigen, zum Beispiel „Datum des letzten Zugriffs“. Möchte man die Originalmappe behalten – dagegen spricht ja nichts – legt man sich für die Arbeit eine Kopie an und löscht zunächst alle Tabellenblätter, die man nicht benötigt. Als nächstes löscht man alle Spalten, die man nicht braucht oder blendet sie aus.
Auch die Zelleninhalte müssen eventuell angepasst werden. Der Titel einer Spalte oder Zeile muss so benannt werden, dass er auch von Leuten verstanden wird, die nichts mit Webanalyse zu tun haben. Die Feinformatierung der Tabellen kommt hingegen später dran.

Von der Tabelle zur Graphik

Diagramme lockern die Präsentation auf, sie machen trockene Daten anschaulich und bringen nicht zuletzt Farbe und Dynamik in den Vortrag. Am einfachsten ist die Diagramm-Erstellung mit dem Diagramm-Assistenten von Excel.
Zunächst wählt man die zu zeigenden Daten aus. Nehmen wir an, es seien jeweils die Top-Ten. Mehr als 11 Spalten lassen sich auf einem Chart auch kaum noch lesbar unterbringen. Elf Spalten weil Top-Ten plus Überschrift. Auch die Spaltenzahl sollte begrenzt bleiben, fünf spalten sollten noch überschaubar sein.
Wir sortieren also die Werte in der Tabelle absteigend und löschen alle Zeilen, die wir nicht benötigen oder blenden sie aus. Es bleiben die Top-Ten übrig, die unnötigen Spalten sollten wir bereits gelöscht oder ausgeblendet haben.
Wenn man nicht gerade Conversions macht, reichen im Idealfall drei Diagrammtypen: das Säulendiagramm für sehr viele Werte, das Balkendiagramm für bis zu zehn Werte und das Kreisdiagramm, um das Verhältnis einzelner Indikatoren in großen Ganzen anzuzeigen. Im Wesentlichen können wir hier die Diagrammtypen übernehmen, wie sie von unserer Web-Ana-Software vorgeschlagen werden, basteln sie aber trotzdem selber in Excel.
Zunächst einmal markieren wir die zu verwenden Werte für das Diagramm, zum Beispiel die Spalten Besucher und Monat. Der Monat wird im Säulendiagramm auf der X-Achse angezeigt, während die Zahl der Besucher von der Y-Achse abgebildet wird. An dieser Stelle freuen wir uns darüber, dass wir die Daten als Excel und nicht als CSV exportiert haben, hier lauert eine böse Falle. Excel erkennt die Werte im CSV-Format nicht richtig, weil die Spalten nicht korrekt formatiert werden . Mit reinen Zahlen hat Excel kein Problem, weiß aber nicht, dass der 1. April ein Datum ist, wenn die Zellen nicht als Datum formatiert wurden und das kann CSV nicht.
Die zweite Falle lauert im Balkendiagramm. Wenn man hier die Werte absteigend sortiert hat, werden sie im Balkendiagramm aufsteigend angezeigt: der längste Balken befindet sich unten, da gehört er aber nicht hin. Die Werte müssen in der Tabelle aufsteigend sortiert werden, damit sie im Diagramm absteigend angezeigt werden. Alles logisch, oder?
Ich empfehle hier auf unnötigen Protz zu verzichten. Der Mehrwert von Balken- und Säulen-Diagrammen in 3D leuchtet mir nicht ein, auch wenn Avattar ein Riesenerfolg ist. Ihr müsst daran denken, dass die Charts eventuell auch ausgedruckt noch verständlich sein müssen und da die 3D-Effekte durch Farbvariationen erzeugt werden, ist das bei einem Schwarz-Weiß-Drucker nicht unbedingt gegeben. Entsprechendes gilt für den Einsatz von Farben zur Informationsvermittlung. Abgesehen von der großen Verbreitung der Rot-Gründ-Schwäche oder anderer Farbfehlsichtigkeiten muss man überlegen, ob die verwendeten Farben im Graustufen-Druck eine Unterscheidung der Indikatoren noch erlauben.
Aus einem unbekannten Grund verwendet Excel für die Beschriftung der Achsen und Legenden eine viel zu kleine Schrift. Das ändert man mit einem Rechtsklick auf das Element und passt die Schriftgröße und alles Weitere an.

Aussagen und Interpretationen

Um eine ordentliche Präsentation zustande zu bekommen, brauchen wir Tabellen, Visualisierungen und Aussagen. Das heißt, die wichtigsten Aussagen, die wir in unseren Daten gefunden haben, werden zusammengefasst und mit Zahlen unterfüttert. Wir merken uns hier: wir machen keine Aussagen, die nicht mit den Daten belegt werden können, die IN DEM CHART VORKOMMEN. Auf Nachfrage müssen wir in der Lage sein, sämtliche gemachte Aussagen und Interpretationen mit den Zahlen aus den Charts belegen zu können.
Zu jeder Tabellen-Diagramm-Kombination gehören Anmerkungen. Diese Anmerkungen fassen entweder das Gezeigte zusammen, weisen auf Besonderheiten hin oder zeigen ablesbare Trends auf.
Dafür gibt es bekannte Standards bei Präsentationen: knapp, prägnant, keine ganzen Sätze, kein Fachjargon – es sei denn, das Publikum versteht ihn.

Schönheitskur

Der lästigste Job ist die Aufhübschung der Präsentation. Das Kernproblem ist hier die Arbeit mit zwei verschiedenen Programmen. Excel und PowerPoint arbeiten nicht so reibungslos zusammen, wie man das gerne hätte. Deswegen werden Schönheitsreparaturen erst an der fertigen Präsentation vorgenommen.
Auch eine Tabelle kann schön sein. Nun ja, zumindest kann man sie lesbarer machen. Hear, what I did: Die Spaltenköpfe werden gefettet und zentriert, um sie von den Daten darunter hervorzuheben. Alle werte in den Tabellen werden vertikal zentriert. Achtet hierbei auf die Konsistenz, wenn ihr das bei einer Tabelle macht, dann macht es bei allen anderen Spalten auch. Man verwendet den höchstmöglichen Schriftgrad. Außerdem sollen die Spalten nicht all zu viel Luft zwischen den Inhalten lassen. Eine zweispaltige Tabelle muss nicht den gesammten Folienraum einnehmen.
Zahlenwerte werden immer so gruppiert, dass Komma bzw. Dezimalpunkt untereinander sind, das heißt, die Zahlen werden zumeist rechtsbündig ausgerichtet, wenn die enthalteten Werte sehr unterschiedlich sind.
Der Dezimalpunkt wird eingesetzt, um die Lesbarkeit langer Zahlen zu erhöhen. Das heißt also: 100, 1.000, 1.000.000 und so weiter.
Es kann auch sinnvoll sein, Farbschemata für die Diagramme einzusetzen. Ich meine damit, dass auch die Diagramme einer einheitlichen Gestaltung folgen sollten. Allerdings sind meine Überlegungen hierzu nicht so weit gediehen. Man kann aber zum Beispiel das Corporate Design der Firma für die Diagramme einsetzen. Hier gilt, was ich weiter oben zum Druck und zur Farbenblindheit gesagt habe, also Farben sparsam einsetzen, vor allem, wenn man sich der Wirkungen von Farben nicht so bewusst ist.

Die eigenen Fehler sieht man nicht

Bevor ihr das Ding einem Vorgesetzten gebt oder es gar präsentiert, lasst jemanden drüberschauen. Die Fehler der Anderen sieht man am leichtesten, aber immerhin erspart man sich damit eine Blamage. Es sind schon die seltsamsten Fehler aufgetreten, die von einem selbst unentdeckt bleiben. An einer Stelle schreibt man den Firmennamen falsch, an einer anderen vergißt man die Überschrift einer Folie. Das muss nicht sein.
Ich habe unzählige Stunden dabei verbracht, die Fehler, die ich hier beschrieben habe zu machen und daraus zu lernen. Die „lesson learned“ dabei ist, dass man es nur so wirklich lernen kann. Dennoch hoffe ich, dass ich dem einen oder anderen mit diesem Werkstattbericht eine Hilfe geben konnte. Fehler machen ist okay. Alle Fehler immer wieder machen ist hingegen dumm.