Schlagwort-Archive: Excel

Excel – jede Zeile als eigene Seite ausdrucken

Selten kommt es vor, dass man Daten aus Excel ausdrucken möchte. Möchte man nur die Tabelle ausdrucken, muss lediglich die Seite korrekt eingerichtet werden. Anders sieht es aus, wenn man aus irgendeinem Grund jede Zeile der Tabelle auf einem eigenen Blatt ausdrucken möchte. Excel bietet dafür keine Funktion. Der eleganteste Weg wäre natürlich, ein kleines Skript in Visual Basic zu schreiben, dass kann aber nicht jeder – ich sowieso nicht.
Ein recht einfacher Weg führt über Word. Dort können wir die Funktion Seriendruck verwenden. Der Serienbrief ist normalerweise dafür gedacht, einen Standardbrief an viele Empfänger zu versenden, also nur die Adressdaten auszutauschen. Diese Daten werden normalerweise aus einer Datenbank oder Tabelle importiert und im Dokument angeordnet. Die Funktion kann aber auch dazu verwendet werden, beliebige Daten auszudrucken. Dazu gehen wir folgendermaßen vor:
Wir öffnen ein leeres Dokument in Word und starten den Assistenten für Seriendruck. Diesen finden wir unter Extras, in Word 2003 dort unter „Briefe und Sendungen“. Dort wählen wir „Serienbrieferstellung“. Anschließend öffnet sich der Aufgabenbereich, dort wählen wir Briefe und klicken auf „Weiter“. Wir verwenden das aktuelle Dokument und klicken auf „Weiter“. Auf der folgenden Seite wählen wir „Vorhandene Liste verwenden“ und suchen nach unser Excel-Tabelle.
Jetzt sagen wir zu allem „Ja“ und „Weiter“, bis sich das Dialogfeld und das Auswahlfeld für die Daten schließt. Anschließend können wir Daten einfügen, was wir auch machen, dazu wählen wir aus dem Aufgabenbereich die Option „Weitere Elemente“. Es öffnet sich ein Dialogfeld, wo wir die Spaltenköpfe unserer Tabelle lesen können. Hier klicken wir bei den Spalten, die wir eingefügt haben wollen auf „Einfügen“, diese erscheinen im Dokumentenfenster, sie sind grau unterlegt, da es sich um Datenfelder handelt. Anschließend klicken wir auf „Schließen“.
Jetzt wollen wir das Ganze mal anständig formatieren. Der Text, den wir jenseits der grauen Felder einfügen, wird auf jeder Seite des Dokumentes angezeigt. Diesen Text können wir natürlich auch formatieren. Mit Return oder Leerzeichen solltest du außerdem dafür sorgen, dass nicht alle Datenfelder zusammenkleben, achte dabei darauf, dass die Klammern zu den Datenfeldern gehören und nicht abgetrennt werden sollen. Im Aufgabenbereich kannst du zwischen Vorschau und Dokumentbearbeitungsansicht hin und her wechseln, bis du mit der Ansicht zufrieden bist.
Ich empfehle vor dem Ausdruck vieler Seiten ein testweise drüberschauen, da sich immer Fehler einschleichen können. Ein guter und einfacher Trick ist, das ganze Dokument zuerst als PDF auszudrucken. Dazu musst du natürlich ein Programm zur Erstellung von PDF-Dateien installiert haben, dass sich über den Druckerdialog der Textverarbeitung ansprechen lässt. Viel Erfolg.

Daten aus einem PDF in eine Excel-Tabelle übertragen

Leider kommt es recht häufig vor, dass Daten in einem PDF geliefert werden. Es ist leider kaum möglich, diese Daten einfach in eine Tabelle zu übertragen, um sauber mit ihnen arbeiten zu können. PDF ist eigentlich ein Format für den Druck und enthält deshalb kaum Strukturinformationen.

Ein recht einfacher Weg ist, die Daten in ein CSV-Format zu übertragen. Das klappt beispielsweise recht gut, wenn nach jedem Datum ein Zeilenumbruch vorhanden ist und jeder Datenabschnitt durch zwei Zeilenumbrüche gekennzeichnet ist. Zum Beispiel

Name: Mustermann
Vorname: Max
Telefon: 0221 000000

Name: Mustermann
Vorname: Erika
Telefon: 02106 00000

Um herauszufinden, ob das bei eurem Dokument der Fall ist, speichert ihr das PDF-Dokument über euer Leseprogramm im reinen Textformat txt. Der oben beschriebene Weg klappt auch, wenn statt einem Zeilenumbruch immer doppelte Leerzeichen oder etwas in der Art vorhanden ist.

In jeder Textverarbeitung kann man gezielt nach Absätzen oder ähnlichen Textformatierungen suchen. Über die Suchen-und-Ersetzen-Funktion kann man diese Absätze gezielt suchen und durch ein Semikolon ersetzen lassen.

Wichtig ist dabei, eventuell vorhandene Semikola vor dieser Aktion zu entfernen, damit diese nicht als Markierung einer Tabellenzelle gewertet werden. Sind die Semikola wichtig, müssen sie vorher maskiert werden.

Zunächst sollten wir nach doppelten Absätzen suchen und diese durch doppelte Semikola ersetzen. Dadurch vermeiden wir fehlerhafte Ersetzungen. Haben wir alle doppelten Zeilenumbrüche entfernt, suchen wir nach einfachen Zeilenumbrüchen und ersetzen diese jeweils durch ein Semikolon.

Das Resultat sollte so aussehen:

Name: Mustermann;Vorname: Max;Telefon: 0221 000000;;Name:Mustermann;Vorname: Erika;Telefon: 02106 00000

Ich empfehle hier das reine Textformat und kein RTF- oder sonstige Dateiformate zu verwenden, weil es da Probleme mit der Zeichencodierung oder sonstigen Sonderzeichen geben kann. Wir schließen also das Textdokument und ändern das Dateiformat von .txt. in .csv.

Wir könnten an dieser Stelle schon hingegen und die überflüssigen Inhalte aus den Zellen entfernen, um sie als Spaltennamen zu verwenden. Das kann aber auch in der Tabellenkalkulation erledigt werden. Das geschieht ebenfalls durch die Suchen-und-Ersetzen-Funktion, diesmal suchen wir zum Beispiel nach der exakten Zeichenkette „Vorname: “. Um Nacharbeiten zu vermeiden, solltet ihr darauf achten, in einem Schritt mit dem überflüssigen begriff auch die Leer- und Satzzeichen zu entfernen. Ansonsten kann es zu Problemen kommen, wenn ihr zum Beispiel eine Spalte nach Postleitzahlen oder Anfangsbuchstaben sortieren wollt. Achtet darauf, dass auch leere Werte in die Tabelle übernommen werden, ansonsten rutschen euch sämtliche Werte durcheinander und die Tabelle ist praktisch unbrauchbar.

Da die meisten PDF-Dateien nicht sauber strukturiert sind, werden hier einige Nacharbeiten nötig sein, dennoch hoffe ich, dass ihr durch die oben beschriebenen Schritte ein wenig Zeit spart. Viel Erfolg.

Werkstattbericht: Besucherstatistik aufbereiten

So ein Tracking-System wirft schon nach kurzer Zeit unglaubliche Mengen an Daten aus – von denen viele uninteressant sind. Ich habe jetzt mal für einen Auftraggeber diese Daten in einer Präsentation aufbereiten dürfen und erzähle hier ein wenig über die Schwierigkeiten, die damit verbunden waren.

Besucherstatistik präsentieren

View more presentations from Domingos de Oliveira.

Aufbereitung für das Publikum

Am Anfang steht zunächst einmal die Entscheidung, für wen die Präsentation gedacht ist. Der Abteilungsleiter soll andere Indikatoren gezeigt bekommen als das Team, der Vorstand bekommt eine andere Präsentation als die Agentur.
Unter diesem Gesichtspunkt werden die zu präsentierenden Daten ausgewählt. Praktisch immer dabei sind folgende Indikatoren

  • Zahl der Besucher und Zahl der wiederkehrenden Besucher
  • Entwicklung in einem bestimmten Zeitraum
  • Besuchsdauer pro Besuch und ansichtszeit pro Seite
  • Besuchstiefe bzw. Zahl der aufgerufenen Seiten pro Besucher
  • die am meisten besuchten Seiten
  • Herkunft der Besucher im Verhältnis, also Suchmaschinen, Referrer und direkte Zugriffe
  • Suchbegriffe, mit denen die Menschen auf die Site gekommen sind
  • Links, mit denen die Menschen auf die Site gekommen sind

Web-Analytics-Spezialisten würden an dieser Stelle mit Segmentierung und Key Performance Indicators loslegen, die lasse ich mal weg,
Nach dem Motto one fits all stellt man fürs erste alle nötigen Daten zusammen und passt die fertige Universal-Präsentation den Bedürfnissen des jeweiligen Publikums an.
Wichtig ist auch, dass die Präsentation sozusagen als Stand-Alone auch ohne verbundenen Vortrag verständlich ist. Das gilt zumindest für jene Leute, die mit den Grundbegriffen der Webstatistik nicht vertraut sind.

Summary by Month
MonthDaily AvgMonthly Totals
HitsFilesPagesVisitsSiteskB FkB InkB OutVisitsPagesFilesHits
Jan 2011300125211852501440311016071626415058555727564590038
Dec 2010303325422006453422210978061019414060622027880994030
Nov 2010350429512208505489414771578110151626626988532105126
Oct 20102771230518944113550112919057312758587197148385927
Sep 20103108263819323573822166179623110732579657914093241
Aug 20102569211414883063195160945591579489461446554679641
Jul 20102729221516393563032164789623911039508236868784622
Jun 20103239259218093873591157798044711629542847777497175
May 2010285622861570464370912534660014412486777087488566
Apr 20103083240817904903400125556534014707537167226292519
Mar 2010401033172093479456017001093131486664886102833124320
Feb 201035843065204640734721352102520113965729085824100379
Totals16864128669871553086765479374091135584

Die Tabellenkalkulation ist der Königsweg

Anfänger werden eventuell versucht sein, eine Tabelle aus dem Browser direkt in das Präsentationstool zu kopieren, das dürfte in der Regel schief gehen. Wer schon mal versucht hat, eine Tabelle aus einem PDF zu kopieren, kennt das Ärgernis, es klappt ums Verrecken nicht. doch selbst eine HTML-Tabelle kann man nicht ohne Weiteres in Excel 2000 importieren, zumindest hat es bei mir nie unfallfrei funktioniert.
Man exportiert also den ganzen Wust an Daten aus der Webanwendung – in meinem Fall eTracker – heraus und verwendet dafür unbedingt das Format Excel! Alles andere bringt später Probleme.

Die grapphische Aufbereitung

eTracker bietet eine gewisse Zahl an Visualisierungen in Form von Kreis-, Balken- oder Kurvendiagrammen. Man kann sich ein passendes Diagramm auswählen und als Pixelgraphik speichern. Mein Tip: Laßt es bleiben, macht die Diagramme in Excel. Die Diagramme aus eTracker sind zur Nachbearbeitung ungeeignet, Excel bietet dafür bessere Möglichkeiten. Excel ist vom Handling her außerdem wesentlich bequemer als sämtliche webbasierten Interfaces.

Bereinigung der Tabellen

Wenn man die Daten für ein Jahr exportiert, entsteht eine recht große Datei. Bei sehr großen Websites könnten zumindest ältere Excelversionen ins Stolpern kommen, weil sie nicht mehr als 66.000 Zeilen pro Tabellenblatt vorsehen. Wie dem auch sei, der erste Schritt besteht darin, die Arbeitsmappe von überflüssigem Quatsch zu reinigen, zum Beispiel „Datum des letzten Zugriffs“. Möchte man die Originalmappe behalten – dagegen spricht ja nichts – legt man sich für die Arbeit eine Kopie an und löscht zunächst alle Tabellenblätter, die man nicht benötigt. Als nächstes löscht man alle Spalten, die man nicht braucht oder blendet sie aus.
Auch die Zelleninhalte müssen eventuell angepasst werden. Der Titel einer Spalte oder Zeile muss so benannt werden, dass er auch von Leuten verstanden wird, die nichts mit Webanalyse zu tun haben. Die Feinformatierung der Tabellen kommt hingegen später dran.

Von der Tabelle zur Graphik

Diagramme lockern die Präsentation auf, sie machen trockene Daten anschaulich und bringen nicht zuletzt Farbe und Dynamik in den Vortrag. Am einfachsten ist die Diagramm-Erstellung mit dem Diagramm-Assistenten von Excel.
Zunächst wählt man die zu zeigenden Daten aus. Nehmen wir an, es seien jeweils die Top-Ten. Mehr als 11 Spalten lassen sich auf einem Chart auch kaum noch lesbar unterbringen. Elf Spalten weil Top-Ten plus Überschrift. Auch die Spaltenzahl sollte begrenzt bleiben, fünf spalten sollten noch überschaubar sein.
Wir sortieren also die Werte in der Tabelle absteigend und löschen alle Zeilen, die wir nicht benötigen oder blenden sie aus. Es bleiben die Top-Ten übrig, die unnötigen Spalten sollten wir bereits gelöscht oder ausgeblendet haben.
Wenn man nicht gerade Conversions macht, reichen im Idealfall drei Diagrammtypen: das Säulendiagramm für sehr viele Werte, das Balkendiagramm für bis zu zehn Werte und das Kreisdiagramm, um das Verhältnis einzelner Indikatoren in großen Ganzen anzuzeigen. Im Wesentlichen können wir hier die Diagrammtypen übernehmen, wie sie von unserer Web-Ana-Software vorgeschlagen werden, basteln sie aber trotzdem selber in Excel.
Zunächst einmal markieren wir die zu verwenden Werte für das Diagramm, zum Beispiel die Spalten Besucher und Monat. Der Monat wird im Säulendiagramm auf der X-Achse angezeigt, während die Zahl der Besucher von der Y-Achse abgebildet wird. An dieser Stelle freuen wir uns darüber, dass wir die Daten als Excel und nicht als CSV exportiert haben, hier lauert eine böse Falle. Excel erkennt die Werte im CSV-Format nicht richtig, weil die Spalten nicht korrekt formatiert werden . Mit reinen Zahlen hat Excel kein Problem, weiß aber nicht, dass der 1. April ein Datum ist, wenn die Zellen nicht als Datum formatiert wurden und das kann CSV nicht.
Die zweite Falle lauert im Balkendiagramm. Wenn man hier die Werte absteigend sortiert hat, werden sie im Balkendiagramm aufsteigend angezeigt: der längste Balken befindet sich unten, da gehört er aber nicht hin. Die Werte müssen in der Tabelle aufsteigend sortiert werden, damit sie im Diagramm absteigend angezeigt werden. Alles logisch, oder?
Ich empfehle hier auf unnötigen Protz zu verzichten. Der Mehrwert von Balken- und Säulen-Diagrammen in 3D leuchtet mir nicht ein, auch wenn Avattar ein Riesenerfolg ist. Ihr müsst daran denken, dass die Charts eventuell auch ausgedruckt noch verständlich sein müssen und da die 3D-Effekte durch Farbvariationen erzeugt werden, ist das bei einem Schwarz-Weiß-Drucker nicht unbedingt gegeben. Entsprechendes gilt für den Einsatz von Farben zur Informationsvermittlung. Abgesehen von der großen Verbreitung der Rot-Gründ-Schwäche oder anderer Farbfehlsichtigkeiten muss man überlegen, ob die verwendeten Farben im Graustufen-Druck eine Unterscheidung der Indikatoren noch erlauben.
Aus einem unbekannten Grund verwendet Excel für die Beschriftung der Achsen und Legenden eine viel zu kleine Schrift. Das ändert man mit einem Rechtsklick auf das Element und passt die Schriftgröße und alles Weitere an.

Aussagen und Interpretationen

Um eine ordentliche Präsentation zustande zu bekommen, brauchen wir Tabellen, Visualisierungen und Aussagen. Das heißt, die wichtigsten Aussagen, die wir in unseren Daten gefunden haben, werden zusammengefasst und mit Zahlen unterfüttert. Wir merken uns hier: wir machen keine Aussagen, die nicht mit den Daten belegt werden können, die IN DEM CHART VORKOMMEN. Auf Nachfrage müssen wir in der Lage sein, sämtliche gemachte Aussagen und Interpretationen mit den Zahlen aus den Charts belegen zu können.
Zu jeder Tabellen-Diagramm-Kombination gehören Anmerkungen. Diese Anmerkungen fassen entweder das Gezeigte zusammen, weisen auf Besonderheiten hin oder zeigen ablesbare Trends auf.
Dafür gibt es bekannte Standards bei Präsentationen: knapp, prägnant, keine ganzen Sätze, kein Fachjargon – es sei denn, das Publikum versteht ihn.

Schönheitskur

Der lästigste Job ist die Aufhübschung der Präsentation. Das Kernproblem ist hier die Arbeit mit zwei verschiedenen Programmen. Excel und PowerPoint arbeiten nicht so reibungslos zusammen, wie man das gerne hätte. Deswegen werden Schönheitsreparaturen erst an der fertigen Präsentation vorgenommen.
Auch eine Tabelle kann schön sein. Nun ja, zumindest kann man sie lesbarer machen. Hear, what I did: Die Spaltenköpfe werden gefettet und zentriert, um sie von den Daten darunter hervorzuheben. Alle werte in den Tabellen werden vertikal zentriert. Achtet hierbei auf die Konsistenz, wenn ihr das bei einer Tabelle macht, dann macht es bei allen anderen Spalten auch. Man verwendet den höchstmöglichen Schriftgrad. Außerdem sollen die Spalten nicht all zu viel Luft zwischen den Inhalten lassen. Eine zweispaltige Tabelle muss nicht den gesammten Folienraum einnehmen.
Zahlenwerte werden immer so gruppiert, dass Komma bzw. Dezimalpunkt untereinander sind, das heißt, die Zahlen werden zumeist rechtsbündig ausgerichtet, wenn die enthalteten Werte sehr unterschiedlich sind.
Der Dezimalpunkt wird eingesetzt, um die Lesbarkeit langer Zahlen zu erhöhen. Das heißt also: 100, 1.000, 1.000.000 und so weiter.
Es kann auch sinnvoll sein, Farbschemata für die Diagramme einzusetzen. Ich meine damit, dass auch die Diagramme einer einheitlichen Gestaltung folgen sollten. Allerdings sind meine Überlegungen hierzu nicht so weit gediehen. Man kann aber zum Beispiel das Corporate Design der Firma für die Diagramme einsetzen. Hier gilt, was ich weiter oben zum Druck und zur Farbenblindheit gesagt habe, also Farben sparsam einsetzen, vor allem, wenn man sich der Wirkungen von Farben nicht so bewusst ist.

Die eigenen Fehler sieht man nicht

Bevor ihr das Ding einem Vorgesetzten gebt oder es gar präsentiert, lasst jemanden drüberschauen. Die Fehler der Anderen sieht man am leichtesten, aber immerhin erspart man sich damit eine Blamage. Es sind schon die seltsamsten Fehler aufgetreten, die von einem selbst unentdeckt bleiben. An einer Stelle schreibt man den Firmennamen falsch, an einer anderen vergißt man die Überschrift einer Folie. Das muss nicht sein.
Ich habe unzählige Stunden dabei verbracht, die Fehler, die ich hier beschrieben habe zu machen und daraus zu lernen. Die „lesson learned“ dabei ist, dass man es nur so wirklich lernen kann. Dennoch hoffe ich, dass ich dem einen oder anderen mit diesem Werkstattbericht eine Hilfe geben konnte. Fehler machen ist okay. Alle Fehler immer wieder machen ist hingegen dumm.