Schlagwort-Archiv: Zugang

Wie arbeiten Blinde mit PDF?

Vorlesen mit webReader

Es ist kein Geheimnis: während sich die Barrierefreiheit vieler Websites langsam aber stetig verbessert, liegt die Barrierefreiheit bei PDF-Dateien im Argen. Geschätzte 98 Prozent der im Web angeboteten PDF-Dateien sind nicht barrierefrei. Sie sind auch teilweise für Blinde gar nicht nutzbar.

Das kann verschiedene Ursachen haben. Oftmals sind die Dateien vor Zugriff geschützt. Sinnigerweise soll man in ihnen keinen Text markieren oder kopieren können.
Damit haben auch Screenreader keinen Zugriff auf den Text in den Dateien.

Einige PDFs bestehen nur aus Pixelgraphiken, was im übrigen ein effektiverer Schutz vor geistigem Diebstahl wäre.

Manche PDFs lassen sich gar nicht erst öffnen. Das scheint mit bestimmten Tools zusammenzuhängen, mit denen diese PDFs erzeugt wurden und die offenbar keine Freude an Screenreadern haben. Falls jemand weiß, woran es liegen könnte, ich würde mich freuen, wenn ich die Lösung für dieses Rätsel bekäme.

Nun gibt es eine Reihe von Möglichkeiten, das PDF-Format zu umgehen. Der einfachste Weg führt über Google. Google bietet für die meisten PDFs, die als Suchergebnis angeboten werden eine Schnellansicht an. In dieser Schnellansicht kann man sich für eine reine HTML-Ansicht entscheiden. Diese ist normalerweise von bildern befreit und meiner Erfahrung nach auch bei Mehrspaltigkeit korrekt linearisiert. Das heißt, wenn ein Text mehrspaltig gedruckt ist, wird er in die richtige Lesereihenfolge gebracht.

Eine zweite Möglichkeit ist, das PDF – sofern man es öffnen kann – als Text abzuspeichern. Der Adobe Reader bietet das standardmäßig im Menü Datei an. Lustigerweise bietet dieser 20 Jahre alte Editor für Blinde zumeist mehr Komfort als der topaktuelle Acrobat Reader.

Weiterhin kann man einfach den Text komplett markieren und in eine Textverarbeitung kopieren (STRG + A – STRG + V).

Die bekannten OCR-Programme bieten schon seit geraumer Weile auch das Einlesen und Umwandeln von PDF-Dateien an, Ob sie auch Dateien bearbeiten, die gegen Copy und Paste geschützt sind, weiß ich allerdings nicht.

Bei vielen PDF-Dokumenten läßt sich dieser Copy-Paste-Schutz mit den PDFill PDF Tools entfernen.

So mancher mag sich jetzt die Frage stellen, warum wir so viel Kreativität und Zeit damit vertun, PDFs zu “knacken”, anstatt sie einfach zu lesen. Die Antwort ist recht einfach: wir haben zwar besseres zu tun, aber es geht halt nicht anders. Wir können keine PDFs am Bildschirm lesen, dennoch sind viele PDFs nicht zugänglich und enthalten zugleich wichtige Informationen, an die wir anders nicht herankommen. Die Acrobat-eigenen Mittel sind unzureichend und unkonfortabel.

OpenAccess – offener Diebstahl

Vorlesen mit webReader

Rudolph Walther regt sich in einem Artikel in der taz gewaltig auf. Leider hat der gute Mann in seinem heiligen Zorn zwei Dinge wild vermischt: Die Google-Buchsuche und OpenAccess.

Die Google-Buchsuche basiert auf Büchern, die von Google eingescannt und digital zur Verfügung gestellt werden. Google hat das im Schatten von Halblegalität gemacht, sich aber mittlerweile mit amerikanischen Rechteinhabern geeinigt. Nach wie vor macht Google aber diese Bücher eben nicht frei zugänglich, wenn Urheberrecht oder Copyright bestehen. Nur gemeinfreie Bücher sind offen zugänglich. Der Rest ist lediglich für Recherche zugänglich, ähnlich wie bei Amazon stehen Ausschnitte zur Verfügung, nicht aber der Volltext.

OpenAccess hingegen ist der Zugang zu – in erster Linie – wissenschaftlichen Arbeiten. Es gibt nun gar keinen Zusammenhang zur Google-Buchsuche.

Herr Walther scheint auch kein Freund von digitalen Archiven zu sein. Zurecht verweist er darauf, dass alte Datenträger und Dateiformate nur schwer zugänglich sind.

Um so mehr müsste gerade er sich über die Google-Buchsuche freuen. Hätte Google das Kölner Stadtarchiv durchgescannt, würden wir heute zumindest digital darin stöbern können, statt sprichwörtlich in Schutt und Staub nach Überresten zu suchen.

Ein guter Teil der von Google eingescannten Bücher sind derzeit nicht lieferbar, weil sie mangels Rentabilität nicht nachgedruckt werden. Es ist gar nicht so unwahrscheinlich, dass viele dieser Titel sang- und klanglos in Vergessenheit geraten würden, wenn Google sie nicht im Web lebendig hält.

Jeder Student ärgert sich heute über geklaute, dauerausgeliehene, nicht lieferbare und nicht vorhandene Bücher in der Bibliothek. Neben mangelnder technischer Ausstattung ist der schwierige Zugang zu Fachliteratur eines der größten Probleme wissenschaftlicher Forschung.

Und die Wissenschaft ist nun das Musterbeispiel für ein Gemeingut. Es sind überwiegend Steuerzahler, welche die deutsche Wissenschaft finanzieren.

Wer sich für die Problematik interessiert, mag sich zwei Bücher der Bundeszentrale für politische Bildung herunterladen:

Urheberrecht im Alltag, unter anderem herausgegeben von Volker Grassmuck
Wissen und Eigentum, herausgegeben von Jeanette Hofmann, die Texte dieses Buches stehen unter Creative Commons License