Künstliche Intelligenz und Barrierefreiheit

Vorneweg: Aufgrund der DSGVO habe ich die Kommentar-Funktion vorübergehend abgestellt, also nicht wundern.
In den letzten Jahren feiert die künstliche Intelligenz-Forschung ein großes Revival und wahrscheinlich ihren endgültigen Einzug in den Mainstream. Warum das auch für behinderte Menschen gut ist, erfahrt ihr in diesem Beitrag.

Künstliche Intelligenz – und ich kann selbst entscheiden

Barrierefreiheit konsequent umgesetzt erhöht die Kosten oft erheblich. Wer schon einmal eine mittelgroße Website in Leichte Sprache übersetzen lassen wollte, weiß sicher, was ich meine. Von Gebärdensprache sprechen wir erst gar nicht.
Das schränkt aber auch die Wahlfreiheit behinderter Menschen ein. Wer auf Gebärdensprache angewiesen ist, muss sich mit den wenigen vorhandenen Angeboten begnügen oder einen Gebärdendolmetscher engagieren. Es ist aber ein Gebot der Demokratie und der Inklusion, auch solche Gruppen zu unterstützen.
Andererseits werden die Übersetzungsprogramme immer leistungsfähiger. Während die Qualität dieser Programme vor allem von Rechenpower und Mustererkennung abhängig war, kommt immer stärker die KI ins Spiel. Sie kann Zusammenhänge und Muster deutlich besser erkennen als rein statistisch arbeitende Algorithmen. Neuronale Netze können trainiert werden und lernen dazu. Sie werden mit der Zeit immer besser.
An anderer Stelle hatte ich schon ausgeführt, welche Möglichkeiten die KI bieten würde, um die Leistungsfähigkeit von Screenreadern zu verbessern.

Bildbeschreibungen

Es gibt bereits Tools, die automatische Bildbeschreibungen erzeugen. Solche Tools werden etwa von Facebook dazu verwendet, um Bildbeschreibungen automatisch zu ergänzen. Auch im aktuellen MS Office sollen solche Werkzeuge vorhanden sein.
Was die Tools derzeit noch ausspielen ist manchmal brauchbar und manchmal nicht. Doch werden die Algorithmen stetig besser.
Während einzelne Bilder sich noch recht gut von Menschen beschreiben lassen, wird es schwierig, wenn es um tausende von Bildern geht. Das ist zum Beispiel für Unternehmen interessant, die viele Bilder beschreiben lassen wollen, etwa im eCommerce. Oder für Bilddatenbanken. Vernünftige Bildbeschreibungen zu einem akzeptablen Preis zu erhalten ist schwierig. Ein ausreichend gut trainierter Algorithmus macht das im Handumdrehen.
Der Vorteil für Blinde und Sehbehinderte ist, dass sie Bildbeschreibungen in ganz unterschiedlicher Ausführlichkeit erhalten könnten. Für die Einen reicht “Schwarzer Turnschuh” vollkommen aus. Andere wollen vielleicht wissen, welche Muster vorhanden sind, welcher Schwarz-Ton und so weiter.

Spracherkennung und automatische Beschreibungen

Eine Achilles-Ferse von Apple ist die im Vergleich schlechte Spracherkennung. Versucht einmal, etwas Englisches wie einen Songtitel zu diktieren. Auch in diesem Bereich könnte die KI deutliche Fortschritte bringen.
Das hieße zum Beispiel dass Audio- und Video-Inhalte deutlich schneller und günstiger in Text transkribiert werden könnten. Sogar Untertitel für Gehörlose sind denkbar, wenn sich die Erkennung von Geräuschen auch so gut entwickelt.
Ich könnte mir sogar vorstellen, dass es irgendwann automatische Audiodeskriptionen gibt. Bis dahin ist es aber sicher noch ein längerer Weg.

Mehr Kontrolle für den User notwendig

Solche Beispiele ließen sich endlos aneinander reihen. SeeingAI etwa von Microsoft kann Gegenstände oder Umgebungen erkennen und beschreiben. Die Möglichkeiten, die es in einer nicht allzu fernen Zukunft geben könnte, vermögen wir uns heute noch nicht vorzustellen.
Ein Problem besteht allerdings darin, dass diese Programme allesamt in der Hand der großen Player sind. Von Open Source in der KI habe ich bisher nicht gehört.
Das heißt, diese Tools können nur in geschlossenen Umgebungen verwendet werden. Möchte ich einen Alternativtext zu einem Bild, soll ich es erst mal bei Facebook hochladen. Für Untertitel lade ich das Video bei YouTube hoch. Mal abgesehen von Datenschutz und mangelndem Komfort schränkt das die Möglichkeit der Selbstbestimmung doch drastisch ein.
Interessant wird die KI, wenn ihre Kernfunktionen unabhängig von einer bestimmten Plattform bereit stehen. Ich möchte etwa jede beliebige Seite in Leichte Sprache übersetzen oder mir von einem beliebigen Bild einen Alternativtext erstellen lassen, ohne Copy-Paste oder Hick-Hack mit einem Datensammler. Erst dann kann die KI für uns ihre volle Wirkung entfalten.