Gedanken zur Redundanz unserer Schriftsprache:
Informationsverlust durch die Rehctschreibrefrom

Ein Vortrag vor der Neuen Fruchtbringenden Gesellschaft e. V. am 25. August 2007 in Köthen
1. Eine kleine Einstimmung

Unserer Sprache wird seit dem "Diktat" der sog. Rechtschreibreform einiges zugemutet. Erstaunlicherweise ist dabei die schriftliche Kommunikation der Sprachgemeinschaft nicht zusammengebrochen: WechteOffensichtlich besitzt unser Deutsch ein gewisses Maß an Redundanz, vielleicht auch "Toleranz", damit wir uns trotz der willkürlichen Eingriffe in Schreibweisen und Kommasetzung auch weiterhin einigermaßen schriftlich unterhalten können. "Einigermaßen", wohlgemerkt, denn ein Verlust von Informationen kann durchaus mit einschneidenden Nachteilen bei der Wiederherstellung einer Nachricht einhergehen. Die Frage ist nun: Wie weit darf man die Schriftsprache beschneiden und verhunzen, damit der Leser aus dem Geschriebenen noch alles einigermaßen versteht? Oder:

Wie redundant ist unsere Schriftsprache?

Um es vorweg zu nehmen: Die Antwort wird relativ ausfallen, denn sie ist abhängig von einem Bezugspunkt. Wählen wir als Bezugspunkt einen waschechten Rechtschreibreformer, so wird diesen ein verhunzter Text weit weniger irritieren (er wird Leseschwierigkeiten sowieso nicht zugeben), als einen gebildeten, anspruchsvollen Leser. Den einen stört es, wenn er einen Satz dreimal lesen muß, den anderen stört es nicht; insofern wird Redundanz unterschiedlich bewertet werden.

Wenn jedoch aus einem Satz alle Kommas entfernt werden, die laut herkömmlicher Schreibung aus gutem Grunde hineingehören, kann es sein, daß keine noch so teure Software und auch kein waschechter Reformer die vom Schreibenden tatsächlich gemeinte Information je wiederherstellen kann:

"Der Vater empfahl(,) dem Schüler(,) nicht zu widersprechen."

So ist es sehr leicht, im gesamtem Text ein "ß" durch "ss" zu ersetzen; aber dieser Vorgang ist zumeist irreversibel. Steht irgendwo ein "ss", kann man nicht ohne besonderen Aufwand erkennen, ob dort früher ein "ß" stand:

Nach kurzem Vokal steht bei weitem nicht immer ein "ss", und nach langem Vokal steht auch nicht immer ein "ß". Aber schauen Sie selbst. Das Video zeigt eine Werbung für Toggo-Clever-Club; das ist beinahe Kindesmißbrauch.

Wegen des Zerstörungsgrades der reformierten Schreibweisen ist es sehr schwierig, eine automatisierte Umsetzung von Neu- auf Altschrieb zu programmieren.

2. Die informationstechnische Bedeutung der Schriftsprache

Unsere Schriftsprache ist im Grunde nichts weiter als ein genialer Gedächtnisspeicher: Die beiden Strichmännchen sind weit weg voneinander und wollen sich etwas mitteilen. Also bringt der Mitteilende (links) seine Gedanken aufs Papier und folgt damit ganz bestimmten Regeln; er codiert seine Gedanken in einen Bildbereich. Der Empfänger (rechts) kennt diese Regeln und kann aus dem Geschriebenen auf die Nachricht des Mitteilenden schließen; er decodiert die Informationen des Bildbereiches wieder in sein geistiges Abbild.

Das Ziel des Mitteilenden ist natürlich die möglichst verlustfeie Übertragung seiner Information, denn er möchte, daß er vom Empfänger korrekt verstanden wird. Also brauchen beide ein Regelwerk mit einem hohen Grad an Einheitlichkeit. Verfügen beide jedoch nicht über ein gemeinsames Regelwerk, hat der Empfänger ein Problem, wenn der Mitteilende schreibt:

"Die Wolken sind gräulich."

Der Empfänger assoziiert, daß die Wolken ein bißchen grau sind. Dann überlegt er noch einmal: "Falls mein Kumpel da drüben doch tatsächlich reformiert geschrieben haben sollte, könnten die Wolken auch grauenerregend, also greulich sein." Im Neuschrieb wurde "greulich" nämlich beseitigt, weil dieses Wort für die Schulkinder zu schwierig ist. Was nun? Es gibt viele solcher Ungerreimtheiten, beispielsweise "wieder sehen" und "wiedersehen".

Fazit:

Die reformierten Regeln eignen sich denkbar schlecht zum Codieren, denn sie sorgen in vielen Fällen für einen fatalen Informationsverlust beim Decodieren. Was sind die Folgen?

3. Über Redundanzen und Informationsverluste

Redundanz kommt aus dem lateinischen redundare und bedeutet "im Überfluß vorhanden sein". Ich versuche es mal mit dieser Definition:

In einer Signalmenge sind alle die Informationsanteile redundant, die nicht zur hinreichend vollständigen Beschreibung der gewünschten Zielinformation beitragen.

So benötige ich für die vollständige Beschreibung einer gleichfrequenten Sinusschwingung lediglich 2 Punkte innerhalb einer Periode; durch 2 Punkte kann unter definierten Bedingungen stets nur eine einzige Sinuskurve laufen. Taste ich eine 50Hz-Schwingung 1000 mal pro Sekunde ab, schadet das zwar nicht, aber 900 Abtastungen sind überflüssig, also redundant; 100 Hz Abtastfrequenz genügen, um einen 50Hz-Sinus wiederherzustellen. Die Abtastnorm bei CD-Spielern ist 44,1 kHz, weil man davon ausgehen kann, daß die höchste vom Menschen hörbare Frequenz irgendwo bei 20 kHz liegt.

Und wer es ganz wissenschaftlich haben will:

"Das Nyquist-Shannonsche Abtasttheorem besagt, daß ein kontinuierliches, bandbegrenztes Signal, mit einer Minimalfrequenz von 0 Hz und einer Maximalfrequenz fmax, mit einer Frequenz größer als 2 · fmax abgetastet werden muß, damit man aus dem so erhaltenen zeitdiskreten Signal das Ursprungssignal ohne Informationsverlust exakt rekonstruieren und beliebig genau approximieren kann."

Wie wir sehen, kann ein Verlust an Information durchaus ein gewünschtes Ziel sein, in aller Regel um Datenmengen, die man speichern will, zu minimieren. Typische Beispiele sind Dateien in den Formaten JPG, MPEG, GIF oder MP3. Aber:

Es dürfen nur redundante Informationen weggeworfen werden, also solche, die keinen spürbaren Einfluß auf den (subjektiven) Erhalt der Nutzinformation haben.

Man muß sich allerdings darüber im klaren sein, daß es u. U. unmöglich ist, aus reduzierten Daten wieder die ursprüngliche, die (objektive) Quellinformation herzustellen. Aus einem nur 2 kByte großen Foto für eine Ikonendarstellung kann ich keine ursprüngliche Auflösung meiner Kamera von 8 Megapixeln mehr herzaubern.

4. Was bedeutet das nun für unsere Schriftsprache?

Wir können den Informationsgehalt bis kurz vor die Sinnentstellung minimieren, beispielsweise durch

Durch nachfolgende Maßnahmen kommt es tatsächlich zur Sinnentstellung: Goethe

Die Frage ist nun allerdings:

Soll es tatsächlich das Ziel unserer Sprachgemeinschaft sein, unseren kostbaren Codierer "Deutsche Rechschreibung" so primitiv zu halten, daß der Leser den Sinn einer Nachricht gerade noch so aus den verlustbehafteten Informationen erkennen kann? Schauen wir uns das noch mal bildlich an.

Phase 1: Dieses Bild ist das Original, aufgenommen mit 2,3 Megapixel.

Langhans scharf

Phase 2: Da ich nur ein kleines Foto für meinen Drucker brauche, konvertiere ich das Bild in eine JPG-Datei bei absichtlich gewählten 75% Informationsverlust. Das Ergebnis unterscheidet sich subjektiv nicht von Original, also habe ich lediglich redundante Daten beseitigt.

Langhans scharf

Phase 3: Nun brauche ich noch ein Bild für das Web. Dabei nehme ich auch optische Qualitätseinbußen in kauf und vernichte weitere für mich redundant gewordene Daten. Mein Ziel ist lediglich, daß ich noch als Jürgen Langhans erkennbar bin, egal mit wieviel Gries im Bild.

Langhans unscharf

Phase 4: Wenn ich es nun übertreibe und an die Substanz der eigentlichen Nutzdaten gehe, endet mein Versuch.

Langhans unerkennbar

Nun simulieren wir diese vier Phasen für ein berühmtes Wort:

Nun ja, diesen hochwissenschaftlichen Zusammenhang müssen die Reformer erkannt haben und erfinden sicherheitshalber ein paar Redundanzen hinzu:

Tollpatsch

Jetzt kann jeder der will, ein "l" weglassen, dann stimmt's wieder! :) Aber selbst hier ist etwas faul: Denn durch diesen Schreibfehler "ll" verschwindet die Information über die Herkunft des Wortes Tolpatsch, "... was zu beweisen war". Was schließen wir nun daraus?

5. Gewollte Datenreduktion: Steno

Bestes Beispiel für eine gewollte Datenreduktion beim Schreiben ist Steno. Bei der Stenografie geht es bekanntlich darum, eine Sprachnachricht möglichst rasch mitschreiben zu können. Der Leser dieser Nachricht muß natürlich den Codierer Steno kennen und mit den Besonderheiten des Interpretierens derartig verfaßter Texte bestens vertraut sein, ggf. auch Lesefehler in kauf nehmen.

Die wesentlichen Besonderheiten sind:

Bei dieser Zielstellung ist unser Deutsch ganz gewaltig redundant! Steno

6. Der Beitrag der Reform zum Informationsverlust

"Nur" ärgerlich sind solche Schreibweisen:

Für eine empfindliche Störung des Leseflusses sorgen solche Konstrukte:

Nur unsicher erkennen lassen sich diese aufgezwungenen Auseinanderschreibungen bzw. Groß-/ Kleinschreibungen:

Gar nicht mehr erkennbar sind u. U.:

Lediglich Fehlinformationen zur Herkunft bieten:

Völlig daneben sind diese Erfindungen, denn sie zwingen uns auch noch eine ungewohnte, falsche Sprechweise auf:

Mey
Und was sagt ein ganz Prominenter zu diesem ganzen Theater? ... Danke, Herr Mey!



Dr. Jürgen Langhans, überarbeitet im Dezember 2008