Gleicher Inhalt – unterschiedliche Textlänge bei der Übersetzung

Unterschiedliche Länge

Welche Sprachen sind denn nun die längsten und haben die meisten Wörter?

Um diesem Phänomen auf den Grund zu gehen, haben wir uns zwei Beispieltexte herausgesucht, anhand derer wir einige ausgewählte Sprachen miteinander vergleichen wollen. So sehen Sie ganz konkret, was es mit der Wortanzahl und Textlänge bei der Übersetzung in verschiedene Sprachen auf sich hat, und wie es kommt, dass für denselben Inhalt beispielsweise im Spanischen viel mehr Platz gebraucht wird als im Englischen.

Europäische Sprachen im Vergleich

Beispiel 1: Gesetzestext

Bei unserem ersten Beispieltext handelt es sich um einen Gesetzestext für den Europäischen Wirtschaftsraum. Der Vorteil hierbei ist, dass der Text in mehreren europäischen Sprachen erschienen ist, die sich einfach vergleichen lassen. Hierbei ist uns nicht bekannt, ob der Text zunächst in einer Sprache geschrieben und dann in die anderen übersetzt oder die Texte parallel in den verschiedenen Sprachen verfasst worden sind.

Die nachfolgende Tabelle dient nur als Beispiel, denn je nach Textsorte können sich noch einmal Unterschiede ergeben. Bei Übersetzungen spielt es auch eine Rolle, welche Sprache als Ausgangssprache dient.

Sprache Wortanzahl
Zeichen ohne Leerzeichen
Zeichen mit Leerzeichen
Buchstaben pro Wort*
Bulgarisch 25.988 147.076 170.001 5,659
Deutsch 22.118 149.345 168.399 6,752
Englisch 24.698 132.480 154.101 5,364
Finnisch 18.864 149.007 164.792 7,899
Französisch 28.350 158.227 183.505 5,581
Italienisch 27.127 153.955 178.005 5,675
Niederländisch 24.136 148.362 169.421 6,147
Polnisch 23.214 150.335 170.468 6,476
Slowenisch 23.407 139.170 159.502 5,946
Spanisch 29.538 161.348 187.806 5,462
Ungarisch 19.985 146.233 163.164 7,317

 

Wortanzahl, aufsteigend
Buchstaben pro Wort*, aufsteigend
Zeichen mit Leerzeichen, aufsteigend
Finnisch 18.864 Englisch 5,364 Englisch 154.101
Ungarisch 19.985 Spanisch 5,462 Slowenisch 159.502
Deutsch 22.118 Französisch 5,581 Ungarisch 163.164
Polnisch 23.214 Bulgarisch 5,659 Finnisch 164.792
Slowenisch 23.407 Italienisch 5,675 Deutsch 168.399
Niederländisch 24.136 Slowenisch 5,946 Niederländisch 169.421
Englisch 24.698 Niederländisch 6,147 Bulgarisch 170.001
Bulgarisch 25.988 Polnisch 6,476 Polnisch 170.468
Italienisch 27.127 Deutsch 6,752 Italienisch 178.005
Französisch 28.350 Ungarisch 7,317 Französisch 183.505
Spanisch 29.538 Finnisch 7,899 Spanisch 187.806

 

Finnisch und Ungarisch: wenige Wörter, viele Buchstaben

Aus den Tabellen lässt sich erkennen, dass das Finnische den Inhalt mit den wenigsten Wörtern ausdrückt; die einzelnen Wörter sind mit durchschnittlich 7,899 Buchstaben jedoch am längsten. Dies liegt daran, dass das Finnische eine agglutinierende Sprache ist. In agglutinierenden Sprachen gibt es beispielsweise keine Präpositionen vor Substantiven, sondern die betreffenden Wörter werden durch Fälle umgeformt. Andere Wörter, wie Verben, werden mit Hilfe von Affixen angepasst, sodass das Grundwort je nach Person, Tempus und Kasus eine Vielzahl an Buchstaben hinzugewinnen kann.

Ungarisch ist vergleichbar mit Finnisch, denn auch die ungarische Sprache ist eine agglutinierende Sprache. Als uralische Sprachen und Teil der finno-ugrischen Sprachfamilie sind Ungarisch und Finnisch auch miteinander verwandt. Andere Sprachen, wie beispielsweise Japanisch, Koreanisch, Türkisch, Malaiisch, Swahili und Baskisch, sind hingegen nicht mit dem Finnischen und Ungarischen verwandt, zählen allerdings auch zu den agglutinierenden Sprachen.

Das Deutsche ist zwar keine agglutinierende Sprache, aus den Tabellen wird jedoch ersichtlich, dass es auch in dieselbe Richtung wie Finnisch und Ungarisch geht: Im Text werden im Vergleich zu den anderen Sprachen wenige Wörter verwendet, die dafür aber aus verhältnismäßig vielen Buchstaben bestehen.

Italienisch, Französisch und Spanisch: viele Wörter, wenige Buchstaben

Italienisch, Französisch und Spanisch nutzen dagegen viele Wörter, um einen Sachverhalt auszudrücken. In unserem Beispieltext sind die einzelnen Wörter im Vergleich zu anderen Sprachen jedoch eher kurz, mit durchschnittlich 5,462 bis 5,675 Buchstaben.

Englisch liegt bei der Wortanzahl im Mittelfeld unserer Vergleichssprachen und hat mit durchschnittlich 5,364 Buchstaben die kürzesten Wörter. Auch insgesamt ist die Textlänge bei der Übersetzung im Englischen am kürzesten. Die romanischen Sprachen Italienisch, Französisch und Spanisch weisen die längste Textlänge auf.

Bei einer Übersetzung vom Englischen ins Spanische oder Französische wird der Text entsprechend in der Regel länger. In unserem Beispiel ist der spanische bzw. französische Text rund 20 % länger als der englische. Da ist es nur verständlich, wenn der Text nach der Übersetzung plötzlich nicht mehr ins Layout passt. Ein weiterer Faktor hierbei ist die Buchstabenbreite: Einige Buchstaben brauchen wenig Platz (wie das I), während andere viel Platz brauchen (z. B. das M oder W). Je nachdem, welche Buchstaben in der jeweiligen Sprache am häufigsten verwendet werden, kann dies auch den Platzbedarf im Layout beeinflussen.

Beispiel 2: allgemeinsprachiger Text

Im zweiten Beispiel werfen wir einen Blick in den intercontact Blog, denn im Gegensatz zu der sehr präzisen Sprache von Gesetzestexten zeichnet sich unser Blog durch eine allgemeinere, alltägliche Sprache aus. Unser Beispielblogartikel wurde zunächst auf Deutsch geschrieben und dann in die anderen Sprachen übersetzt. Es handelt sich hierbei nicht um eine Wort-für-Wort-Übersetzung, sondern um eine freiere Übersetzung.

Sprache Wortanzahl
Zeichen ohne Leerzeichen
Zeichen mit Leerzeichen
Buchstaben pro Wort*
Deutsch 619 3.949 4.548 6,380
Englisch 682 3.543 4.205 5,195
Französisch 802 4.350 5.132 5,424
Italienisch 651 3.685 4.315 5,661
Niederländisch 675 3.707 4.361 5,492
Polnisch 591 3.759 4.330 6,360
Spanisch 742 3.982 4.703 5,367

 

Wortanzahl, aufsteigend
Buchstaben pro Wort*, aufsteigend
Zeichen mit Leerzeichen, aufsteigend
Polnisch 591 Englisch 5,195 Englisch 4.205
Deutsch 619 Spanisch 5,367 Italienisch 4.315
Italienisch 651 Französisch 5,424 Polnisch 4.330
Niederländisch 675 Niederländisch 5,492 Niederländisch 4.361
Englisch 682 Italienisch 5,661 Deutsch 4.548
Spanisch 742 Polnisch 6,360 Spanisch 4.703
Französisch 802 Deutsch 6,380 Französisch 5.132

 

Bis auf Polnisch brauchen in unserem Blogbeitrag alle Sprachen mehr Wörter als im Deutschen; abgesehen vom Französischen und Spanischen verwenden die Sprachen hierbei jedoch weniger Zeichen. Und in allen Sprachen enthalten die einzelnen Wörter im Durchschnitt weniger Buchstaben als im Deutschen; mit 5,195 Buchstaben sind die englischen Wörter durchschnittlich die kürzesten, während im Deutschen ein Wort durchschnittlich 6,380 Buchstaben besitzt.

Auffällig ist, dass die Wörter im Gesetzestext durchschnittlich aus mehr Buchstaben bestehen als in unserem Blogbeitrag. Besonders deutlich ist dieser Unterschied im Deutschen. Hier besteht ein Wort im Gesetzestext aus durchschnittlich 6,753 Buchstaben, im Blogartikel hingegen aus nur 6,380 Buchstaben. Das liegt daran, dass wir im Blog allgemeinsprachliche Begriffe verwenden, während der Gesetzestext fachspezifischer ist. Und gerade im Deutschen wird ein Wort in der Regel länger, je spezifischer es ist.

Trotz dessen, dass unser Blogartikel aus dem Deutschen übersetzt wurde, ist der englische Text kürzer. Spanisch und Französisch brauchen hingegen mehr Platz für denselben Inhalt.

Sprachen bei der Übersetzung ihren natürlichen Lauf lassen

Bis zu einem gewissen Grad kann bei der Übersetzung Rücksicht auf Platzbegrenzungen genommen werden. Am besten ist es jedoch, den Sprachen ihren natürlichen Lauf zu lassen. Nur so klingt ein Text auch in der jeweiligen Fremdsprache ansprechend. Und was bringt schon eine Übersetzung, die Zeit und Geld kostet, wenn sie Kunden am Ende gar nicht erreicht?

Unser Tipp: Stellen Sie das Layout erst nach der Übersetzung fertig. So muss die Übersetzung nicht in eine bestimmte Form gepresst werden und die fremdsprachlichen Wörter können ihre volle Wirkung entfalten.

 

 

___________________________

* auf drei Nachkommastellen gerundet