Frohe Weihnachten!

Wie man Weihnachtswünsche in korrekter Groß- und Kleinschreibung verfasst, habe ich hier schon erwähnt. Wie es sich genau mit dem Nikolaus, dem Weihnachtsmann, dem Christkind und den Geschenken verhält, wurde an anderen Orten bereits ausführlich beschrieben: zum Beispiel hier, hier und hier. Und auch die Herkunft des Wortes Weihnachten gibt nicht wirklich viel Spannendes her (die heiligen Nächte, wahrscheinlich zurückgehend auf die heiligen Mittwinternächte). Deshalb hier nur kurz, aber nicht weniger wohlgemeint:

Ich wünsche allen treuen, gelegentlichen und zufälligen Besuchern dieses Blogs und insbesondere auch allen „Canooeys“ wunderschöne Weihnachtstage!

Dr. Bopp

Unbekannte Wörter

Wieder einmal etwas in eigener Sache: Treuen Canoonet-Benutzern und -Benutzerinnen ist es bestimmt schon passiert, dass ein Wort, das sie suchten, nicht in unseren Wörterbüchern enthalten war. Das ist selbst bei über 250 000 Einträgen nicht weiter verwunderlich, denn die Anzahl der deutschen Wörter ist ja unendlich. Dabei geht es nicht nur um die große Zahl von fachspezifischen Wörtern, sondern vielmehr darum, dass immer wieder neue Wörter gebildet werden. Dies geschieht in verschiedener Weise. Unter anderem:

  • durch Neuformung aufgrund von Abkürzungen, Namen, Produkten usw.
    Zum Beispiel: simsen, googeln
  • durch Übernahme aus anderen Sprachen
    Zum Beispiel: Blog, Messie
  • durch Ableitung und Wortzusammensetzung
    Zum Beispiel: Islamdebatte, Suchbarkeit, Gammelfleischskandal

Die meisten neuen Wörter werden durch Ableitung und Wortzusammensetzung gebildet.

Obwohl wir unsere Wörterbücher laufend erweitern, können wir natürlich nie alle neuen Wörter, die es täglich gibt, erfassen und aufnehmen. Vielen von ihnen ist auch gar kein langes Leben beschieden. Bei Neuformungen und neuen Lehnwörtern müssen wir leider schlichtweg passen. Dann sehen Sie einfach den Satz Keine Einträge gefunden für „…“ Bei den gängigsten Ableitungsarten und bei Zusammensetzungen geben wir uns aber nicht so schnell geschlagen. Dann kommt uns ein Programm zu Hilfe, das wir auf gut Denglisch den Unknown Word Analyzer nennen.

Wenn ein Wort nicht in unseren Wörterbüchern vorkommt, versucht dieses Programm das eingegebene Wort in bestehende Wörter und ggf. Vor- und Nachsilben zu zerlegen sowie die Wortklasse des neuen Wortes zu bestimmen. Zum Beispiel (Klicken Sie auf das Wort, um die Wortanalysen zu sehen):

Islamdebatte
Suchbarkeit
Gammelfleischskandal

Auch deklinierte und konjugierte Formen werden erkannt:

Islamdebatten
Dammbalkenverschlüsse
Beamtenversicherungskassen
hinaufrollst
begreifbarste

Damit nicht allzu viele unsinnige Resultate angezeigt werden, ist die Analyse je nach Wortbildungsart auf zwei bis drei Elemente beschränkt. Die berühmte Donaudampfschifffahrtsgesellschaftskapitänsmütze erkennt der Analysator also nicht (den Donaudampfschifffahrtsgesellschaftskapitän allerdings schon :-)). Er kann auch keine stilistischen Korrekturen vornehmen und analysiert deshalb brav begreifbarste, obwohl am besten begreiflich bestimmt besser wäre. Auch Reagierung wird analysiert, obwohl wahrscheinlich Reaktion gemeint ist.

Da ein solches Analyseprogramm die Wörter nicht versteht, sind die Analyseresultate nur als Vorschläge zu sehen. So kann es manchmal zu recht unerwarteten Resultaten kommen: So werden Mittagsteller nicht nur als Teller zum Mittag sonder auch als Steller des Mittags analysiert. Auch die Schikaneurin wird nicht nur als weibliche Form des Schikaneurs interpretiert (gab es früher so wenig schikanierende Frauen, dass dieses Wort in vielen Wörtebüchern nicht vorkommt?), sondern zur Freude der Liebhaber von Junggymnasiastenhumor eben auch als – sehen Sie selbst: Schikaneurin.

Manchmal braucht es eben mehr als nur Kenntnis von Wortformen und Wortbildungsregeln, aber die Analysen sind sehr oft korrekt. Wir halten deshalb unseren Unknown Word Analyzer für ein gutes Hilfsmittel für die Erkennung „unbekannter“ Wörter, auch wenn er hin und wieder kein Resultat oder mehr als nur das gewünschte Resultat anzeigt.

wiederherstellen, wiederaufnehmen usw.

Herr K. schreibt:

Guten Tag!

Es hat mich sehr verblüfft, daß Ihr großartiges Canoonet das Wort “wiederherstellen” nicht kennt. Die Form “wiederHERGESTELLT” wird nur vom “Unknown Word Analyzer” zerlegt.

Bekannt ist hingegen: “Wiederherstellung”

Andererseits kennt Canoonet das vergleichsweise viel seltenere Wort “wiederverwerten”.
Anzahl Google-Treffer:
3.650.000 für “wiederherstellen” ohne “wieder herstellen”
1.630.000 für “wiederhergestellt” ohne “wieder hergestellt”
53.400 für “wiederverwerten” ohne “wieder verwerten”
134.000 für “wiederverwertet” ohne “wieder verwertet”

Haben Sie eine Erklärung für das Fehlen von “wiederverwerten”?

Ich hoffe, dieses Feedback war Ihnen nicht nur eine Freude sondern auch eine Hilfe!

Schöne Grüße aus Wien

Antwort:

Sehr geehrter Herr K.,

Wir danken Ihnen für Ihr Interesse an unseren Sprachseiten, für Ihren Hinweis und natürlich auch für das “großartig”.

Dass das Verb “wiederherstellen” im Gegensatz zu “wiederverwerten” nicht in Canoonet zu finden ist, hat einen technischen Grund. So suchen Sie auch vergeblich nach zum Beispiel: wiederaufnehmen, wiedereinstellen, wiedergutmachen u.a.

Diese trennbaren Verben haben gemeinsam, dass sie im Hauptsatz nicht wie gewöhnliche trennbare Verben in zwei, sondern in drei Teile auseinanderfallen. Vergleichen Sie zum Beispiel:

wiederverwerten: Die Winzer nehmen die Flaschen zurück und verwerten(1) sie wieder(2).

ABER:
wiederherstellen: Entspannungsübungen stellen(1) das innere Gleichgewicht wieder(2) her(3).
wiedergutmachen: Wie mache(1) ich dieses Unrecht wieder(2) gut(3)?

Dies bedingt, dass einerseits eine neue Art der Datenerfassung und -aufbereitung und andererseits eine neue Darstellungsart für unsere Flexionstabellen eingeführt werden muss. Das ist natürlich nicht unmöglich, aber leider für die geringe Anzahl von Verben im Moment technisch zu aufwändig. Wir hoffen aber, das Fehlen dieser Verben in Zukunft einmal beheben zu können.

Und wir hoffen auch, dass Sie Canoonet dank der beinahe 20.000 anderen Verben trotzdem noch ein bisschen großartig finden.

Mit freundlichen Grüßen

Dr. Bopp

“Geradewohl” und “Terrabyte”

[Dieser Artikel und die in ihm genannten Links sind nicht mehr relevant, seit es Canoonet nicht mehr gibt.]

Herr M. schreibt:

Sehr geehrte Damen und Herren,

ich muss Sie darauf hinweisen, dass in Ihrem Online-Woerterlexikon mindestens zwei Woerter fehlerhaft dargestellt sind:

1. Geradewohl (falsch) – Geratewohl (richtig) – kommt vom Imperativ “Gerate wohl”
2. Terrabyte (falsch) – Terabyte (richtig) – der Mengenpraefix tera hat nichts mit der Erde (Terra) zu tun

Ansonsten finde ich Ihr Lexikon fabelhaft.

Mit freundlichen Gruessen

Antwort:

Sehr geehrter Herr M.,

wir danken Ihnen herzlich für Ihr Interesse an unseren Sprachseiten und auch für Ihre lobenden Worte. Zu Ihrer Kritik möchte ich Folgendes sagen:

Die Wörter “Geradewohl” und “Terrabyte” sind NICHT in unserem Wörterbuch enthalten. Dies besagt auch der Titel der Resultatseiten:

“Der gesuchte Begriff ist nicht im Canoo Wörterbuch enthalten.”

Siehe z.B. Eingabe “Geradewohl” in Canoonet.

Wenn eine Eingabe nicht im Wörterbuch enthalten ist, versucht der Unknown Word Analyzer sie in bekannte, d.h. im Wörterbuch enthaltene Teile zu zerlegen. Dies ist wohlgemerkt eine mögliche, nicht aber unbedingt die korrekte Analyse. Die Richtigkeit der Analyse ist u.a. von der Bedeutung des Gesamtwortes und der Bedeutung der Einzelteile abhängig, also von Größen, die ein Analyseapparat nicht oder nur sehr bedingt überprüfen kann.

Bei Ihren beiden Beispielen kommt hinzu, dass der Analyseapparat auch noch erkennen müsste, dass ein zu analysierendes Wort einen Schreibfehler enthält. So weit sind unsere technischen Möglichkeiten leider noch nicht fortgeschritten.

Zuletzt möchte Sie noch darauf hinweisen, dass das Wort “Geratewohl” korrekt in unserem Wörterbuch steht. Siehe Canoonet, Eingabe “Geratewohl”.
Das Wort “Terabyte” werden wir bei Gelegenheit aufnehmen.

Mit freundlichen Grüßen
Dr. Bopp