Tippfehler-Korrektor

Wahrscheinlich kennen Sie alle den Tippfehler-Korrektor und verwenden diesen. Und da im Texteditor von MS Word, im Tabellenprozessor von Excel, im Präsentationsprogramm PowerPoint, im Chargierprogramm Adobe InDesign oder im Fotoshop-Programm die Lösung von der Firma Lingea integriert ist, gehören vielleicht auch Sie schon zu unseren zufriedenen Kunden.

Sprachteil

Die Wörterbuchbeschreibung besteht aus einer umfangreichen formalen Morphologiebeschreibung sowie aus einem detaillierten System mit Beispielen. Durch diese Beschreibung kann man aus einem Wortstamm viele abgeleitete Formen bilden, z. B. bei folgenden tschechischen Wörtern

milovat (lieben): milovat, miluji, miluješ, milujeme, miloval, milovala, milovali, milovaný, milovaná, milovaného, milování...
bratr (der Bruder): bratr, bratra, bratru, bratře, bratrem, bratři, bratry, bratrech, bratrova, bratrovo, bratrovy, bratrův...

Vor allem die slawischen Sprachen verfügen über eine umfangreiche Flexion, nichtsdestotrotz haben auch in den romanischen Sprachen die Wörter viele unterschiedliche Formen, wie z. B. im Französischen parler: parle, parles, parlons, parlez, parlent, parlais, parlait, parlions, parliez, parlaient, parlerai, parlé, parlant...

Im Russischen müssen wiederum die Reflexivpronomen berücksichtigt werden, welche bei einigen Formen zusammengeschrieben werden:
женится: женюсь, женишься, женится, женись, женилась, женились...
Analog ist dies auch im Spanischen, wo darüber hinaus auch das Personalpronomen mit dem Verb geschrieben werden kann(poner->ponlodecir->dime,escuchar->escúchala)

Von extremer Länge sind die Formen im Ungarischen, Finnischen und Türkischen, wo die Wörter mit Suffixen gebildet werden. Im Ungarischen wird außer zwei Zahlen in bis zu 25 Fälle sowie zwei unterschiedliche Besitzanzeigen unterschieden (eine, die zum betreffenden Objekt gehört und eine, die zur Person gehört):
ház: házak, házat, háznak, házzal, házig, házé, házéi, házaké, házakéi, házamé, házadé, házáé...

Alle Wörter, durch welche auf kongruente Art abgeleitete Formen gebildet werden, sind dem gleichen Musterwort zugeordnet. Jedes Wörterbuch besteht somit aus zwei Hauptteilen:
aus dem Wörterbuch mit den Musterwörtern: dieses umfasst die linguistischen Informationen in Bezug auf die Bildung der Formen, die Stammalternationen sowie die Beschreibung der grammatischen Kategorie und aus dem Wörterbuch mit den Stämmen: dieses umfasst den Stammgrundwortschatz - meistens von den Wörtern der betreffenden Sprache

Die Beschreibung der Wörter auf die oben genannte Art ist vollständig in dem Sinn, dass neben den Wörtern mit regelmäßiger Ableitung auch folgende Wörter betroffen sind:


mit Stammalternationen (z. B. im Tschechischen pes->psa (Hund), im Deutschen Bruder->Brüder)
mit vollständiger Stammänderung (z. B. im Englischen go->went, im Deutschen essen->isst, im Tschechischen hnát->žene (eilen))
die unregelmäßigen Wörter (být, jíst, chtít) (sein, essen, möchten)

Die Beschreibung ist derart allgemein, dass nicht nur ein Wörterbuch für die tschechische sowie slowakische Sprache erstellt werden kann, sondern auch für weitere europäische Sprachen. Es kommt mit reflexiven Verben im Russischen zurecht sowie mit der umschreibenden Steigerung im Englischen oder Polnischen, mit den zusammengezogenen Formen im Französischen, mit den trennbaren Präfixen im Deutschen, mit der Verschmelzung der Verbformen mit den Pronomen im Spanischen oder mit der umfangreichen Formbildung mit Suffixen in finnisch-ugrischen Sprachen.

Programmlösung

Aufgrund des effektiven Komprimierungsalgorithmus und der kompletten Wörterbuch-Generierung ist die Programmschnittstelle kurz genug und somit in einem beliebigen Softwareprodukt einfach zu verwenden.

Verfügbare Funktionen

  • Überprüfung, ob sich das betreffende Wort im Wörterbuch befindet. Durch diese Funktion wird auch die Richtigkeit in Bezug auf die Verwendung von Großbuchstaben am Wortbeginn kontrolliert, wo dies erforderlich ist (PrahaMariaEisenhower...) sowie auch von Großbuchstaben im ganzen Wort (USAIBM) oder ob das Wort mit einem Punkt endet (atd.apod.).
  • Korrekturangebote: es werden alle Wörter generiert, aus denen das betreffende Wort durch einen Tippfehler gebildet werden könnte.
  • Bedienung der Benutzerwörterbücher oder Spezialwörterbücher zum automatischen Austausch von fehlerhaften Wörtern.
  • Einstellen der Parameter bzw. Ignorieren von Akronymen, einbuchstabigen Wörtern, Wörtern mit Zahlen, u. Ä.

Zum gegenwärtigen Zeitpunkt wird von uns die Tippfehler-Kontrolle für eine ganze Reihe von Sprachen angeboten (siehe Tabelle). Diese ist auch in den meisten Plattformen implementiert (siehe Übersicht).

Referenzen

Die Funktionalität sowie Geschwindigkeit unserer Lösung können Sie z. B. in den Programmen Microsoft Office ab der Version Office 95 und höher überprüfen sowie in den Texteditoren (Corel WordPerfect), in den Chargiersystemen (Adobe InDesign), in den OCR- Programmen, in den Redaktionssystemen (Zeitung MF Dnes) und z. B. auch in den Programmen von den Firmen Autodesk und Siemens.