Durchsuchen von multimedialen Inhalten

Beim Durchsuchen von multimedialen Inhalten handelt es sich wahrscheinlich um eine der effektivsten Verwendungsmöglichkeiten der Spracherkennung. Dank der automatischen Erkennung von Textaufnahmen sowie deren Indexierung können Sie auf die in der Aufnahme enthaltenen Informationen zugreifen, ohne dass Sie sich diese ganz anhören müssen. Dies ist vor allem in der heutigen Zeit ein großer Vorteil, wo viel mehr Informationen sowie Aufnahmen vorhanden sind, die man durchsuchen kann, als die Zeit, welche man für diese Tätigkeit zur Verfügung hat. Sofern Sie über ein auf diese Weise erstelltes Aufnahmearchiv verfügen, müssen Sie sich nicht mehr alle Aufnahmen anhören und Sie müssen Ihre Suche nicht auf dürftige Informationen in Form von manuell hinzugefügten Schlüsselwörtern beschränken. Sie können - ganz im Gegenteil - auch eine Information ausfindig machen, welche in der betreffenden Aufnahme nur am Rand auftaucht und die man nach den Schlüsselwörtern somit nicht finden würde.

Sprachteil

Bei dieser Technologie wird die Spracherkennung mit der Volltextsuche - welche mit Sprachwerkzeugen für die morphologische Suche komplettiert ist - beziehungsweise mit dem Synonym-Wörterbuch oder sogar mit dem Übersetzungstool miteinander kombiniert. Sie lässt sich auch mit der Stimmsuche kombinieren, wodurch ein System entsteht, welches nicht nur in der Sprache sucht, sondern darüber hinaus auch über die Sprache gesteuert wird.

Programmlösung

Wie bei wahrscheinlich allen anderen effektiv funktionierenden Suchsystemen erfolgt in den durchsuchten Aufnahmen zuerst die Indexierung und anschließend ist in diesen eine effektive Suche unter Verwendung der erstellten Indexe möglich.

Bei der Schlüsselkomponente für diese Technologie handelt es sich um die Spracherkennung, durch welche der Ton in den Text umgewandelt wird (bei einem nicht eindeutigen Erkennungsergebnis kann auch der Text nicht eindeutig sein). Danach folgt die Textverarbeitung vor der Indexierung (durch Erstellung eines Indexregisters), wie zum Beispiel die Lemmatisierung (Umwandlung des Worts in die Grundform) für die morphologische Suche beziehungsweise die Übersetzung in die Indexsprache und sogar die eigene Indexeintragung, in welcher dann von der Suchmaschine anhand der eingegebenen Fragen gesucht wird. Die Verarbeitung der Fragen erfolgt ebenfalls, es kann zum Beispiel die Lemmatisierung oder Formerweiterung erfolgen (für eine Wortform werden auch alle anderen Formen des Worts ergänzt, um auch Treffer für diese Formen - und nicht nur für die eingegebene Form - zu erzielen) beziehungsweise die Synonymerweiterung oder die Übersetzung in die Indexsprache.

Die Erkennung ist in Bezug auf die Rechenmittel relativ anspruchsvoll und deren Rechenleistung ist in der Form festzulegen, dass sie ausreichend schnell neu indexierte Aufnahmen in Text umwandlen kann. Die erforderliche Zeit zum Verarbeiten der Aufnahme beträgt ein Bruchteil der Zeit für deren Abspielen mit normaler Geschwindigkeit. Durch die höhere Anzahl der Kernpunkte können mehr Aufnahmen parallel verarbeitet werden. Aufgrund der höheren Belastung ist es angebracht, die Erkennungsvorrichtungen auf speziell dedizierten Servern zu errichten, welche den Parametern entsprechen. Die sonstigen Tätigkeiten im Rahmen der Indexierung sind wesentlich schneller. Im Rahmen der Suche kann bei einer großen Belastung die Geschwindigkeit zum Lesen von der Festplatte ein hinderlicher Faktor sein. Dies lässt sich zum Beispiel durch die Verwendung von schnellen Festplatten - am Besten von SSD-Festplatten - beheben oder durch deren Reflexion auf weitere Festplatten beziehungsweise weitere Suchserver.