Velingua Terminologiewerkzeuge für Endanwender, Sprachprofis und Systemintegratoren

Velingua ist eine Sammlung von terminologischen Werkzeugen, die entweder im Velingua Organizer genutzt oder als Modul in die eigene Software integriert werden.

Velingua bietet Terminologieextraktion für Deutsch und Englisch sowie Terminologieprüfung (kurz Termprüfung).

Velingua verwendet eine linguistische Engine, die eine Grundformenerkennung (Lemmatisierung) und Morphem-Erkennung für eine hochwertige Analyse der Textdaten gewährleistet.

Als Terminologiedatenbanken können die Produkte der UniTerm-Familie oder TBX-Daten verwendet werden.

Velingua unterstützt die Dateiformate Text (Ansi oder Unicode), XLIFF, PDF, HTML und XML.

Velingua – Übersicht

Velingua ist eine Sammlung terminologischer Werkzeuge für Sprachprofis wie Terminologen, Übersetzer, Dolmetscher oder Linguisten, die Flexibilität und komplexe Features suchen.

Velingua-Bausteine sind in vorhandene Systeme oder in Drittsoftware integrierbar.

Bausteine

  • Terminologieextraktion (für Deutsch und Englisch)
  • Termprüfung
  • Anbindung an Terminologiedatenbanken
  • Terminologieprüfung von Übersetzungen (in Planung)

Technologie

Velingua verwendet eine linguistische Engine, die eine Grundformenerkennung (Lemmatisierung) und Morphem-Erkennung für eine hochwertige Analyse der Textdaten gewährleistet. Die linguistische Engine unterstützt wichtige westeuropäische Sprachen (Deutsch, Englisch, Französisch, Spanisch, Niederländisch, Portugiesisch, Italienisch).

Als Terminologiedatenbanken können die Produkte der UniTerm-Familie oder TBX-Daten verwendet werden.

Folgende Textformate können verwendet werden:

  • Text (Ansi oder Unicode)
  • XLIFF
  • PDF
  • HTML
  • XML

Lizenzen

  • separate Lizenzen für die Bausteine für Systemintegratoren
  • Einzelplatzlizenz für Velingua Organizer
  • Firmenlizenz für Velingua Organizer
  • Einzelplatzlizenz für Velingua TermCheck
  • Firmenlizenz für Velingua TermCheck (personalisiert oder floating)

Velingua – Terminologieextraktion

Terminologieextraktion in Deutsch und Englisch

Die Terminologieextraktion berücksichtigt eine bestehende Terminologie sofern diese in einem der Formate UniTerm Pro, UniTerm Enterprise oder TBX vorliegt.

Als Textkorpora werden diese Formate unterstützt:

  • Text (Ansi oder Unicode)
  • XLIFF
  • PDF
  • HTML
  • XML

Die Ausgabe der Kandidaten erfolgt als Liste in einer CSV-Datei. Wahlweise kann die KWIC-Information mit erzeugt werden.

Die Velingua Terminologieextraktion kann als Kommandozeilen-Werkzeug in andere Umgebungen integriert werden. Die Liste der Terminkandidaten kann dann bereinigt und über CSV-Import in jede ­Terminologiedatenbank importiert werden.

Die Basismethoden für die Extraktion sind:

  • große relative Häufigkeit von Grundformen (mit Lemmatisierung)
  • Morphemanalyse (Auswertung häufiger Morpheme)
  • N-Gramm-Analyse (relativ häufig Zeichensequenzen – rein statistisches Verfahren)
  • Mehrworterkennung über Wortklassenmuster (z.B. Adjektiv-Substantiv-Sequenzen im Deutschen)

Die Terminologieextraktion ist hochgradig konfigurierbar mit

  • Schwellwerten für Mindestanzahl an Vorkommen
  • Steuerung der Ergebnismenge in Abhängigkeit von der Größe des Textkorpus
  • prozentualem Anteil der vier Basismethoden
  • Wortarten der Kandidaten
  • Wortklassenmuster für die Mehrworterkennung
  • Spalten der Ergebnisdatei (absolute Häufigkeit, Extraktionsverfahren, Wortart, KWIC …)

Im Velingua Organizer kann die Terminologieextraktion komfortable konfiguriert werden. Dort können auch interaktiv die Terminologie-Kandidaten in die Terminologiedatenbank übernommen werden. Dabei ist eine Klassifizierung als Vorzugsbenennung, erlaubte Benennung, verbotene Benennung oder Stoppwort möglich.

Velingua – Terminologieprüfung (kurz Termprüfung)

Termprüfung beim Schreiben

Velingua TermCheck ermöglicht die Termprüfung schon während des Schreibens: verbotene oder unbekannte Termini werden sofort ­sichtbar, damit Autoren sie korrigieren können.

Bereits integriert ist diese Termprüfung zum einen im XML-Editor SIMQIN von Acolada, zum anderen in die Office-Programme Word und PowerPoint sowie in die Adobe Tools InDesign und FrameMaker.

Mit dem Velingua Clipboard Listener ist die Termprüfung in allen Windows-Anwendungen möglich, in denen Text markiert und kopiert werden kann. Der Clipboard Listener läuft als Tool im Hintergrund und kann bei Bedarf ein- und ausgeschaltet werden.

Die Termprüfung verwendet die Datenbanken der UniTerm Terminologieverwaltungssysteme.

Eine linguistische Engine führt eine Grundformreduktion durch, so dass auch flektierte Formen erkannt werden.

Es werden auch Mehrwort-Benennungen erkannt. Das funktioniert selbst dann, wenn die Bestandteile in flektierten Formen vorliegen (wie z.B. Plural statt Singular bei Nomen oder weibliche statt männliche Flexionsform bei Adjektiven).

Aktuelle Dokumentation:

Dokumentation Velingua TermCheck

Systemanforderungen: 

lauffähig auf allen Windows Betriebssystemen ab Windows 8

Velingua – Velingua Organizer

Windows-Anwendung für die Velingua Bausteine

Der Velingua Organizer ist die graphische Benutzeroberfläche für die Velingua-Bausteine. Hier können die Terminologiedatenbanken definiert werden, mit denen die Terminologieextraktion und die Termprüfung zusammenarbeiten sollen.

Folgende Terminologiedatenbanken sind möglich:

  • UniTerm Pro
  • UniTerm Enterprise
  • TBX

Für die Terminologieextraktion können die Einstellungen konfiguriert und für die Wiederverwendung abgespeichert werden.
Die Terminologieextraktion kann für einzelne Dateien oder gesamte Verzeichnisse durchgeführt werden. Das Ergebnis der Extraktion kann anschaulich evaluiert werden.
Selektiv können Kandidaten in die Terminologiedatenbank übernommen werden. Dabei ist eine Klassifizierung als Vorzugsbenennung, erlaubte Benennung, verbotene Benennung oder Stoppwort möglich.

Im Velingua Organizer ist die Extraktion aus Dokumenten folgender Textformate möglich:

  • Text (Ansi oder Unicode)
  • XLIFF
  • PDF
  • HTML
  • XML

Für die Termprüfung können Dokumente gegen eine Terminologie verglichen werden. Dabei werden in dem untersuchten Dokument optional Benennungen farblich hervorgehoben, die als Vorzugsbenennung, erlaubte Benennung, verbotene Benennung oder Stoppwort klassifiziert sind.

Im Velingua Organizer ist die Termprüfung von Dokumenten folgender Textformate möglich:

  • Text (Ansi oder Unicode)
  • XLIFF
  • PDF
  • XML
  • HTML

Velingua – Module integrieren

Die Velingua Module können als ActiveX-Objekte in bestehende Anwendungen integriert werden.

Für die Terminologieextraktion gibt es dazu die Option, diese als Kommandozeilen-Tool einzubinden.

Die linguistische Engine muss als Service mit installiert werden, damit die linguistischen Funktionen zur Verfügung stehen.

Die Acolada Terminologie-Verwaltungssysteme haben ein Interface, über das die Kommunikation zwischen den Velingua Modulen und UniTerm stattfindet. Die Interfaces stehen nach Installation der Terminologie-Verwaltungssysteme zur Verfügung.

Für die Termprüfung auf Basis von UniTerm Enterprise steht ein REST-Service zur Verfügung. Damit ist die Einbindung in eigene Software-Komponenten sehr einfach möglich.