Ähnliche Segmente in einem Text zählen
थ्रेड पोस्टर: kl64 (X)
kl64 (X)
kl64 (X)
Germany
Local time: 12:34
Slovak to German
+ ...
Sep 21, 2010

Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können.
... See more
Hallo,
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Ein Beispiel:

zwei ähnliche Segmente aus einer Objektbeschreibung:
"Haustiere und Rauchen sind in den Zimmern nicht erlaubt"
"Haustiere und Rauchen sind in den Zimmern erlaubt"

Das Programm sollte solche ähnlichen Segmente identifizieren, zählen und anzeigen können. Bisherige Konkordanz-Programme wie auch CAT identifizieren die oben genannten Segmente als zwei verschiedene.

Kennt jemand da ein kostenloses Programm?
Collapse


 
Olaf (X)
Olaf (X)
Local time: 12:34
English to German
Warum? Sep 21, 2010

kl64 wrote:
ich suche ein Tool, mit dessen Hilfe ich ähnliche Segmente identifizieren kann. Bisher habe ich nur welche gefunden, mit denen identische Segmente gefunden werden.

Eine solche Funktinalität ließe sich relativ leicht einbauen ist aber unpraktisch, da die meisten Agenturen Preise gemäß der Ähnlichkeit der Segmente mit einem Translation Memory d.h. über Fuzzy Matches berechnen. Selbst wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.

[Edited at 2010-09-21 20:04 GMT]


 
kl64 (X)
kl64 (X)
Germany
Local time: 12:34
Slovak to German
+ ...
विषय आरम्भक
reines Interesse Sep 22, 2010

wenn es so eine Funktion gäbe, wäre sie weder für Übersetzer noch für Agenturen hilfreich.


Richtig, es ist auch weder für den einen noch den anderen, sondern rein privates Interesse.

Wenn ich so etwas für Forschungszwecke ermitteln müsste, würde ich den Text mit einem kostenlosen Segmenter wie Europarl (http://www.statmt.org/europarl/ ) segmentieren und anschließend die Ähnlichkeit der Segmente zueinander über den Levenshtein Distance Algorithm (http://www.merriampark.com/ldperl.htm ) berechnen.


Vielen Dank für die Links. Der angegebene Quellcode scheint nur für zwei Segmente zu sein. Mal sehen, ob ich jemanden finde, der mir den für eine Vielzahl von Segmenten umschreiben kann (Perl ist nicht so meine Stärke).


 
RWSTranslati (X)
RWSTranslati (X)
Germany
Local time: 12:34
German to English
+ ...
Moderne TM-Systeme machen das Sep 22, 2010

Hallo,

die modernen TM-Systeme können auch die internen Fuzzy-Matches ermitteln.

Viele Grüße

Hans


 


यस फोरममा विशेष रूपमा कुनै मध्यस्थकर्ता नियुक्त गरिएको छैन।
साइट नियमहरूको उल्लंघनहरूको रिपोर्ट गर्न वा मद्दत पाउनको लागि, कृपयासाइट कर्मचारी » लाई सम्पर्क गर्नुहोस्


Ähnliche Segmente in einem Text zählen






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
LinguaCore
AI Translation at Your Fingertips

The underlying LLM technology of LinguaCore offers AI translations of unprecedented quality. Quick and simple. Add a human linguistic review at the end for expert-level quality at a fraction of the cost and time.

More info »