Alles lokal: Parser → Ontologie/Glossar → MT → Evaluation → Review → TEI-Export. Kein Vendor-Lock-in.
Langes Dokument übersetzen (Upload, Formate, Download) · Text aus Bild (OCR)
Eingabe, Analyse (Transliteration, Sandhi, Morphologie, Interlinear), MT, Terminologie und Provenance für Reproduzierbarkeit.
Leer = API nutzt Konfiguration. Bei Docker: leer lassen, dann nutzt die API den Service-Namen (z. B. parser-heritage:9100). Bei lokaler API und Parser in Docker: Host-Port (parser-heritage z. B. 9101).
Quelle (Token) und Gloss (Lemma, POS).
Referenz optional eintragen (z. B. aus Goldset oder manuell). MT über API (POST /translate) laden.
Im Quelltext erkannte Begriffe aus der Ontologie (für philologische Konsistenz).
Modell und Zeitstempel für Reproduzierbarkeit (Papers, Methodik).
Status und Kommentar zum aktuellen Segment (werden im Browser gespeichert). Siehe Goldset-Format: review_status, notes.
Parser- und Lauf-Metadaten für Zitation und Nachvollziehbarkeit.
python tools/scripts/export_tei.py. Lange Dokumente: Dokument-Übersetzung (Upload, Segmentierung, Formate, Download). Wissenschaftliche Nutzung: docs/research/scientific_use.md, CITATION.cff.