Terminologie in bedrijfscontext

Post on 02-Nov-2014

961 views 0 download

Tags:

description

 

Transcript of Terminologie in bedrijfscontext

Terminologie in bedrijfscontext: uitdagingen en praktische aanpak

Nathalie De Sutter11/05/2011

HoofdtitelSubtitel

Agenda

• Introductie• Doel van terminologie• Belang van terminologie• Strategie mbt terminologiebeheer

Introductie

What is?

• TerminologySpecialised vocabulary of a subject field, in a broader sense including the terminological work, teachings and research as well

• TermSingle- or multiple-word expression that denotes a specialised concept

• ConceptUnit of thought that summarises those characteristics that typify physical or abstract objects, and distinguish them from one another

(Bron: CEOV, aanbevelingen voor terminologie)

Doel

Doel van terminologie

• Kennisuitwisseling • Referentie en search• Vertaling• Automatische vertaling

Kennisuitwisseling: begrippenstelsels

PaardLipizzaner

Fries

Haflinger

Arabisch

etc

Referentie en search

Meertalige terminologie

Termherkenning tijdens vertaalproces

TM TBFuzzy match

(84%)

Machinevertaling - dictionary coding

Automatische codering

Deze codering determineert de woordsoort en voegt een betrouwbaarheidsscore toe

After review and correction of the dictionary, store your entries

by selecting File – Save.

De fouten worden gecorrigeerd en het

woordenboek is klaar om gebruikt te worden tijdens de

automatische vertaling

Belang

Facts & figures

• Slechts 7,8% van de bedrijven beheren terminologie proactief• Van de bedrijven die actief terminologie beheren…

– Rapporteert 88% een hogere productkwaliteit– Meldt 74% een stijging van de productiviteit– Bespaart 62% kosten– Geeft 56% aan dat dit het competitief voordeel van het

bedrijf versterkt • Niet-gestandaardiseerde terminologie veroorzaakt

aanzienlijke directe en indirecte kosten. Het gemelde tijdsverlies bij het opzoeken van een ambigue term loopt op tot 30 minuten.

Facts & figures

• In de automotive industrie worden bijna de helft van de vertaalfouten gecategoriseerd als “wrong term” (Woyde)

• 40 % van de tijd die nodig is om teksten te produceren gaat naar terminologiewerk (Stellbrink)

• Terminologiewerk is nodig voor 4% tot 6% van alle woorden in een tekst (Champagne)

• Uitbesteed vertaalwerk kan tot 50% duurder worden als de bronterminologie inconsistent is (Kjeldgaard)

• Het kost 10 keer meer om een term te corrigeren aan het einde van het productieproces dan aan het begin (Xerox, JDEdwards)

Belang van terminoogie

Het gebruik van ambigue terminologie leidt tot onnauwkeurige communicatie, die op haar beurt kan leiden tot:

– Ongepaste, onjuiste of inconsistente productinformatie– Mogelijk juridische consequenties– Wereldwijde merkerosie

Terminologiebeheer = noodzakelijk kwaad

Product manager

VertalerTerminoloog

Sales & marketing

Consistent Corporate Messaging

KLANTEN

HoofdtitelSubtitel

Strategie mbt terminologiebeheer

• Bepaal het doel• Implementeer een (multifunctioneel)

terminologiebeheersysteem en integreer met de nodige content management en vertaalomgevingen

• Respecteer data management principes en bepaal waaraan de termen moeten voldoen om opgenomen te worden (best practices)

• Bepaal processen om nieuwe termen toe te voegen (bv termextractie?), voorgestelde termen te valideren, de terminologie te onderhouden

• Ondersteun standaarden

Systeem

Terminologiebeheersysteem: must-haves

• Web-gebaseerd systeem• UNICODE: meertalig en multidirectioneel• Concept-georiënteerde databank• Velden door de gebruiker te definiëren en te benoemen• Ondersteuning van Open Standaarden, bv TBX, Xliff,… met het oog op

import en export• Integratie met (andere) terminologie- en vertaaltools (CAT)• Krachtige zoekfunctie, eventueel ook vervangfunctie• Bulk update functionaliteit• Schaalbare databankarchitectuur• Security management/user management• Advanced filtering• Volledig geschiedenisoverzicht en versioning

Terminologiebeheersysteem: nice-to-haves

• Gebruiksvriendelijke editfunctionaliteit• Geïntegreerde spellingscontrole• Identificatie en consolidatie van dubbele entries• Cross-referenties binnen de termendatabank• Hyperlinks naar externe bronnen of bestanden• Vertaalde versies van de interface• Proces om een workflow ter validatie van termen te ondersteunen:

projectbeheer, communicatie, administratie…• Opsporen van favoriete of populaire termen, niet gevonden woorden• Voor-vertaalfunctionaliteit om automatisch gevalideerde termen in het

vertaalproject te introduceren (bv. Variabelen, of entities)

Data management

Wat is een relevante term?

• Afhankelijk van:– Doel– Domein – Type tekst– Gebruik – Budget

• Goede kandidaten:– Productnamen– Klant/bedrijfsspecifieke termen– Homoniemen– Synoniemen– Nieuwe termen of 'neologismen‘– Niet-te-vertalen termen

Voorbeeld: pragmatische aanpak

Wel: consolidatie van uw IT infrastructuurNiet: implementatie van uw IT infrastructuur

Metadata

• Bij voorkeur wordt metadata toegevoegd aan de termen:– Part of Speech (woordsoort, geslacht,…)– Definitie– Context (voorbeeld)– Beeld– Gebruik– Onderwerp/classificatie

• Vaste procedure voor onderhoud van de terminologie

Metadata

• Voorbeeldzin• Context:

– bv. Web, Button label, login page (for website items)

• Oorsprong:– E.g. offerte, <title>

• Verwerkingsstatus: hoe ver staat het validatieproces van de term?– Nog niet verwerkt: nieuw toegevoegd, zonder gebruiksstatus– In verwerking– Klaar: processtatus is bevestigd

• Gebruiksstatus: hoe moet de term gebruikt worden?– Voorkeur: te gebruiken indien er meerdere synoniemen in de termenlijst zitten– Toegelaten: de term in kwestie mag gebruikt worden– Niet aanbevolen: deze term mag liever niet gebruikt worden– Overbodig: termen die vroeger toegelaten waren maar nu in onbruik geraakt zijn– Ongeldig: synoniemen die niet gebruikt mogen worden

Processen

Termextractie

• Automatisch relevante termen uit een corpus extraheren.• Door middel van linguïstische processors (part of speech

taggers, phrase chunking) worden terminologische kandidaten geïdentificeerd, i.e. syntactisch plausibele terminologische noun phrases

• De termen worden dan gefilterd door middel van statistische algoritmen, bv. op basis van frequentie in het corpus.

• Een uitzonderingslijst kan gebruikt worden om de fouten te reduceren.

• Eventueel wordt de stamvorm van de term gereconstrueerd.

Eentalige termextractie

Vertaalgeheugen (parallel corpus) inladen

Minimale frequentie specificeren

Zoek overeenkomstige term in de doeltaal

Translation Memory Xchange format (TMX)

Translation Memory Xchange format (TMX)

Validatie

• De geëxtraheerde terminologie dient gevalideerd te worden door interne medewerkers van het bedrijf:– Specialisten– Product managers– Content owners– Taalkundigen

• Eventueel controle door:– Juridische dienst– Marketing– Corporate communications

(Geautomatiseerde) termverificatie

Geautomatiseerde termverificatie

Automatische termverificatie

Automatische termverificatie

Samenvatting

• Een proactieve aanpak van terminologiebeheer ondersteunt de algemene globalisatiestrategie van bedrijven: de producten zullen inhoudelijk een hogere kwaliteit hebben in de verschillende talen, en het vertaalproces wordt erdoor vergemakkelijkt.

• Door vooraf termen te extraheren kunnen fouten opgespoord worden en kan de terminologie vooraf aan de vertalers bezorgd worden.

• Terminologie die bewaard wordt in een databank kan ook andere bedrijfsdoelen ondersteunen: gecontroleerd schrijven, vertalen, information mining, machinevertaling en kennisverspreiding.

• Het is belangrijk dat bedrijven de voordelen van terminologiebeheer zien, en dat terminologen de juiste tools en procedures toepassen.