Käännösmuistin toiminta

 

Käännösmuistiohjelma tallentaa jo käännetyt lähdetekstit ja niitä vastaavat kohdekieliset käännökset tietokantaan ja tuo siellä olemassa olevat käännökset esiin vastaavan sisältöisiä uusia dokumentteja käännettäessä. Nykyiset käännösmuistit ovat useimmissa tapauksissa rakenteensa puolesta tekstikentistä ja tietueista muodostuva tietokanta, johon tavallisesti sisältyy lähde- ja kohdekielinen tekstisegmentti sekä mahdollista lisätietoa käännöksestä (käännösajankohta, viimeisin käyttöajankohta, alkuperäisen kääntäjän nimi jne.). Etenkin automaattiseen ja konekieliseen kääntämiseen käytettävissä käännösmuisteissa tukeudutaan myös laajoihin toisiinsa kohdistettuihin referenssidokumentteihin.

Käännösmuistiohjelman käyttöliittymä on useimmiten itsenäinen sovellus, jossa varsinainen käännöstyö tapahtuu joko paikallisesti tai verkossa pilvipalveluna. Jälkimmäisessä vaihtoehdossa usea kääntäjä voi samanaikaisesti käyttää ja päivittää samaa käännösmuistia, mikä lisää käännöstyön yhdenmukaisuutta. Ohjelma tarjoaa useimmiten myös mahdollisuuden katsella käännettävää tiedostoa lopullisessa ilmiasussaan, mikä edistää kontekstin ja kokonaisuuden ymmärtämistä. Joissakin tapauksissa käännösmuisti voi olla myös tekstinkäsittely- tai taitto-ohjelman erillinen lisäosa, jossa käännösmuistin avulla voidaan tehdä käännöstä suoraan lopulliselta näyttävään dokumenttiin. 

Tässä esityksessä käännösmuistin mallikäyttöliittymänä on käytetty SDL Trados TagEditor –ohjelmaa. Kyseinen ohjelmaversio on nykyisin jo hieman vanhentunut, mutta esitettävät esimerkit kuvaavat hyvin käännösmuistiohjelman toimintaperiaatetta, joka on hyvin samantapainen ohjelmasta ja versiosta riippumatta.

Käännösmuisteissa lähdekieliset tekstit pilkotaan helpommin hallittaviksi kokonaisuuksiksi, joita kutsutaan segmenteiksi. Lähdekielinen virke tai lause tai näitä muistuttava yksikkö (otsikko, luettelon rivi) ja sitä vastaava käännös muodostavat yhden segmentin. Segmentointi voi joissakin tapauksissa tapahtua myös virkettä suuremmiksi tai riviä pienemmiksi yksiköiksi (tekstikappaleet, yksittäiset sanat). 

Kuvassa olevassa esimerkissä käännösmuistiin on tallennettu yksi käännössegmentti, jonka englanninkielisenä lähdekielisenä tekstinä on yksinkertainen lause This is a translation ja sitä vastaavana kohdekielisenä käännöksenä suomenkielinen lause Tämä on käännös.

Käännössegmenttien lisääminen käännösmuistiin voi tapahtua erillisenä tuontitoimintona. Useimmiten käännössegmentit kuitenkin syntyvät käännöstyön yhteydessä siten, että kääntäjä tekee ensimmäisellä kerralla tarjolla olevaa lähdekielistä tekstiä vastaavan kohdekielisen käännöksen tallentaa käännössegmentin muistiin hyväksymällä sen.

Seuraavassa tarkastellaan lähemmin käännösmuistiohjelman toimintaa ja käyttäytymistä erilaisissa tilanteissa. Vaikka käännösmuisti useimmissa tapauksissa onkin hyvin käytännöllinen työkalu, jonka käyttö auttaa yhdenmukaistamaan tekstin sisältöä ja säästää aikaa ja kustannuksia, kun samojen tai lähes samanlaisten käännösten tekeminen useita erillisiä kertoja voidaan välttää, on myös tilanteita, joissa käännösmuistin yksioikoinen käyttö voi johtaa virheellisiin tai epätoivottuihin tuloksiin, jos muistin asetukset ovat puutteelliset ja olemassa olevia käännöksiä käytetään sellaisinaan ilman ihmisen tekemää tarkistustyötä.


Käännöksen tekeminen ensimmäisellä kerralla

Kääntäjän tehdessä työtään käännösmuistin avulla hän kohtaa sekä uusia tekstejä – siis sellaisia, joita ei vielä ole tallennettu käännösmuistiin – että käännösmuistiin jo tallennettuja tekstejä. Kun käännösmuistiin on tallennettu runsaasti aikaisempia käännöksiä, eteen voi tulla myös tilanteita, joissa osa uudesta käännettävästä tekstistä on jo tallennettu käännösmuistiin.

Käännösmuistissa valmiina olevia käännössegmenttejä kutsutaan täydellisiksi vastaavuuksiksi (full match) ja osittain yhteneviä käännössegmenttejä puolestaan osittaisiksi vastaavuuksiksi (fuzzy match). Osittaisistakin vastaavuuksista voi olla kääntäjälle suurta hyötyä silloin, kun käännettävänä on esimerkiksi termi tai ilmaisu, jota hänen tulisi yhdenmukaisuuden vuoksi käyttää muissakin samaa asiaa koskevissa käännöksissä. Tällaisissa tapauksissa käännösmuisti siis täyttää samalla osittain myös toisen käännöstyökalun eli termipankin tehtävän.

Käännösmuistin merkittävin etu kääntäjän aputyökaluna onkin usein se, että muistin avulla kääntäjä pystyy säilyttämään termien ja erilaisten ilmaisujen osalta käännöksen yhdenmukaisuuden joutumatta jatkuvasti tarkistamaan "tutulta tuntuvia" tekstejä erillisistä termipankeista tai irrallisista referenssitiedostoista.

Kun kääntäjä kohtaa ensimmäistä kertaa käännettävän segmentin, josta käännösmuistissa ei ole ennestään sen enempää täydellistä kuin osittaistakaan vastaavuutta, hänen on tehtävä koko käännös alusta loppuun.

Kuvan esimerkissä kääntäjällä on edessään englanninkielinen teksti This is a translation.

Koska tekstiä tai edes sitä muistuttavaa tekstiä ei ole aikaisemmin käännetty eikä tallennettu käännösmuistiin, käännösmuisti ei pysty tarjoamaan kääntäjälle mitään apua. 

Näytön vasemmassa alakulmassa oleva teksti No match! kertoo kääntäjälle, ettei muistissa ole ennestään tätä tai edes sen kaltaista käännettyä lausetta. 

Kääntäjä tekee nyt käännöksen eli kirjoittaa Tämä on käännös lähdetekstin alapuolella olevalle riville ja tallentaa käännöksen muistiin. Tallennuksen yhteydessä tallentuu myös käännöksen tekoajankohta, kääntäjän tunnus ja mahdollisia muita ohjelmaan erikseen määritettyjä tietoja. Tämän jälkeen tehty käännös on valmiina käännösmuistissa seuraavan kerran, kun käännettäväksi tulee täysin tai lähes täysin samanlainen lähdekielinen lause.


Käännöksen tekeminen käännösmuistin täydellisen vastaavuuden avulla

Kun lähdekielinen lause tai lähes samansisältöinen teksti löytyy jo käännösmuistista, kääntäjä saa tiedon siitä kyseisen käännössegmentin kohdalla. 

Jos käännettävä lause on täsmälleen sama kuin käännösmuistiin jo tallennettu käännös, käännösmuistiohjelma tarjoaa kääntäjälle hyväksyttäväksi samaa käännöstä sellaisenaan. Esimerkkiohjelman käyttöliittymässä kohdekielinen käännös näkyy vihreää taustaa vasten ja lisäksi näytön vasemmassa alakulmassa näkyy teksti 100 % - Exact Match. Lisäksi ohjelma näyttää alkuperäisen käännöksen päivämäärän sekä sen, kuka kyseisen käännöksen on tehnyt.

Tässä yhteydessä on syytä muistaa, että käännösmuistiohjelma tunnistaa jo tehdyn käännösparin ainoastaan lähdekielisen tekstin perusteella. Vaikka muistissa jossain muualla olisikin kohdekielinen käännös, joka olisi juuri oikea kyseiseen kohtaan, käännösmuisti ei kykene löytämään tai hyödyntämään tällaista käännöstä, ellei sitä ole tietokannassa liitetty nimenomaan vastaavaan lähdekieliseen tekstiin.

Käännösmuistiohjelma ei siis osaa - eikä se edes yritä - itse järkeillä, voisiko jokin tietokannassa jo oleva kohdekielinen teksti olla "sopiva" käännös. Ainoastaan lähdekieliset tekstit toimivat tunnisteina käännösmuistille. Tällä asialla voi olla suuri merkitys silloin, jos sama lähdekielinen teksti pitää tai pitäisi tietoisesti kääntää eri tavoin erilaisissa asiayhteyksissä. Tällaisesta tilanteesta aiheutuvia mahdollisia ongelmia käsitellään lähemmin tuonnempana. Normaalitilanteessa kääntäjä hyväksyy käännösmuistiohjelman esittämän käännöksen ja etenee edelleen seuraavaan käännettävään lauseeseen.


Käännöksen tekeminen käännösmuistin osittaisen vastaavuuden avulla

Edellisessä kohdassa käsiteltiin tilannetta, jossa kääntäjä hyväksyy suoraan sellaisenaan käännösmuistiohjelman esittämän ja käännösmuistissa jo olevan, lähdetekstiä täydellisesti vastaavan käännöksen.

Mutta mitä tapahtuu, jos käännettäväksi tulee teksti, josta on jo olemassa osittain samanlainen käännös?

Aikaisemmin todettiin, että käännösmuisti ei osaa ottaa kantaa siihen, onko muistissa jo sellainen kohdekielinen teksti, joka voisi olla käännettäväksi tulevalle tekstille täysin oikea käännös, jollei tällaista käännöstä ole nimenomaisesti yhdistetty kyseiseen käännettävään tekstiin.

Jos muistiin sitävastoin on jo tallennettu käännössegmentti, jonka lähdekielinen teksti suuressa määrin vastaa käännettävää tekstiä, käännösmuisti tarjoaa kääntäjälle mahdollisuutta käyttää jo olemassa olevaa käännöstä uuden käännöksen osana. Tällaista tilannetta kutsutaan osittaiseksi vastaavuudeksi (fuzzy match).

Ajatellaanpa nyt, että kääntäjä saa eteensä lähdekielisen tekstin, jota lähellä oleva teksti ja sen kohdekielinen käännös on jo tallennettu käännösmuistiin. Siksi ohjelma tarjoaa kääntäjälle mahdollisuuden täydentää tai muuttaa uutta käännöstä siten, että se muokattuna vastaa uutta lähdekielistä tekstiä.

Koska vastaavuus on vain osittainen, käännösmuistiohjelma kertoo kääntäjälle, että tarjottua käännöstä ei voi käyttää sellaisenaan ja kertoo myös, miten uusi käännettävä teksti poikkeaa muistissa jo olevasta käännösparista. Lisäksi (esimerkkiohjelmassa) näkyy näytön vasemmassa alalaidassa käännettävän tekstin vastaavuus matemaattisina prosentteina (tässä tapauksessa 85 % Fuzzy Match).

Suurikaan matemaattinen vastaavuus ei välttämättä kerro, että käännös sellaisenaan on "lähes" oikea. Se osoittaa vain, miten suuri prosentuaalinen osuus uudesta käännettävästä tekstistä on muistissa jo olevan lähdekielisen tekstin mukainen. Tästä huolimatta käännöksen hyväksyminen sellaisenaan voi johtaa täysin virheelliseen käännöstulokseen.

Jos kääntäjä nyt muokkaa kohdekielisen tekstin vastaamaan uutta oikeaa käännöstä ja tallentaa sen muokatussa muodossaan, käännösmuistiin syntyy uusi lähde- ja kohdekielistä tekstiä täysin vastaava käännöspari.

Seuraavan kerran, kun käännettäväksi tulee uusinta tallennettua käännösparia vastaava lähdekielinen teksti, myös tämä käännös löytyy nyt muistista täydellisenä vastaavuutena. Yksi käännösmuistiohjelman käytön olennainen etu on siis myös se, että käännöstyön edetessä muisti jatkuvasti "paranee", kun osittaisista vastaavuuksista tulee kääntäjän tekemien pienten muutosten jälkeen täydellisiä vastaavuuksia.


Virheelliset käännökset ja duplikaattikäännökset

Kuten edellä todettiin, perinteinen käännösmuisti ei itsessään takaa käännöksen virheettömyyttä. Jos kääntäjä tekee tai hyväksyy virheellisen käännöksen ja tallentaa sen, muisti tarjoaa seuraavalla kerralla täydellistä käännösvastaavuutta kyseiselle lähdekieliselle tekstille, vaikka itse käännös olisikin virheellinen.

Uudet käännösteknologiat, joissa käännösmuistien käyttö yhdistetään konekäännökseen, ovat muuttamassa tilannetta. Tästä huolimatta hyvä käännöstulos on aina riippuvainen sen taustalla toimivasta ihmisestä. Siksi kääntäjän tuleekin olla erittäin tarkka erityisesti täydellisten vastaavuuksien hyväksynnässä etenkin, jos täydelliset vastaavuudet ajetaan käännöksiin "automaattisesti".

Yhtenä syynä käännösmuisteilla saataviin näennäisesti virheellisiin käännöstuloksiin voivat olla myös ns. duplikaattikäännökset. Kun samalla lähdekielisellä tekstillä voi asiayhteydestä riippuen olla useita "oikeita" käännöksiä, käännösmuistien asetuksilla voi olla joskus suuri vaikutus käännöksen lopulliseen laatuun. Seuraavat esimerkit kuvaavat asiaa lähemmin.

Kuvitellaan ensin, että aikaisempaa käännöstä tehnyt ja käännösmuistia käyttänyt kääntäjä saa seuraavaksi eteensä tekstin This is a turn. Aivan oikeaoppisesti hän kääntää tekstin suomeksi muotoon Tämä on käännös ja tallentaa käännöksen muistiin. 

Nyt käännösmuistissa on sama käännös eli Tämä on käännös kahdelle eri lähdetekstille. Aiheutuuko tästä siis ongelmia?

Vastaus tässä tapauksessa on: ei.

Kuten edellä todettiin, käännösmuistin kannalta ei ole merkityksellistä, miten monta kertaa ja miten moneen eri käännössegmenttiin sama kohdekielinen käännös tallennetaan. Käännösmuisti käyttää hakukriteerinään vain lähdekielisiä merkkijonoja.

Kun siis seuraavan kerran käännettäväksi tulee teksti This is a turn, käännösmuisti tarjoaa sille täydelliseksi vastaavuudeksi käännöstä Tämä on käännös, mikä on tässä tapauksessa aivan oikein. Käännökset eivät mene sekaisin tai aiheuta ristiriitoja, sillä lähdekieliset tekstit ovat täysin erilaisia. Niinpä kääntäjä voi hyväksyä uuden käännöksen ja tallentaa sen sellaisenaan muistiin.

Uudenlainen tilanne syntyy, jos kääntäjä haluaakin kääntää jo olemassa olevan tekstin This is a turn aikaisemmasta poikkeavalla tavalla. Käännösmuistille ei ole ongelma, jos erilainen lähdekielinen teksti käännetään keskenään samanlaisilla kohdekielisillä käännöksillä. Kun siis aikaisemmissa esimerkeissä sekä lähdekielinen ilmaisu translation että lähdekielinen ilmaisu turn on käännetty suomenkieliseksi sanaksi käännös, kumpikin käännös on oikea ja käännökset pysyvät erillään toisistaan aiheuttamatta ongelmaa.

Mutta jos kääntäjä seuraavalla kerralla haluaakin kääntää lauseen This is a turn muotoon Tämä on mutka (mikä myös on aivan oikea käännös), syntyy ns. duplikaatti: samalle lähdekieliselle ilmaisulle This is a turn onkin nyt tarjolla kaksi erilaista kohdekielistä käännöstä. Koska käännettävän tekstin tunnistaminen ja erottelu tapahtuu lähdekielisen segmentin mukaan, normaalisti samalle lähdekieliselle tekstille voi kerrallaan olla vain yksi kohdekielinen käännös.

Jos kääntäjä siis nyt hyväksyy samalle lähdekieliselle lauseelle uuden käännöksen ja tallentaa sen muistiin, aikaisemmin tehty käännöspari (This is a turn <> Tämä on käännös) pyyhkiytyy muistista pois ja korvautuu käännösparilla This is a turn <> Tämä on mutka.

Kun sitten sama tai toinen kääntäjä myöhemmin jälleen kohtaa lähdekielisen ilmaisun This is a turn, käännösmuisti tarjoaa ainoana täydellisenä käännösvastineena muotoa Tämä on mutka, vaikka aikaisemmassa käännöksessä sama ilmaisu on käännetty myös muotoon Tämä on käännös. Viimeisin tehty ja hyväksytty käännös on aina ratkaiseva.

Jos kääntäjä tällä kertaa haluaa jälleen käyttää mutkan sijasta ilmaisua käännös, hän voi tehdä muutoksen ja tallentaa sen. Tällöin kuitenkin ilmaisulle turn tehty vaihtoehtoinen käännös mutka vastaavasti pyyhkiytyy pois ja sama tilanne toistuu jokaisen uuden tallennetun käännöksen jälkeen.


Duplikaattikäännösten tietoinen käyttö ja käännösmuistien päivitys

Duplikaattikäännösten aiheuttamaa pulmaa voidaan torjua kahdella pääasiallisella tavalla:

  • estämällä duplikaattien syntyminen tietokantaan (joka yleensä on käännösmuistiohjelmien oletusasetus) ja käyttämällä erilaisissa konteksteissa eri käännösmuisteja. Tämä on varsin helppo ja yksinkertainen ratkaisu, joka kuitenkin edellyttää sitä, että tarve kääntää sama kohdekielinen ilmaisu eri tilanteissa samassa käännöksessä eri tavoin ei ole ehdoton tarve.

    Tämä menettelytapa on käytännöllinen silloin, jos käytettävä käännösmuisti on suhteellisen suppea ja sen käyttö rajoittuu tiettyihin konteksteihin. Tällöin esiin ei tule tilanteita, jolloin sama lähdekielinen teksti tulee ehdottomasti kääntää samassa tiedostossa eri paikoissa eri tavoin.
  • sallimalla tietoisesti duplikaattien syntyminen tietokantaan. Tämä ratkaisu on ainoa mahdollinen silloin, jos eri tiedostojen kääntämisessä halutaan käyttää laajaa ja pitkältä ajanjaksolta koottua käännösmuistia.

    Nykyaikaisten käännösmuistien tietokannat mahdollistavat pääsääntöisesti myös duplikaattikäännösten käyttämisen. Koska tällaisissa tapauksissa käännössegmentin tunnistamiseen tarvitaan itse lähdekielisen tekstin lisäksi myös muita elementtejä, käännösmuistin hallitseminen vaatii huomattavasti perusteellisempaa perehtymistä. Muussa tapauksessa duplikaattikäännösten käyttö saattaa johtaa kiusallisiin virheisiin ja ongelmatilanteisiin.

Jos käännösmuisteissa halutaan sallia duplikaattikäännökset, tunnisteena on lähdekielisen tekstin ohella käytettävä myös jotain muuta avainta. Yksinkertaisimmillaan tämä lisäavain on tietokannan indeksinumero tai käännöksen hyväksymisajankohta. Avaimeksi voidaan - hieman käännösmuistiohjelmasta riippuvasti - määrittää myös esimerkiksi käännösprojektin nimi, käännettävän tuotteen nimi tai jokin muu selvästi erotettavissa oleva tunniste.

Jos käännösmuistissa sallitaan duplikaattikäännösten käyttö, tämä ei yleensä aiheuta ongelmia niin kauan kuin kääntäjä pysähtyy erikseen jokaiseen käännettävään ilmaisuun ja päättää tapauskohtaisesti, mitä käännösvaihtoehtoa käytetään - vai lisätäänkö vielä yksi uusi käännösversio. Hyvin yleisesti vallalla oleva käytäntö on kuitenkin, että jo käännöksen tilaaja käännättää käännösmuistilla automaattisesti kaikki käytettävissä olevassa muistissa olevat 100-prosenttiset vastaavuudet tekeillä olevaan käännökseen. Tavoitteena on tällöin useimmissa tapauksissa kustannusten säästäminen; muistista tulleista täydellisen vastaavuuden käännöksistä kääntäjälle ei makseta mitään, sillä onhan käännös jo kertaalleen tehty.

Tällainen ajattelutapa saattaa kuitenkin osoittautua vaaralliseksi ja hyvän tarkoituksensa vastaiseksi. Jotta käännösmuistin avulla automaattisesti tehtävät käännökset olisivat oikeita tilanteissa, joissa käytettävissä on useita erilaisia "oikeita" käännöksiä, käännösmuistin usein varsin monimutkaiset asetukset on osattava määrittää oikein, tarjolla olevien erotteluvaihtoehtojen perusteella. Tällainen vaatii yleensä laajaa erityisammattitaitoa. Jos "valmiit" käännökset vielä määritetään sellaisiksi, että kääntäjä ei saa eikä voi niitä muuttaa, tuloksena voi olla joukko tahattomasti virheellisiä käännöksiä.

Toinen tilanne, joka voi aiheuttaa ongelmia, on laajalti käytössä oleva käytäntö kääntää käännösmuistiohjelmalla kaikki 100-prosenttiset vastaavuudet suoraan läpi, ilman tarkistusta siitä, mikä mahdollisista duplikaattikäännöksistä on kulloinkin oikea. Tällainen asetelma syntyy etenkin silloin, jos kääntäjälle ei makseta mitään käännösmuistissa olevista 100-prosenttisista vastaavuuksista. Tällöin kääntäjälle voi olla, täysin perustellusti, vaikea ymmärtää, miksi hänen pitäisi ottaa kantaa oikeaan käännösvaihtoehtoon tilanteissa, joissa hänelle ei kyseisestä työstä makseta mitään.

Useimmat nykyaikaiset käännösmuistiohjelmat osaavat pysähtyä kysymään kääntäjältä, minkä erilaisista duplikaattivaihtoehdoista hän haluaa valita. Jos kääntäjälle maksetaan myös 100-prosenttisten vastaavuuksien tarkistuksista, teettäjällä on täysi syy edellyttää, että kääntäjä myös pysähtyy tarkistamaan kyseisen käännöksen. Toisaalta, jos 100-prosenttiset vastaavuudet on valmiiksi lukittu muutoksilta, kääntäjällä ei ole mahdollisuutta puuttua virheellisiin käännöksiin silloinkaan, kun siihen olisi perusteltua aihetta.

Jotta tällaisilta virheiltä ja niitä seuraavilta kalliilta jälkikäteisiltä korjauksilta voitaisiin välttyä, on tärkeää edeltä käsin sopia kulloinkin noudatettavista pelisäännöistä. Erityisesti laajoissa käännösprojekteissa käytettävien käännösmuistien asetuksista ja päivityksistä kannattaa yleensä päättää ennen käännöstyön aloittamista. Parhaaseen tulokseen päästään, jos asiasta konsultoidaan käännösmuistien asiantuntijan kanssa ennen käännöstyön aloittamista.

 

 

Nykyaikaisia käännöstyökaluja

 

Seuraavat linkit vievät suoraan lokalisointityökalujen valmistajien sivuille. Tällä sivustolla käsitellään lähemmin erikseen erilaisia käännös- ja lokalisointityökalujen pääryhmiä ja niiden käyttöä. 

527efb333