Tietokoneavusteinen kääntäminen (CAT = Computer-assisted translation) ja käännöstyökalut

Tietokoneavusteinen kääntäminen eli “CAT” (Computer-assisted translation, computer-aided translation = CAT) on kääntämisen muoto, jossa käännöstyötä tekevä henkilö käyttää tietokonetta ja sille tehtyjä ohjelmistoja apuna käännöstyössä.

Nimestään huolimatta tietokoneavusteista kääntämistä ei tule sekoittaa konekääntämisen käsitteeseen, jossa tietokone ja siihen asennettu konekäännösohjelma tekevät varsinaisen käännöstyön.

Yleistä

Nykyisin käytössä olevat automaattiset konekäännösjärjestelmät eivät tällä hetkellä yleensä kykene itsenäisesti tuottamaan riittävän laadukasta käännösjälkeä: ihminen joutuu jälkikäteen korjaamaan niiden tuottamaa käännöstulosta. Tietokoneavusteinen kääntäminen puolestaan on koneen ja ihmisen välisenä yhteistyönä toteutettavaa käännöstyötä, jota voidaan käyttää myös osana raakakonekäännöksen toimitustyötä.

Joissakin kehittyneissä tietokoneavusteisen kääntämisen sovelluksissa konekäännöstä käytetään yhtenä käännöstyön osana. Konekäännöstä hyödyntävät käännöstyökalut sisältävät joukon kääntäjälle tarkoitettuja aputyökaluja, jollaisia voivat olla esimerkiksi terminologian hallinta ja erilaiset lingvistiset ja oikeakielisyyttä parantavat apu- ja tarkistustoiminnot. Huolellisesti ennakolta valmistellut, hyväksyttyä terminologiaa sisältävät asiakaskohtaiset sanastot parantavat merkittävästi konekäännöksen laatua, mikä lisää koko käännösprosessin tehokkuutta.

Käännöstyökalut

Tietokoneavusteinen kääntäminen on laaja ja hieman epäselvä käsite, jonka piiriin kuuluu työkaluja yksinkertaisista aputyökaluista hyvinkin monimutkaisiin järjestelmiin. Käännöstyökaluja voivat olla:

  • oikolukuohjelmat, jotka voivat olla joko tekstinkäsittelyohjelmien osia tai itsenäisesti toimivia apuohjelmia.
  • kielentarkastusohjelmat, jotka toimivat tekstinkäsittelyohjelmien osina tai itsenäisinä apuohjelmina.
  • terminologianhallintaohjelmat, jotka mahdollistavat kääntäjän oman termitietopankin käytön elektronisessa muodossa. Termitietopankki voi olla yksinkertainen tekstinkäsittely- tai taulukko-ohjelmassa luotu taulukko, tietokantaohjelmalla (kuten MS Access) luotu tietokanta tai, laajemmissa ja kalliimmissa ratkaisuissa, erityinen kyseistä tarkoitusta varten valmistettu apuohjelma, esimerkiksi SDL Multiterm, LogiTerm, Termex tai vastaava.
  • yksi- tai kaksikieliset elektroniset sanakirjat.
  • paikallisella tietokoneella tai Internetissä säilytettävät yleiset termitietokannat.
  • tekstinhakutyökalut (vapaa tekstihaku ja indeksointi), jotka mahdollistavat jo käytettyjen käännösten haun erilaisista referenssiasiakirjoista.
  • konkordanssi- eli esiintymähakuohjelmat, joilla voidaan selvittää sanan tai ilmaisun esiintymistä sitä vastaavassa kontekstissa yksi-, kaksi- ja monikielisissä kokonaisuuksissa eli korpuksissa, kuten kaksikielisissä dokumenteissa tai käännösmuisteissa.
  • kohdistusohjelmat, joilla voidaan kohdistaa lähdekielinen ja kohdekielinen eli käännetty tekstisegmentti toisiinsa siten, että kohdistettuja kaksikielisiä dokumentteja voidaan analysoida käyttämällä tekstinhaku- ja konkordanssityökaluja.
  • projektinhallintaohjelmat, jotka mahdollistavat monimutkaisten käännösprojektien resurssien hallinnan ja aikataulujen toteutumisen seurannan.
  • käännösmuistityökalut (Translation Memory = TM), joiden perustana on lähde- ja kohdekielisten tekstisegmenttien muodostama järjestelmällisesti koottu tietokanta.

Työkaluratkaisut

Käännösmuistiohjelmat

Käännösmuistiohjelmat tallentavat jo käännetyt lähdetekstit ja niitä vastaavat kohdekieliset käännökset tietokantaan ja tuovat siellä olemassa olevat käännökset esiin vastaavan sisältöisiä uusia dokumentteja käännettäessä.

Käännösmuisteissa lähdekieliset tekstit pilkotaan helpommin hallittaviksi kokonaisuuksiksi, joita kutsutaan segmenteiksi. Lähdekielinen virke tai lause tai näitä muistuttava yksikkö (otsikko, luettelon rivi) ja sitä vastaava käännös muodostavat yhden segmentin. Segmentointi voi joissakin tapauksissa tapahtua myös virkettä suuremmiksi tai riviä pienemmiksi yksiköiksi (tekstikappaleet, yksittäiset sanat).

Kääntäjän työstäessä käännettävää dokumenttia käännösmuistiohjelma käy läpi jo olemassa olevat käännössegmentit ja tarjoaa kääntäjän käyttöön jo valmista, täysin tai osittain yhteensopivaa käännöstä, jos sellainen löytyy käännösmuistin tietokannasta. Jos valmista käännöstä ei löydy, ohjelma sallii kääntäjän tallentaa kääntämänsä tekstin vastaamaan käännettävää uutta lähdetekstiä. Kun uuden segmentin käännös on valmis, ohjelma siirtyy seuraavaan käännettävään lähdetekstin segmenttiin.

Nykyiset käännösmuistit ovat useimmissa tapauksissa rakenteensa puolesta tekstikentistä ja tietueista muodostuva tietokanta, johon tavallisesti sisältyy lähde- ja kohdekielinen tekstisegmentti sekä mahdollista lisätietoa käännöksestä (käännösajankohta, viimeisin käyttöajankohta, alkuperäisen kääntäjän nimi jne.). Etenkin automaattiseen ja konekieliseen kääntämiseen käytettävissä käännösmuisteissa tukeudutaan myös laajoihin toisiinsa kohdistettuihin referenssidokumentteihin.

Käännösmuistiohjelman käyttöliittymä on nykyisin yleensä itsenäinen sovellus, jossa varsinainen käännöstyö tapahtuu joko paikallisesti tai verkossa pilvipalveluna. Jälkimmäisessä vaihtoehdossa usea kääntäjä voi samanaikaisesti käyttää ja päivittää samaa käännösmuistia, mikä lisää käännöstyön yhdenmukaisuutta. Ohjelma tarjoaa useimmiten myös mahdollisuuden katsella käännettävää tiedostoa lopullisessa ilmiasussaan, mikä edistää kontekstin ja kokonaisuuden ymmärtämistä. Joissakin tapauksissa käännösmuisti voi olla myös tekstinkäsittely- tai taitto-ohjelman erillinen lisäosa, jossa käännösmuistin avulla voidaan tehdä käännöstä suoraan lopulliselta näyttävään dokumenttiin.

Lisätietoja käännösmuistiohjelmien toiminnasta löytyy kohdasta Käännösmuistin toiminta.

Käännöshakukoneet

Käännöshakukoneet ovat varsin uusi sovellus käännösteollisuudessa. Ne toimivat Internetissä samalla tavoin kuin Internetin hakukoneet. Internetin sijasta käännöshakukoneet kuitenkin hakevat olemassa olevista käännösmuisteista aikaisemmin käännettyjä lauseenosia, fraaseja, kokonaisia lauseita ja jopa kokonaisia tekstikappaleita, jotka vastaavat lähdetiedoston käännettäviä segmenttejä.

Käännöshakukoneissa käytetään nykyaikaisia hakuteknologioita toteuttamaan sanahakuja oikeassa kontekstissaan, mikä varmistaa, että tulokset ovat lähdesegmentin kontekstin mukaisia. Tavanomaisten käännösmuistityökalujen tavoin käännöshakukoneiden tuottamat tulokset ovat vahvasti riippuvaisia haun kohteena olevien käännösmuistien laadusta.

Terminologian hallintatyökalut

Terminologian hallintatyökalut tarjoavat kääntäjälle mahdollisuuden tehdä automaattisia hakuja termitietokantoihin, jotka liittyvät käännettäviin dokumentteihin. Toimintatavasta riippuen termitietokantojen haun tulokset näkyvät joko suoraan käännösmuistityökalun käyttöliittymässä tai käyttämällä hakua varten luotuja pikanäppäimiä. Joissakin työkaluissa kääntäjä voi myös lisätä uusia terminologiapareja termitietokantoihin kääntämisen aikana. Jotkut kehittyneistä järjestelmistä antavat lisäksi kääntäjälle mahdollisuuden tarkistaa interaktiivisesti tai eräajotilassa, onko oikeaa lähdeteksti-/termiyhdistelmää jo käytetty käynnissä olevan projektin käännöksissä.

Käytössä on myös erillisiä termihallintajärjestelmiä, jotka tarjoavat työnkulun toiminnallisuutta parantavia ominaisuuksia ja visuaalista taksonomiaa sekä toimivat termien tarkistustyökaluina (oikolukutyökalujen tapaan, jolloin virheellisesti käytetyistä termeistä saadaan erillinen ilmoitus). Uusissa termityökaluissa voi olla myös muita monikielisiä termielementtejä (kuvat, videot, äänet) tukevia ominaisuuksia.

Tekstinkohdistustyökalut

Tekstinkohdistustyökalut pyrkivät pilkkomaan lähde- ja kohdekieliset dokumentit toisiaan vastaaviksi segmenteiksi, jotta sisällöstä voidaan luoda käännösmuisteja tai muita käännöksen apuna käytettäviä referenssitiedostoja. Monet kohdistustyökalut antavat kääntäjälle mahdollisuuden korjata manuaalisesti virheellisesti kohdistuneita käännössegmenttejä. Kohdistetuista dokumenteista voidaan sitten luoda myöhemmissä käännöksissä käytettäviä käännösmuisteja tai referenssitiedostoja.

Interaktiivinen konekäännös

Interaktiivinen konekäännös on malli, jossa automaattinen konekäännösjärjestelmä pyrkii ennustamaan ihmiskääntäjän tuottamaa käännöstä tekemällä käännösehdotuksia. Nämä ehdotukset voivat olla joko täydellisiä lauseita tai osia käännettävistä lauseista.

Joukkokäännös (Crowd translation)

Joukkokäännöksellä tarkoitetaan mallia, jossa suuri määrä kääntäjiä toimii yhteistyössä sosiaalisen median (some) välityksellä. Kun Facebook halusi kääntää suuren määrän englanninkielistä tekstiä graafisessa käyttöliittymässään, yritys käytti hyväkseen suuria määriä jo olemassa olevia vapaaehtoisten kääntäjien tuottamia käännöksiä.

Nykyaikaisia käännöstyökaluja

 

Seuraavat linkit vievät suoraan lokalisointityökalujen valmistajien sivuille. Tällä sivustolla käsitellään lähemmin erikseen erilaisia käännös- ja lokalisointityökalujen pääryhmiä ja niiden käyttöä. 

527efb333