Apertium er eit maskinomsetjingssystem som blir utvikla med støtte frå mellom anna den spanske regjeringa, Kulturdepartementet i Noreg, regjeringa i Catalonia, og universitetet i Alicante, i tillegg til bidrag frå private aktørar, ymse universitet, studentar og frivillige entusiastar.
Det er fri programvare, publisert under GNU GPL.
Apertium | |||
| |||
| |||
Utgjevar | Google Play | ||
---|---|---|---|
Nyaste versjon | 3.8.3 (1. november 2022) | ||
Skrevet i | C++, Java | ||
Type | regel-baseret maskinomsetjing | ||
Lisens | GPLv2 | ||
Nettstad | https://www.apertium.org |
Apertium starta som eit av maskinomsetjingssystema i prosjektet OpenTrad og var opphavleg laga for å omsetja mellom nærskylde språk, men det har seinare vorte utvida til å handsama språk med større skilnader, som t.d. baskisk→spansk, nordsamisk→bokmål og kasakhisk→engelsk.
Sidan 2009 til no (2020) har det vore med i Google Summer of Code og Google Code-In kvart år og dermed fått bidrag frå mange studentar.
Wiki har sidan 2014 brukt Apertium til innhaldsomsetjing og har bidratt til utvikling av meir språkdata.
Systemet er modulært, og for å leggja til eit nytt språkpar er det nok å leggja til språklege data (omsetjingsordbok, reglar) i veldefinerte format (hovudsakleg XML-baserte). Modulane er definerte som Unix-kommandoar, som kommuniserer gjennom logiske røyr («pipes»).
Maskinomsetjinga i Apertium er regelbasert, med overføring av grammatisk struktur. Det finst reglar for analyse, generering og annotasjon av morfologi og syntaks. Overføring av struktur kan skje med overflatisk «chunking» eller rekursive reglar basert på kontekstfri grammatikk, men det er ingen gjennomgripande djup semantisk analyse. Det er ingen interlingva involvert, så nye omsetjingsretningar/språkpar krev ei omsetjingsordbok mellom kvart språkpar (ikkje berre mellom det nye språket og eit generelt mellomspråk). Der det finst ordbøker mellom språk A og B og B og C, finst verktøy som genererer ei ordbok frå A til C. I tillegg må sjølvsagt kvart språk ha sine einspråklege ressursar (ordbøker, reglar, statistikk).
Apertium nyttar endelege tilstandsautomatar for analyse/ordklassetagging (kor ordformer blir markert med kanskje fleirtydige oppslagsformer og ordklassar), generering (ordklassetagging «baklengs»), omsetjing av analyserte enkeltord og leksikalsk seleksjon (dvs. tydingsdisambiguering for tydingsskilnader som er viktige for omsetjinga). Ein skjult Markov-modell blir nytta for disambiguering av ordklasser, men mange språk nyttar i tillegg føringsgrammatikk for regelbasert ordklassedisambiguering.
Mellom dei språka som har publiserte språkpar i Apertium finn me nynorsk–bokmål, islandsk-svensk-dansk, dei romanske språka i Spania, kastillansk, katalansk, aragonsk og galisisk; engelsk, portugisisk, fransk, oksitansk, italiensk, indonesisk-malayisk, esperanto, bretonsk, walisisk, serbo-kroatisk–makedonsk–bulgarsk, kasakhisk-tatarsk, rumensk.
Innanfor Apertium-ramma er det sett i gang arbeid med maskinomsetjing mellom nynorsk og bokmål, apertium-nno-nob, nyaste publiserte utgåve kan testast på heimesida deira. I tillegg er Giellatekno ved Universitetet i Tromsø involvert i maskinomsetjing mellom samiske språk og mellom anna norsk. Ein omsetjar frå nordsamisk til bokmål er allereie publisert.
Sidan omsetjingspar i Apertium er definerte som Unix-røyr, kan ein enkelt omsetja til dømes fil.txt frå bokmål til nynorsk i ein terminal ved å skriva apertium nob-nno < fil.txt
, men det finst meir grafiske brukargrensesnitt som er meint for vanlege brukarar. Fleire nettstader har Apertium installert, t.d. heimesida apertium.org og sida til Giellatekno ved UiT, jorgal.uit.no. For GNU/Linux og Mac OS X finst programmet apertium-tolk
som omset medan du tastar, i tillegg til program som er spesifikt meint for omsetjing av undertekster til film og TV-seriar. Ein del tredjepartsprogram meint for omsetjarar (til dømes OmegaT, pology og Virtaal) kan bruka apertium til å gi omsetjingsforslag. For Android-baserte einingar finst ein app som kan omsetja utan nettilgang (men berre for dei språkpara som berre brukar modular som er porterte til Java).
Litteratur
This article uses material from the Wikipedia Nynorsk article Apertium, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Teksten er tilgjengeleg under CC BY-SA 4.0 om ikkje anna er oppgjeve. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Nynorsk (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.