Korpuslingvistik

Korpuslingvistik kallas metoden att använda en korpus, en stor samling språkliga data, för språkstudier.

Termen myntades först på 1980-talet, men metoden började användas flera årtionden dessförinnan. En svensk pionjär på 1960-talet var Sture Allén med Nusvensk frekvensordbok.

Korpus

En korpus är en stor samling språkliga data, det kan röra sig om (transkriberat) talat eller tecknat språk, eller skriven text. Det finns olika sätt att definiera en korpus, men vanligen lagras en korpus elektroniskt med syfte att vara representativ för språket i fråga.

En korpus kan vara synkron eller diakron. Det vanliga är att en korpus har en bestämd (finit) storlek, men det finns också korpusar/korpora som växer med tiden, kallade monitorkorpusar. En korpus kan innehålla mer än ett språk, och kallas då parallellkorpus eller jämförbar korpus. En parallellkorpus är i allmänhet också en översättningskorpus, det vill säga att den innehåller texter på ett språk som kopplas samman med översättningar till ett annat språk och vice versa.

Tidiga korpusar var ofta noggrant viktade så att man valde texter från en noga genomtänkt blandning av genrer, till exempel både skönlitteratur och många olika sorters facklitteratur, och texter av många olika författare. Ett exempel på en sådan korpus som framställts i Sverige är Uppsalakorpusen, som innehåller en miljon ord. Idag är de flesta korpusar för språkvetenskaplig forskning betydligt större. Korpusar används bland annat för att ta fram ordböcker.

Man kan också tala om det material som ligger till grund för en viss artikel eller avhandling som en korpus.

Exempel på korpusar:

Ett exempel på en svensk forskare inom korpuslingvistik är Sture Allén.

Referenser

Noter

Allmänna källor

  • McEnery, T., Xiao, R., Tono Y. 2006. Corpus-Based Language Studies – an advanced resource book

Tags:

Korpuslingvistik KorpusKorpuslingvistik ReferenserKorpuslingvistikKorpus (språkdata)Nusvensk frekvensordbokSture Allén

🔥 Trending searches on Wiki Svenska:

BernadotteHenrik LarssonTiktok11 september-attackernaStockholms blodbadMasked Singer SverigeKlas IngessonBhutanViktor NorénAnt-Man (film)Tupolev Tu-141Raoul WallenbergChrister LindarwÖkenPotatisNeymarBenjamin NetanyahuSydafrikaIlham ÄliyevTärningFolksamNorgeKaspiska havetLudwig AugustinssonAlbin Lee MeldauStareSvenska alfabetetSI-enhetÖdlorKarl XVRanko ĐorđićRenaida BraunNorrlandJulius CaesarAgatha ChristieKungsfågelAnnika ÖstbergAntonio ConteI Have a DreamAzerbajdzjans herrlandslag i fotbollAfghanistanEurovision Song Contest 2023OnlyfansBruneiJens GanmanAnders SydborgSvenska Hockeyligan 2022/2023Kerstin GranlundKaufhaus des WestensGustav II AdolfMilitära grader i SverigeInduktansJönssonliganEdvin KurtulusRamadanMaximCarl Michael BellmanBröderna LejonhjärtaTidszonSylvester StalloneGeorge LucasWillysPeriodiska systemetErling HaalandFilippinernaDogge DoggelitoLasse LönndahlJames BondAzerbajdzjanskaGustaf VI AdolfAndalusienFröken SnuskPascal EngmanJasonBakuSandra DahlbergLivstids fängelse i Sverige🡆 More