Моўная мадэль (англ.: language model) — гэта імавернасная мадэль натуральнай мовы.
Першая значная статыстычная моўная мадэль была прапанавана ў 1980 годзе і цягам дзесяцігоддзя кампанія IBM правяла шэраг эксперыментаў у «стылі Шэнана» (Shannon-style), у якіх патэнцыйныя крыніцы для паляпшэння мадэлявання моў вызначаліся праз назіранне і аналіз здольнасці людскіх падвопытных прадказваць або выпраўляць тэксты.
Моўныя мадэлі карысныя для розных задач, у тым ліку для распазнаванне маўлення (дапамагаючы прадухіліць прадказанні малаімаверных, напрыклад, бессэнсоўных, паслядоўнасцей), машыннага перакладу, генеравання натуральнай мовы (стварэнне тэксту, найбольш падобнага на чалавечы), аптычнага распазнаванне сімвалаў , распазнавання почырку , індукцыі граматыкі . і інфармацыйнага пошуку .
Вялікія моўныя мадэлі з’яўляюцца сёння найбольш прасунутай іх формай, з’яўляючыся камбінацыяй большых набораў даных (часта выкарыстоўваючы словы, узятыя з агульнадаступнага інтэрнэту), праманакіраваных нейронных сетак і трансформераў . Яны замянілі сабой мадэлі, заснаваныя на рэкурэнтных нейронных сетках ,якія раней замянілі чыста-статыстычныя мадэлі, такія як слоўныя n-грамныя моўныя мадэлі .
Моўныя мадэлі з максімумам энтрапіі кадзіруюць узаемаадносіны паміж словам і гісторыяй n-грама, ужываючы функцыі адзнак. Ураўненне будзе мець наступны выгляд
дзе — гэта функцыя разбівання , — гэта вектар параметраў, а — функцыя адзнак. У найпрасцейшым выпадку функцыя адзнак будзе індыкатарам прысутнасці пэўнага n-грама. Карысна ўжываць апрыёрнае размеркаванне на або нейкую форму рэгулярызацыі .
Лог-білінейная мадэль — яшчэ адзін прыклад экспаненцыйнай моўнай мадэлі.
Бесперарыўныя прадстаўленні або убудаванне слоў ствараюцца ў моўных мадэлях, заснаваных на рэкурэнтных нейронных сетках (вядомыя таксама як моўныя мадэлі з бесперапыннай прасторай). Такія ўбудаванні ў бесперапыннай прасторы дапамагаюць змякчыць праклён памернасці , які з’яўляецца следствам таго, што колькасць магчымых паслядоўнасцей слоў павялічваецца ў экспанентна разам з памерам слоўнікавага запасу, што ў будучым выклікае праблему разрэджанасці даных. Нейронныя сеткі абыходзяць гэту праблему прадстаўляючы словы як нелінейныя камбінацыя вагаў у нейроннай сетцы.
Ацэнка якасці моўных мадэляў часцей робіцца праз параўнанне створаных чалавекам з тыпічных моўна-арыентаваных задач эталонаў. Іншыя, менш рэгламентаваныя тэсты якасці даследуюць унутраны характар моўнай мадэлі або параўноўваюць дзве такія мадэлі. Паколькі ў моўных мадэлях звычайна закладаецца іх дынамічнасць і навучанне з даных, якія яны бачаць, некаторыя прапанаваныя мадэлі даследуюць хуткасць навучання, напр., шляхам праверкі крывых навучання.
Для ацэнкі сістэм апрацоўкі мовы былі распрацаваны розныя наборы даных. Да іх адносяцца:
This article uses material from the Wikipedia Беларуская article Моўная мадэль, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Матэрыял даступны на ўмовах CC BY-SA 4.0, калі не пазначана іншае. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Беларуская (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.