Моўная Мадэль

Моўная мадэль (англ.: language model) — гэта імавернасная мадэль натуральнай мовы.

Першая значная статыстычная моўная мадэль была прапанавана ў 1980 годзе і цягам дзесяцігоддзя кампанія IBM правяла шэраг эксперыментаў у «стылі Шэнана» (Shannon-style), у якіх патэнцыйныя крыніцы для паляпшэння мадэлявання моў вызначаліся праз назіранне і аналіз здольнасці людскіх падвопытных прадказваць або выпраўляць тэксты.

Моўныя мадэлі карысныя для розных задач, у тым ліку для распазнаванне маўлення (дапамагаючы прадухіліць прадказанні малаімаверных, напрыклад, бессэнсоўных, паслядоўнасцей), машыннага перакладу, генеравання натуральнай мовы[en] (стварэнне тэксту, найбольш падобнага на чалавечы), аптычнага распазнаванне сімвалаў[en], распазнавання почырку[en], індукцыі граматыкі[en]. і інфармацыйнага пошуку[en].

Вялікія моўныя мадэлі[en] з’яўляюцца сёння найбольш прасунутай іх формай, з’яўляючыся камбінацыяй большых набораў даных (часта выкарыстоўваючы словы, узятыя з агульнадаступнага інтэрнэту), праманакіраваных нейронных сетак[en] і трансформераў[en]. Яны замянілі сабой мадэлі, заснаваныя на рэкурэнтных нейронных сетках[en],якія раней замянілі чыста-статыстычныя мадэлі, такія як слоўныя n-грамныя моўныя мадэлі[en].

Чыста-статыстычныя мадэлі

Мадэлі, заснаваныя на слоўных n-грамах

Экспаненцыйныя

Моўныя мадэлі з максімумам энтрапіі[en] кадзіруюць узаемаадносіны паміж словам і гісторыяй n-грама, ужываючы функцыі адзнак. Ураўненне будзе мець наступны выгляд

Моўная Мадэль 

дзе Моўная Мадэль  — гэта функцыя разбівання[en], Моўная Мадэль  — гэта вектар параметраў, а Моўная Мадэль  — функцыя адзнак. У найпрасцейшым выпадку функцыя адзнак будзе індыкатарам прысутнасці пэўнага n-грама. Карысна ўжываць апрыёрнае размеркаванне[en] на Моўная Мадэль  або нейкую форму рэгулярызацыі[en].

Лог-білінейная мадэль — яшчэ адзін прыклад экспаненцыйнай моўнай мадэлі.

Нейронныя мадэлі

Рэкурэнтныя нейронныя сеткі

Бесперарыўныя прадстаўленні або убудаванне слоў[en] ствараюцца ў моўных мадэлях, заснаваных на рэкурэнтных нейронных сетках[en] (вядомыя таксама як моўныя мадэлі з бесперапыннай прасторай). Такія ўбудаванні ў бесперапыннай прасторы дапамагаюць змякчыць праклён памернасці[en], які з’яўляецца следствам таго, што колькасць магчымых паслядоўнасцей слоў павялічваецца ў экспанентна[en] разам з памерам слоўнікавага запасу, што ў будучым выклікае праблему разрэджанасці даных. Нейронныя сеткі абыходзяць гэту праблему прадстаўляючы словы як нелінейныя камбінацыя вагаў у нейроннай сетцы.

Вялікія моўныя мадэлі

Ацэнка і параўнаўчыя тэсты

Ацэнка якасці моўных мадэляў часцей робіцца праз параўнанне створаных чалавекам з тыпічных моўна-арыентаваных задач эталонаў. Іншыя, менш рэгламентаваныя тэсты якасці даследуюць унутраны характар моўнай мадэлі або параўноўваюць дзве такія мадэлі. Паколькі ў моўных мадэлях звычайна закладаецца іх дынамічнасць і навучанне з даных, якія яны бачаць, некаторыя прапанаваныя мадэлі даследуюць хуткасць навучання, напр., шляхам праверкі крывых навучання.

Для ацэнкі сістэм апрацоўкі мовы былі распрацаваны розныя наборы даных. Да іх адносяцца:

  • Корпус лінгвістычнай прымальнасці
  • GLUE benchmark
  • Microsoft Research Paraphrase Corpus
  • Шматжанравае мадэляванне вываду на натуральнай мове
  • Пытанні праз інтэрфейсы на натуральнай мове
  • Пары пытанняў-адказаў Quora
  • Распазнаванне імпліцытных ведаў у тэкстах
  • Эталон семантычнага тэкставага падабенства
  • Тэст адказу на пытанні SQuAD
  • Stanford Sentiment Treebank
  • Winograd NLI
  • BoolQ, PIQA, SIQA, HellaSwag, WinoGrande, ARC, OpenBookQA, NaturalQuestions, TriviaQA, RACE, MMLU (Massive Multitask Language Understanding), BIG-bench hard, GSM8k, RealToxicityPrompts, WinoGender, CrowS-Pairs. (LLaMa Benchmark)

Крыніцы

Дадатковая літаратура

  • J M Ponte; W B Croft (1998). "A Language Modeling Approach to Information Retrieval". Research and Development in Information Retrieval. pp. 275–281. CiteSeerX 10.1.1.117.4237.
  • F Song; W B Croft (1999). "A General Language Model for Information Retrieval". Research and Development in Information Retrieval. pp. 279–280. CiteSeerX 10.1.1.21.6467.
  • Chen, Stanley; Joshua Goodman (1998). An Empirical Study of Smoothing Techniques for Language Modeling (Technical report). Harvard University. CiteSeerX 10.1.1.131.5458.

Tags:

Моўная Мадэль Чыста-статыстычныя мадэліМоўная Мадэль Нейронныя мадэліМоўная Мадэль Ацэнка і параўнаўчыя тэстыМоўная Мадэль КрыніцыМоўная Мадэль Дадатковая літаратураМоўная МадэльАнглійская мова

🔥 Trending searches on Wiki Беларуская:

Святлана Георгіеўна Ціханоўская27 красавікаКлаўдзіа МантэвердзіАляксей Міхайлавіч ЛітвінСтудзёнкі (Нясвіжскі раён)2022БлогЧэмпіянат свету па футболе 1930Мікола ШабовічЦэнтральны дзіцячы парк імя Максіма Горкага (Мінск)Бу ВідэрбергКапыткаМінскВакуумАдвакаты, пазбаўленыя ліцэнзіі ў час палітычнага крызісу ў БеларусіБеларуская ВікіпедыяРагнеда РагвалодаўнаСінільная кіслатаЛітаратура і мастацтва (газета)Ігнат Габрыэлевіч БулгакАляксандр Рыгоравіч ЛукашэнкаПалаткаЛівонская вайнаСафлор фарбавальныБеларуская фанетыкаСправа менеджараў БелгазпрамбанкаМаксім БагдановічПубліцыстыкаMP3Марыя Магдалена РадзівілM8L8THРэпрадуктыўная сістэма чалавекаПітэр ХігсУсход АФКЧэмпіянат свету па хакеі з шайбай 2019Медаль «За працоўныя заслугі»Яўхім Фёдаравіч Карскі.tgФранцішак Багушэвіч2024Генадзь Валер’евіч ШутаўНацыянальны інстытут адукацыіДзеепрыслоўеАмонімВярбаПрэзідэнцкія выбары ў Беларусі (2025)Пінская шляхта (п’еса)Германа-савецкі ваенны парад у Брэст-ЛітоўскуВульваПапараць-кветкаХраналогія суданскага канфлікту (2023)Metro-Goldwyn-MayerСідрAppleХод каралевы (міні-серыял)Зміцер ВайцюшкевічКапіталізмВасіль Аляксеевіч ЖуковічЎOrkaВянок (зборнік)Летнія Алімпійскія гульні 1920КупаллеСям’яБайкаЯгайлаRegesta źródłowe do dziejów Litwy od czasów najdawniejszych aż do unji z PolskąРуская моваДэкрэт аб абароне суверэнітэту і канстытуцыйнага ладуПятро ВасючэнкаЛарыса ГеніюшПокуцьReform.byАтамная арбіталь🡆 More