Valodas Modelis: Mašīnmācīšanās modeļa veids

Valodas modelis (angļu: language model) ir mašīnmācīšanās modeļa veids, kas ir apmācīts, lai vārdiem tekstā noteiktu varbūtības sadalījumu.

Modeļa mērķis ir aprēķināt vispiemērotāko vārdu, lai pabeigtu nepilnīgu teikumu vai frāzi, pamatojoties uz dotā teksta kontekstu.

Valodas modeļi tiek plaši izmantoti dabiskās valodas apstrādes uzdevumos. Tie tiek pielietoti runas atpazīšanas uzdevumos, lai mazinātu iespēju, ka mākslīgais intelekts kļūdaini atpazīst nepareizu tekstu (t.i., nesakarīgu, zemas varbūtības vārdu kārtību), kā arī mašīntulkošanā (piemēram, tulkojumu variantu kvalitātes novērtēšanā), dabiskās valodas ģenerēšanā (teksta ģenerēšanā), vārdšķiras marķēšanā, rakstzīmju optiskajā pazīšanā, rokraksta atpazīšanā, informācijas izguvē, un daudzos citos uzdevumos.

Tie galvenokārt tiek apmācīti ar lielu teksta datu kopu, piemēram, grāmatu vai dažādu rakstu kolekciju, fokusējoties uz vārdiem, kas veido tekstu, un to attiecībām ar citiem vārdiem. Gatavi modeļi izmanto no apmācībā izmantotās teksta datu kopas izgūtās vārdu attiecības un saistības, lai paredzētu nākamo vārdu teikumā, identificētu statistiski neiederīgos vārdus vai ģenerētu jaunu tekstu, kas ir gramatiski pareizs un semantiski viendabīgs.

Kopš 2018. gada dažādos dabiskās valodas apstrādes uzdevumos iespaidīgus rezultātus ir uzrādījuši lielie valodu modeļi — valodas modeļi, kas sastāv no dziļiem neironu tīkliem, kurus veido miljardiem apmācāmu parametru un kas apmācīti, izmantojot masveida nemarķēta teksta datu kopas. Lielie valodu modeļi paver jaunas iespējas tādās jomās kā meklētājprogrammu izstrādē, dabiskās valodas apstrādē, veselības aprūpē, robotikā un kodu ģenerēšanā. Tie ir kā pamats vairākiem rīkiem, piemēram, OpenAI produktiem — sarunbotam ChatGPT un koda ģenerētājam Codex.

Atsauces

Tags:

Angļu valodaKontekstsMašīnmācīšanās

🔥 Trending searches on Wiki Latviešu:

Edgars LiepiņšBaltvalisAutoritārais Kārļa Ulmaņa režīmsMinhenes vienošanāsBrīvības piemineklisApstākļa vārdsIzcelšanās NormandijāRomas Katoļu baznīcaMetanolsČūskasPar Latvijas Republikas neatkarības atjaunošanuGlikozeSērsLatvijas PSRIndijaMelānijas hronikaKomatsLatvijas vēstureAkmeņoglesSvalbāraSaturns (planēta)Krusta kariLaima (zīmols)Limuzīns Jāņu nakts krāsāEminemSprīdītis (filma)BaltimoraLatvijas futbola izlaseLatvijas administratīvais iedalījumsRomas impērijaGeorgs Frīdrihs HendelisLatvijas garākās upesJēkabpilsYouTubeLitosfēraDzīvniekiJelgavas novadsSlovēnijaBurtnieksViduslaikiDobeles novada ciemu uzskaitījumsMāršala plānsOlbaltumvielasRokaBezkameras riepaInternetsArāla jūraLatvija Eirovīzijas dziesmu konkursāPlatons ZubovsSpirtiKrievijaEdgars RinkēvičsGrieķijaLatviešu ornamentiHazāri2024. gada Eirovīzijas dziesmu konkurssRomaPūķisAleksandrs I RomanovsĢenētiski modificēta pārtikaKlods DebisīAugsneJurijs GagarinsRūdolfs BlaumanisRožu dzimtaLatvijas Valsts prezidentu uzskaitījumsViļa Plūdoņa iela (Rīga)Brāļi KaudzītesVecrīgaTitāniks26. martsValzirgsPareizticībaFranču revolūcijaIekšzemes kopproduktsAustrijaFeodālisms🡆 More