Обработката на естествения език (ОЕЕ) или компютърната обработка на естествен (човешки) език (на английски: natural language processing, NLP) е подобласт на науката за изкуствения интелект и компютърната лингвистика.
Тя се занимава с автоматичното генериране и разпознаване на естествените човешки езици. Системите за езиково генериране преобразуват информация от компютърни бази от данни в човешки език, а системите за автоматично разбиране на даден естествен език преобразуват езикови записи във формално представяне, достъпно за обработка от компютърни програми.
Целта е компютърът да може да „разбира“ съдържанието на документите, включително нюансите от контекста. След това технологията може да извлича информация и идеи от документите, както и да категоризира и организира самите документи.
Предизвикателствата при обработката на естествен език често включват разпознаване на реч и генериране на естествен език.
Обработката на естествен език започва през 1950-те. В статията си „Изчислителна техника и интелигентност“ от 1950 г. Алън Тюринг предлага критерий за интелигентност (днес се нарича тест на Тюринг): задача, която включва автоматизирана интерпретация и генериране на естествен език.
Идеята за символната ОЕЕ е заложена в мисловния експеримент „китайска стая“ на Джон Сърл: дадени са някакви правила (напр. китайски разговорник с въпроси и техните отговори), компютърът прилага тези правила върху данните, с които се сблъсква, като така емулира разбирането на естествения език.
До 1980-те повечето системи за обработка на естествен език се основават на сложни списъци от ръчно зададени правила. Но въвеждането на алгоритми за машинно обучение от края на 1980-те водят революция в ОЕЕ. Това се дължи както на постоянното нарастване на изчислителната мощност, така и на постепенното намаляване на влиянието на теориите на Чомски в лингвистиката, теоретични основи, които обезкуражават новидете видове корпусна лингвистика.
През 2010-те представителното обучене и дълбоките невронни мрежи водят до широко разпространение на ново поколение от методи. Важна причина за тези промени са рекордните резултати от новите техники, например в езиковото моделиране, синтактичния анализ и много други. Подобни резултати са все по-важни в медицината и здравеопазването, където ОЕЕ помага в анализа на лекарски бележки и електронни здравни картони, правейки ги недостъпни за изучаване и подобряване на здравните грижи. Тези методи излизат и отвъд човешките езици, например в интерпретацията на ДНК.
Тази страница частично или изцяло представлява превод на страницата Natural language processing в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите. ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни. |
This article uses material from the Wikipedia Български article Обработка на естествен език, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Съдържанието е достъпно под условията на лиценза CC BY-SA 4.0, освен ако не е посочено друго. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Български (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.