Languagetool: 一套自由及開放原始碼的語法、風格及拼寫檢查軟件

LanguageTool是一套自由及开放源代码的語法(英语:grammar checker)、風格及拼寫檢查软件,其所有功能都可供下載。 LanguageTool採取了核心開源模式(英语:open-core model),其網站跟其专有的姊妹計劃LanguageTool Plus相關連,而這個專有的姊妹計劃在英語及德語的錯誤偵測方面有所改進,以及在長篇文本的修改更容易。

LanguageTool
Languagetool: 技術, 離線使用, 參看
LanguageTool WikiCheck
LanguageTool WikiCheck
開發者Daniel Naber and Marcin Miłkowski
首次发布2005年8月15日,​18年前​(2005-08-15
当前版本
  • 6.4 (2024年3月28日;穩定版本)
編輯維基數據鏈接
源代码库 編輯維基數據鏈接
编程语言Java
平台Java SE
文件大小
  • Desktop app: 156 MB
  • n-gram data: 8.34 GB
类型語法英语grammar checker、風格及拼寫檢查软件
许可协议GNU LGPL v2.1+
网站languagetool.org 编辑维基数据

LanguageTool由Daniel Naber在2003年創建,原來用於他的學位論文,以Python語言編寫。 截至2022年8月16日 (2022-08-16),LanguageTool支援31種語言,均由志願工作者維護,通常都是那種語言的母語使用者。程式的偵錯模式採用模式匹配,利用自建的錯誤匹配規則來測試例文。 對於未支援的語言,網站亦提供有一個簡單的(聲稱三分鐘的)簡介,以協助使用者去開發其語言的工具。

核心應用程序本身是免費和開源,可以下載以供離線使用。有些語言的規則以「N元语法」數據來建立,這些數據很大,需要顯著的計算能力和輸入速度以逹到額外的偵錯能力。因此,LanguageTool 也作為在伺服器上處理「N元语法」數據的 Web 服務提供者。LanguageTool Plus 還使用「N元语法」作為其免費增值業務模型的一部分。

LanguageTool的web服務可以通過使用网页浏览器存取网络应用程序的接口,又或通過專用的客戶端插件在下列各軟體中調用:Microsoft OfficeLibreOfficeApache OpenOfficeVimEmacsFirefox瀏覽器Mozilla ThunderbirdGoogle Chrome。其網頁客戶端亦可集成到網站上。免費翻譯系統OmegaT中內置了一個基於 LanguageTool 的語法、拼寫和样式檢查插件。

技術

LanguageTool的技術並不檢查句子在文法上是否正確,而只是檢查有沒有包含常見的錯誤。因此,事實上我們可以編造出一句文法上錯誤,但又被LanguageTool接納的句子。句式偵錯是透過比對一系列以XML編寫的規則,並配合以Java編寫的應用程式來執行。這些基於XML的規則可以透過一個網上表格來填寫。較近期的发展依赖于大型的n-gram库,在人工神经网络的帮助下为改善拼写错误提供建议。

離線使用

當獨立版的LanguageTool在已安裝了Java、用作伺服器的電腦上解壓縮,可透過下列命令列來運行檢查程式的伺服軟件:

    java -cp languagetool-server.jar org.languagetool.server.HTTPServer --port 8081 --allow-origin "*"

成功執行後,可在瀏覽器上執行下列命令來測試:

    http://localhost:8081/v2/check?language=en-US&text=my+text
      {"software":{"name":"LanguageTool","version":"4.6","buildDate":"2019-06-26 07:28","apiVersion":1,"premium":false,"premiumHint":"You might be missing errors only the Premium version can find. Contact us at supportlanguagetoolplus.com.","status":""},"warnings":{"incompleteResults":false},"language":{"name":"English (US)","code":"en-US","detectedLanguage":{"name":"English (US)","code":"en-US","confidence":0.6561856}},"matches":[{"message":"This sentence does not start with an uppercase letter","shortMessage":"","replacements":[{"value":"My"}],"offset":0,"length":2,"context":{"text":"my text","offset":0,"length":2},"sentence":"my text","type":{"typeName":"Other"},"rule":{"id":"UPPERCASE_SENTENCE_START","description":"Checks that a sentence starts with an uppercase letter","issueType":"typographical","category":{"id":"CASING","name":"Capitalization"}},"ignoreForIncompleteSentence":true,"contextForSureMatch":-1}]}
    http://localhost:8081/v2/check?language=zh&text=我的文字
      {"software":{"name":"LanguageTool","version":"4.6","buildDate":"2019-06-26 07:28","apiVersion":1,"premium":false,"premiumHint":"You might be missing errors only the Premium version can find. Contact us at supportlanguagetoolplus.com.","status":""},"warnings":{"incompleteResults":false},"language":{"name":"Chinese","code":"zh-CN","detectedLanguage":{"name":"Chinese","code":"zh-CN","confidence":0.51967704}},"matches":[]}

利用程式執行後丟出來的JSON資料,使用者可以設計出自訂的文法檢查插件。

參看

參考資料

外部連結

Tags:

Languagetool 技術Languagetool 離線使用Languagetool 參看Languagetool 參考資料Languagetool 外部連結Languagetoolen:grammar checkeren:open-core model专有软件拼寫檢查自由及开放源代码软件

🔥 Trending searches on Wiki 中文:

媽的多重宇宙芭蕾舞女 (電影)林郁婷許光漢别当欧尼酱了!Pornhub赵乐际柯玲玲太陽花學運五月天土木堡之变游艾喆以神之名:信仰的背叛贊恩·馬利克苍兰诀商鞅新竹縣加油喜事李多慧 (啦啦隊)林智妍雍正帝吳政學 (企業家)Haerin王洪文TFBOYS巴拉圭张译女心理師 (電視劇)国务院台湾事务办公室Kitsch (IVE歌曲)徐玄振陳星翰百變小櫻于文文哲仁王后 (電視劇)LE SSERAFIM女法醫JD张澜澜邱沁宜王敏德XG (日本音樂團體)BOYS PLANETTEEN TOP鍾漢良梁汝波步步驚心 (電視劇)轉生公主與天才千金的魔法革命蘇照彬黄晓明梵蒂冈機智醫生生活舒淇薄熙来事件任嘉倫中華民國邦交國列表OpenAI楊烈儂本多情 (無綫電視劇)生化危機4朝鮮律師七宗罪沙贊!眾神之怒吳釗燮迈阿密公开赛王嘉爾中国中央电视台時代少年團名偵探柯南動畫集數列表今川氏真且试天下馮允謙公共電視文化事業基金會棒球大聯盟百家姓周星馳周雨彤申惠善異世界歸來的舅舅吴磊🡆 More