手寫辨識

手寫識別(英語:Handwriting recognition)是計算機在照片觸摸屏或其他設備中接收並識別人手寫的文字等信息的技術,主要應用於光學字符識別(OCR)。

手寫識別

脫機手寫識別

離線手寫識別涉及到將圖像中的文本自動轉換成是計算機可以使用的字符代碼。離線手寫識別是比較困難的,因為不同的人有不同的書寫風格。離線手寫識別主要應用在打印出來的文字識別上。

減少識別錯誤的技術

常常使用縮小識別範圍,例如郵政編碼只包含1~9的數字,識別這種數字可以減少錯誤的可能。

主要的技術:

  • 指定特定的字符範圍
  • 利用字符的專有特點

字符的提取

離線字符識別往往涉及掃描過去寫的表格文檔。這意味着該設備或軟件需要將掃描的圖像中所包含的單個字符提取出來。然而,在這一步中有幾種常見的缺陷。其中最常見的是將多個相連的字符當作為單個字符分離出來。這增加了識別的難度,但現在許多軟件已經開始適應這種問題。

字符的識別

當單個字符的提取出來後,識別引擎開始計算其對應的計算機字符。現在有幾種不同的識別技術。

人工神經網絡

特徵的提取

除了人工神經網絡外,程序員有時必須手動確定他們感覺很重要的屬性。

這些屬性可能是:

  • 寬高比
  • 水平方向上的像素百分比
  • 豎直方向上的像素百分比
  • 筆畫
  • 字符到圖像中心的平均距離

這種方法可以提高識別的準確性,但需要花費更多的研發時間。

在線手寫識別

一般過程

在線手寫識別可以分解為幾個通用的步驟:

  • 預處理
  • 特徵的提取
  • 分離出字符

預處理的目的是摒棄無關的輸入數據,可以減少負面的影響。這涉及到速度和準確性。通常由圖像二值化、 正常化、 採樣、 平滑、去噪預處理等組成。

硬件方面

早在20世紀80年代,就有人提出在商業產品中將手寫體識別作為鍵盤輸入的一種替代方式。

軟件方面

現狀

雖然公眾已經習慣將手寫識別看作一種輸入方式,但在台式電腦筆記本電腦中並沒有得到廣泛的使用。鍵盤仍被普遍認為是速度更快,更可靠的輸入方式。截至2006年,許多掌上型電腦提供手寫輸入,但精確度仍是一個問題,有的人還認為屏幕鍵盤更有效率。

相關研究

手寫識別有活躍的社區和眾多研究它的學者。現在較大的手寫識別會議有「ICFHR」和「ICDAR」。

活躍的研究領域包括:

  • 在線識別
  • 脫機識別

參見