使用Word或者是其他之類編輯環境的時候很多我們有這樣一個需求,那就是對于編輯區之中的文本漢字進行統計。對于office來說這很簡單,在工具菜單之中就是有字數統計,WPS或者是高版本的Office直接在狀態欄之中可以看到字數。但是這些字數真的是正確嗎?
中文和朝鮮語字符的含義
實際之上在Office和Word之中所統計的字符都是中文和朝鮮語字符個數,并且這必須設置才是可以真正的技術。在這種模式之中其把連續的英文字母也是計算為一個漢字。顯然這不符合我們計算純粹漢字的需求。
如何計算文本之中純漢字個數
如果我們連接了網絡的話,那么可以在網絡之上尋找到很多網頁版本的漢字個數計算應用,把自己word之中的文本復制到網頁之中就是可以完成計算。
雖然說這是一個計算方法,但是必須存在網絡環境,并且我們從編輯環境切換到瀏覽器之間會浪費大量的時間,顯然這不是一個最好的方案。
最準確的漢字計算方法
利用正則表達式可以快速的完成漢字統計,但是對于用戶來說我們大多數情況之下都是必須通過編程的方式操作正則表達式,這里給出具體表達表達式VB版本的實現代碼:
len = Regex.Matches(RichTextBox2.Text, ”[\u4e00-\u9fa5]“).Count。
實際之上在powershell之中也是存在對于正則表達式支持的文本管理鞏固,利用這些工具我們也是可以在windows操作系統之中隨意統計文本之中的漢字個數。