使用Word或者是其他之類編輯環(huán)境的時(shí)候很多我們有這樣一個(gè)需求,那就是對(duì)于編輯區(qū)之中的文本漢字進(jìn)行統(tǒng)計(jì)。對(duì)于office來(lái)說(shuō)這很簡(jiǎn)單,在工具菜單之中就是有字?jǐn)?shù)統(tǒng)計(jì),WPS或者是高版本的Office直接在狀態(tài)欄之中可以看到字?jǐn)?shù)。但是這些字?jǐn)?shù)真的是正確嗎?
中文和朝鮮語(yǔ)字符的含義
實(shí)際之上在Office和Word之中所統(tǒng)計(jì)的字符都是中文和朝鮮語(yǔ)字符個(gè)數(shù),并且這必須設(shè)置才是可以真正的技術(shù)。在這種模式之中其把連續(xù)的英文字母也是計(jì)算為一個(gè)漢字。顯然這不符合我們計(jì)算純粹漢字的需求。
如何計(jì)算文本之中純漢字個(gè)數(shù)
如果我們連接了網(wǎng)絡(luò)的話,那么可以在網(wǎng)絡(luò)之上尋找到很多網(wǎng)頁(yè)版本的漢字個(gè)數(shù)計(jì)算應(yīng)用,把自己word之中的文本復(fù)制到網(wǎng)頁(yè)之中就是可以完成計(jì)算。
雖然說(shuō)這是一個(gè)計(jì)算方法,但是必須存在網(wǎng)絡(luò)環(huán)境,并且我們從編輯環(huán)境切換到瀏覽器之間會(huì)浪費(fèi)大量的時(shí)間,顯然這不是一個(gè)最好的方案。
最準(zhǔn)確的漢字計(jì)算方法
利用正則表達(dá)式可以快速的完成漢字統(tǒng)計(jì),但是對(duì)于用戶來(lái)說(shuō)我們大多數(shù)情況之下都是必須通過(guò)編程的方式操作正則表達(dá)式,這里給出具體表達(dá)表達(dá)式VB版本的實(shí)現(xiàn)代碼:
len = Regex.Matches(RichTextBox2.Text, ”[\u4e00-\u9fa5]“).Count。
實(shí)際之上在powershell之中也是存在對(duì)于正則表達(dá)式支持的文本管理鞏固,利用這些工具我們也是可以在windows操作系統(tǒng)之中隨意統(tǒng)計(jì)文本之中的漢字個(gè)數(shù)。