淺析如何讀取C# TextBox內(nèi)容的中文長(zhǎng)度
當(dāng)我們通過(guò)C# TextBox控件向數(shù)據(jù)庫(kù)中添加內(nèi)容時(shí),有時(shí)為了程序的可靠性,往往需要限定TextBox中輸入內(nèi)容的長(zhǎng)度,以吻合數(shù)據(jù)庫(kù)中定義的長(zhǎng)度。TextBox控件本身有個(gè)maxlength屬性,它可以限制TextBox中輸入字符的***長(zhǎng)度,所以在只有字符輸入的情況下,該屬性可以很好的幫助我們達(dá)到限制輸入長(zhǎng)度的目的。
但如果輸入包含中文或中英文混合的內(nèi)容時(shí),該屬性就不那么完善了,因?yàn)樗鼪](méi)有把一個(gè)漢字當(dāng)作兩個(gè)字符來(lái)處理,所以這通常會(huì)對(duì)一些剛剛接觸C# TextBox控件編程的朋友造成些許的小麻煩。為了解決這個(gè)問(wèn)題,我們先來(lái)簡(jiǎn)單分析一下,然后給出一個(gè)解決示例,希望能拋磚引玉。
C# TextBox控件中的text是string類(lèi)型的,該類(lèi)型是unicode編碼,所以我只需獲取中文的unicode值范圍,然后對(duì)string逐個(gè)進(jìn)行分析,如果在中文unicode值范圍內(nèi)就加2,否則就加1。如此,便可以得到TextBox中包含中英文混合內(nèi)容的實(shí)際長(zhǎng)度。
注:前128個(gè)Unicode字符(16位代碼從0x0000到0x007F)就是ASCII字符,接下來(lái)的128個(gè)Unicode字符(代碼從0x0080到0x00FF)是ISO 8859-1對(duì)ASCII的擴(kuò)展。
* 中國(guó)、日本和韓國(guó)的象形文字(總稱(chēng)為CJK)占用了從0x3000到0x9FFF的代碼
* 希臘字母表使用從0x0370到0x03FF的代碼
* 斯拉夫語(yǔ)使用從0x0400到0x04FF的代碼
* 美國(guó)使用從0x0530到0x058F的代碼
* 希伯來(lái)語(yǔ)使用從0x0590到0x05FF的代碼
C# TextBox簡(jiǎn)單代碼實(shí)現(xiàn):
- public static int GetTextBoxLength(string textboxTextStr)
- {
- int nLength = 0;
- for (int i = 0; i < textboxTextStr.Length; i++)
- {
- if (textboxTextStr[i] >= 0x3000 && textboxTextStr[i] <= 0x9FFF)
- nLength += 2;
- else
- nLength++;
- }
- return nLength;
- }
【編輯推薦】