C++中英文字符串基本概念解析
C++編程語(yǔ)言中的字符串應(yīng)用在實(shí)際編程中是一個(gè)比較基礎(chǔ)的應(yīng)用技術(shù)。 我們?cè)趯W(xué)習(xí)這門語(yǔ)言的時(shí)候,需要對(duì)這方面的知識(shí)有一個(gè)充分的掌握。在這里我們就一起來(lái)了解一下C++中英文字符串的表示方法。
在C++中英文字符串類的string的模板原型是basic_string
- template < class _Elem, class traits = char_traits< _Elem>,
class _Ax = allocator< _Elem>>- class basic_string{};
***個(gè)參數(shù)_Elem表示類型。第二個(gè)參數(shù)traits的缺省值使用char_traits類型,定義了類型和字符操作的函數(shù),如比較、等價(jià)、分配等。第三個(gè)參數(shù)_Ax的默認(rèn)值是allocator類,表示了內(nèi)存模式,不同的內(nèi)存結(jié)構(gòu)將操作指針的不同行為,例如棧、堆或段內(nèi)存模式等。
在C++標(biāo)準(zhǔn)里定義了兩個(gè)字符串string和wstring
- typedef basic_string< char> string;
- typedef basic_string< wchar_t> wstring;
前者string是常用類型,可以看作char[],其實(shí)這正是與string定義中的_Elem=char相一致。而wstring,使用的是wchar_t類型,這是寬字符,用于滿足非ASCII字符的要求,例如Unicode編碼,中文,日文,韓文什么的。對(duì)于wchar_t類型,實(shí)際上C++中都用與char函數(shù)相對(duì)應(yīng)的wchar_t的函數(shù),因?yàn)樗麄兌际菑耐粋€(gè)模板類似于上面的方式定義的。因此也有wcout, wcin, werr等函數(shù)。
實(shí)際上string也可以使用中文,但是它將一個(gè)漢字寫在2個(gè)char中。而如果將一個(gè)漢字看作一個(gè)單位wchar_t的話,那么在wstring中就只占用一個(gè)單元,其它的非英文文字和編碼也是如此。這樣才真正的滿足字符串操作的要求,尤其是國(guó)際化等工作。
看一下下面的程序,就會(huì)理解C++中英文字符串之間的差別。
- #include < iostream>
- #include < string>
- using namespace std;
- #define tab "\t"
- int main()
- {
- locale def;
- cout< < def.name()< < endl;
- locale current = cout.getloc();
- cout< < current.name()< < endl;
- float val=1234.56;
- cout< < val< < endl;
- //chage to french/france
- cout.imbue(locale("chs"));
- current=cout.getloc();
- cout< < current.name()< < endl;
- cout< < val< < endl;
- //上面是說(shuō)明locale的用法,下面才是本例的內(nèi)容,因?yàn)槠渲杏玫搅薸mbue函數(shù)
- cout< < "*********************************"< < endl;
- //為了保證本地化輸出(文字/時(shí)間/貨幣等),
chs表示中國(guó),wcout必須使用本地化解析編碼- wcout.imbue(std::locale("chs"));
- //string 英文,正確顛倒位置,顯示第二個(gè)字符正確
- string str1("ABCabc");
- string str11(str1.rbegin(),str1.rend());
- cout< < "UK\ts1\t:"< < str1< < tab< < str1[1]< <
tab< < str11< < endl;- //wstring 英文,正確顛倒位置,顯示第二個(gè)字符正確
- wstring str2=L"ABCabc";
- wstring str22(str2.rbegin(),str2.rend());
- wcout< < "UK\tws4\t:"< < str2< < tab< < str2[1]
< < tab< < str22< < endl;- //string 中文,顛倒后,變成亂碼,第二個(gè)字符讀取也錯(cuò)誤
- string str3("你好么?");
- string str33(str3.rbegin(),str3.rend());
- cout< < "CHN\ts3\t:"< < str3< < tab< < str3[1]
< < tab< < str33< < endl;- //正確的打印第二個(gè)字符的方法
- cout< < "CHN\ts3\t:RIGHT\t"< < str3[2]< < str3[3]< < endl;
- //中文,正確顛倒位置,顯示第二個(gè)字符正確
- wstring str4=L"你好么?";
- wstring str44(str4.rbegin(),str4.rend());
- wcout< < "CHN\tws4\t:"< < str4< < tab< < str4[1]
< < tab< < str44< < endl;- wstring str5(str1.begin(),str1.end());
//只有char類型的string時(shí)才可以如此構(gòu)造- wstring str55(str5.rbegin(),str5.rend());
- wcout< < "CHN\tws5\t:"< < str5< < tab< <
str5[1]< < tab< < str55< < endl;- wstring str6(str3.begin(),str3.end());//如此構(gòu)造將失敗!!!!
- wstring str66(str6.rbegin(),str6.rend());
- wcout< < "CHN\tws6\t:"< < str6< < tab< <
str6[1]< < tab< < str66< < endl;- return 0;
- }
以上就是我們對(duì)C++中英文字符串的相關(guān)介紹。
【編輯推薦】