淺談C++應用程序中創(chuàng)建持久化對象
持久化的對象,是已經(jīng)存儲到數(shù)據(jù)庫或保存到本地硬盤中的對象,我們稱之為持久化對象。下面介紹C++中的持久化對象。
持久對象(persistent objects)廣泛應用于游戲、分布式數(shù)據(jù)庫系統(tǒng)、多媒體以及圖形應用程序中。目前C++并不直接支持持久性(persistence)(但有一些在C++未來版本中添加持久性和反射(reflection)的建議)。
持久對象可以在創(chuàng)建它的程序的作用域之外保持自身狀態(tài)。把對象寫入一個文件并在以后重建之,或者把對象傳送到一臺遠程機器,就是這樣的例子。對持久性的支持并不象***眼看上去那樣簡單,同一對象的大小和內(nèi)存布局在不同的平臺上可能并不相同,而不同的字節(jié)次序(byte ordering),或稱為endian-ness,使事情更加復雜化。
在下文中我將討論如何實現(xiàn)持久性,而無須求助于DCOM和 CORBA之類的第三方框架。對于小型和可移植的應用程序而言,這是一種有效并令人滿意的方案。
序列化(serialization)基礎(chǔ)
為了使一個對象持久存在,必須把它的狀態(tài)保存在非易失的存儲設備中。考慮一個錄制和播放MP3文件的應用程序,每首單曲都表示為一個包含標題、唱片、歌手、時間、速率、錄制日期以及相應的 MP3文件的對象,該應用程序在跟蹤列表中顯示最近播放的曲目。你的目標是通過序列化,也就是把對象寫入一個文件,使MP3對象成為持久對象,同時通過反序列化(deserialization)在下一個 session中重建這些對象。
序列化內(nèi)置數(shù)據(jù)類型
每個對象最終都由內(nèi)置數(shù)據(jù)成員組成,如int, bool, char[]等等。你的***個任務是把這樣的類型寫入一個輸出文件流(ofstream)中。應用程序必須這些值存儲為相應的二進制形式,基于這個目的,應使用write() 和read() 成員函數(shù)。write() 以某個變量的地址和大小為參數(shù),把該變量的位模式寫入一個文件流中。read() 的兩個參數(shù)為char*和long類型,分別指示內(nèi)存緩沖區(qū)的地址和字節(jié)大小。下面的例子演示如何在ofstream中保存兩個整數(shù):
- #include <fstream>
- using namespace std;
- int main()
- {
- int x,y; // mouse coordinates
- // ..assign values to x and y
- ofstream archive("coord.dat", ios::binary);
- archive.write(reinterpret_cast<char *>(&x), sizeof (x));
- archive.write(reinterpret_cast<char *>(&x), sizeof (x));
- archive.close();
- }
使用reinterpret_cast<>是必要的,因為write()的***個參數(shù)類型為const char*,但&x和&y是int*類型。
以下代碼讀取剛才存儲的值:
- #include <fstream>
- using namespace std;
- int main()
- {
- int x,y;
- ifstream archive("coord.dat");
- archive.read((reinterpret_cast<char *>(&x), sizeof(x));
- archive.read((reinterpret_cast<char *>(&y), sizeof(y));
- }
序列化對象
要序列化一個完整的對象,應把每個數(shù)據(jù)成員寫入文件中:
- class MP3_clip
- {
- private:
- std::time_t date;
- std::string name;
- int bitrate;
- bool stereo;
- public:
- void serialize();
- void deserialize();
- //..
- };
- void MP3_clip::serialize()
- {
- int size=name.size();// store name's length
- //empty file if it already exists before writing new data
- ofstream arc("mp3.dat", ios::binary|ios::trunc);
- arc.write(reinterpret_cast<char *>(&date),sizeof(date));
- arc.write(reinterpret_cast<char *>(&size),sizeof(size));
- arc.write(name.c_str(), size+1); // write final '\0' too
- arc.write(reinterpret_cast<char *>(&bitrate),
- sizeof(bitrate));
- arc.write(reinterpret_cast<char *>(&stereo),
- sizeof(stereo));
- }
實現(xiàn)deserialize() 需要一些技巧,因為你需要為字符串分配一個臨時緩沖區(qū)。做法如下:
- void MP3_clip::deserialize()
- {
- ifstream arce("mp3.dat");
- int len=0;
- char *p=0;
- arc.read(reinterpret_cast<char *>(&date), sizeof(date));
- arc.read(reinterpret_cast<char *>(&len), sizeof(len));
- p=new char [len+1]; // allocate temp buffer for name
- arc.read(p, len+1); // copy name to temp, including '\0'
- name=p; // copy temp to data member
- delete[] p;
- arc.read(reinterpret_cast<char *>(&bitrate),
- sizeof(bitrate));
- arc.read(reinterpret_cast<char *>(&stereo),
- sizeof(stereo));
- }
性能優(yōu)化
你可能會感到迷惑,為什么不把整個對象一次性轉(zhuǎn)儲到文件中,而必須對每個數(shù)據(jù)成員進行序列化呢?換句話說,難道不能用下面的方式實現(xiàn)serialize() 嗎?
- void MP3_clip::serialize()
- {
- ofstream arc("mp3.dat", ios::binary|ios::trunc);
- arc.write(reinterpret_cast<char *>(this),sizeof(*this));
- }
不行,不能這樣做。這種方式至少存在兩個問題。通常,當被序列化的對象還包含其它一些對象時,你不能簡單地把該對象轉(zhuǎn)儲到一個文件中并指望以后從中重建一個有效的對象。在我們的例子中,外層對象包含一個std::string成員,一個淺拷貝(shallow copy)操作會把std::string成員歸檔,但其值是時變的,意思是說每次運行程序時都可能改變。
更糟的是,由于std::string事實上并不包含一個字符數(shù)組,而是一個指針,使用淺拷貝試圖重建原始字符串是不可能的。為克服這個問題,程序沒有序列化string對象,而是歸檔其含有的字符和長度。一般來說,指針,數(shù)組和句柄應以相同的方式進行處理。
另一個問題設計到多態(tài)對象。每個多態(tài)對象都含有一個vtpr,即一個指向虛擬函數(shù)地址分配表的隱藏指針。vtpr的值是時變的,如果你把整個多態(tài)對象轉(zhuǎn)儲到一個文件中,然后強行把歸檔后的數(shù)據(jù)添加到一個新的對象上,則其vptr可能無效并導致未定義的行為。再次提醒,解決方案是只對非時變的數(shù)據(jù)成員進行序列化和反序列化。另一種方法是計算vptr的確切偏移量,在從文件重建對象時不要動它。記住,vptr的位置是與實現(xiàn)相關(guān)的,因此這樣的代碼是不可移植的。
小結(jié)
雖然C++不直接支持對象持久性,但手工實現(xiàn)它并不難,只要你遵從一些基本的準則:首先把每個復合對象分解為原始數(shù)據(jù)類型,然后對這些原始數(shù)據(jù)類型進行序列化。當序列化數(shù)據(jù)時,記住要跳過時變的值。在反序列化過程中,讀取剛才存儲的值。處理string對象、數(shù)組和句柄需要一些技巧:總是要對它們解引用,存儲它們所指向的值。記住在一個單獨的字段中存儲string或數(shù)組的大小。
希望通過以上內(nèi)容的介紹,能夠給你帶來幫助。