通信協(xié)議中的大小端究竟是什么?
在物聯(lián)網(wǎng)應(yīng)用開發(fā)中,從嵌入式工程拿到的通信協(xié)議中經(jīng)常會看到標明大小端模式,那么大小端究竟是什么?
大小端序
在通信協(xié)議中,大小端(Endian)是一個重要的概念,涉及到多字節(jié)數(shù)據(jù)(如整數(shù)、浮點數(shù)等)在內(nèi)存中的存儲方式。大小端序決定了數(shù)據(jù)的高位字節(jié)(Most Significant Byte,MSB)和低位字節(jié)(Least Significant Byte,LSB)在內(nèi)存地址中的排列順序。對于跨平臺通信和數(shù)據(jù)交換至關(guān)重要,因為不同的硬件平臺可能采用不同的字節(jié)序。
- 「大端(Big Endian)」:高位字節(jié)存儲在內(nèi)存的低地址處,低位字節(jié)存儲在內(nèi)存的高地址處。例如,一個16位的整數(shù)0x1234在大端模式下,在內(nèi)存中的表示是0x12 0x34。
- 「小端(Little Endian)」:低位字節(jié)存儲在內(nèi)存的低地址處,高位字節(jié)存儲在內(nèi)存的高地址處。對于同一個16位的整數(shù)0x1234,在小端模式下,在內(nèi)存中的表示是0x34 0x12。
圖片
在通信協(xié)議中,必須明確指定使用哪種字節(jié)序,以確保發(fā)送方和接收方能夠正確地解釋數(shù)據(jù)。否則,如果發(fā)送方使用大端而接收方使用小端(或反之),那么在數(shù)據(jù)傳輸過程中就可能會出現(xiàn)混亂。
一種常見的做法是在通信協(xié)議中明確指定字節(jié)序,無論發(fā)送方和接收方的軟件硬件平臺如何,都可以確保數(shù)據(jù)的正確解釋。也可能需要在通信協(xié)議中添加一些特定的標記或元數(shù)據(jù),來指示數(shù)據(jù)的字節(jié)序,接收方就可以根據(jù)這些標記來動態(tài)地調(diào)整其字節(jié)序解釋方式。
圖片
例如,許多網(wǎng)絡(luò)協(xié)議(如TCP/IP)使用大端序,而x86和x86_64等Intel架構(gòu)則采用小端序。當進行跨平臺通信時,字節(jié)序的不匹配可能會導致問題,通常需要在發(fā)送和接收數(shù)據(jù)時轉(zhuǎn)換字節(jié)序。
在編程中,有時需要編寫特定的代碼來處理字節(jié)序的轉(zhuǎn)換,以確保數(shù)據(jù)的正確解釋。例如,在C語言中,可以使用htonl、ntohl、htons、ntohs等函數(shù)來處理網(wǎng)絡(luò)字節(jié)序和主機字節(jié)序之間的轉(zhuǎn)換。這些函數(shù)名稱中的"h"代表host(主機),"n"代表network(網(wǎng)絡(luò)),"s"代表short(短整型),"l"代表long(長整型)。
端序轉(zhuǎn)換
在Java中,進行端序轉(zhuǎn)換可以直接使用ByteBuffer類。ByteBuffer支持大端序(Big Endian)和小端序(Little Endian),并且可以在運行時動態(tài)地改變字節(jié)序。
對于整數(shù)類型(如int、short等),可以使用ByteBuffer的order()方法來設(shè)置字節(jié)序,然后使用putInt()、getShort()等方法來讀寫數(shù)據(jù)。
import java.nio.ByteBuffer;
import java.nio.ByteOrder;
public class EndianConversion {
public static void main(String[] args) {
int data1 = 0x12345678;
short data2 = 0x1234;
// 使用ByteBuffer進行端序轉(zhuǎn)換
ByteBuffer buffer1 = ByteBuffer.allocate(6); // 分配足夠的空間
ByteBuffer buffer2 = ByteBuffer.allocate(6);
// 設(shè)置為小端序并寫入數(shù)據(jù)
buffer1.order(ByteOrder.LITTLE_ENDIAN);
buffer1.putInt(data1);
buffer2.order(ByteOrder.LITTLE_ENDIAN);
buffer2.putShort(data2);
// 翻轉(zhuǎn)到大端序并讀取數(shù)據(jù)
buffer1.flip(); // 準備從緩沖區(qū)讀取數(shù)據(jù)
buffer1.order(ByteOrder.BIG_ENDIAN);
int bigEndian1 = buffer1.getInt();
buffer2.flip();
buffer2.order(ByteOrder.BIG_ENDIAN);
short bigEndian2 = buffer.getShort();
System.out.println("原int值: " + Integer.toHexString(data1));
System.out.println("大端模式int值: " + Integer.toHexString(bigEndian1));
System.out.println("原short值: " + Integer.toHexString(data2 & 0xFFFF));
System.out.println("大端模式short值: " + Integer.toHexString(bigEndian2 & 0xFFFF));
}
}
對于浮點類型(如float、double),同樣可以使用ByteBuffer進行端序轉(zhuǎn)換。
import java.nio.ByteBuffer;
import java.nio.ByteOrder;
public class FloatEndianConversion {
public static void main(String[] args) {
float data = 123.45f;
// 使用ByteBuffer進行端序轉(zhuǎn)換
ByteBuffer buffer = ByteBuffer.allocate(4); // 分配足夠的空間
// 設(shè)置為小端序并寫入數(shù)據(jù)
buffer.order(ByteOrder.LITTLE_ENDIAN);
buffer.putFloat(data);
// 翻轉(zhuǎn)到大端序并讀取數(shù)據(jù)
buffer.flip(); // 準備從緩沖區(qū)讀取數(shù)據(jù)
buffer.order(ByteOrder.BIG_ENDIAN);
float bigEndian = buffer.getFloat();
System.out.println("原float值: " + data);
System.out.println("大端模式float值: " + bigEndian);
}
}
浮點數(shù)的端序轉(zhuǎn)換,實際上并不需要改變其內(nèi)部位的順序,IEEE 754標準定義了浮點數(shù)的格式,無論在哪個平臺上,只要按照該標準解釋,其值都是一致的。如果需要將浮點數(shù)以字節(jié)的形式存儲或傳輸,并希望接收方以不同的字節(jié)序解釋這些字節(jié),那么就需要使用ByteBuffer進行轉(zhuǎn)換。
在C語言中,對于端序轉(zhuǎn)換,通常使用標準的庫函數(shù),這些函數(shù)允許開發(fā)者在網(wǎng)絡(luò)字節(jié)序(大端序)和主機字節(jié)序之間進行轉(zhuǎn)換。網(wǎng)絡(luò)字節(jié)序是大端序,而主機字節(jié)序則取決于具體的硬件架構(gòu)(可能是大端序或小端序)。
對于16位和32位整數(shù),可以使用htons(host to network short)、ntohs(network to host short)、htonl(host to network long)和ntohl(network to host long)函數(shù)進行轉(zhuǎn)換。
#include <stdio.h>
#include <arpa/inet.h>
int main() {
uint16_t short_host_order = 0x1234;
uint32_t long_host_order = 0x12345678;
// 轉(zhuǎn)換到網(wǎng)絡(luò)字節(jié)序(大端序)
uint16_t short_net_order = htons(short_host_order);
uint32_t long_net_order = htonl(long_host_order);
// 轉(zhuǎn)換回主機字節(jié)序
uint16_t short_back_to_host = ntohs(short_net_order);
uint32_t long_back_to_host = ntohl(long_net_order);
printf("Host order short: %04x\n", short_host_order);
printf("Network order short: %04x\n", short_net_order);
printf("Back to host order short: %04x\n", short_back_to_host);
printf("Host order long: %08x\n", long_host_order);
printf("Network order long: %08x\n", long_net_order);
printf("Back to host order long: %08x\n", long_back_to_host);
return 0;
}
對于浮點數(shù),沒有直接的端序轉(zhuǎn)換函數(shù),因為浮點數(shù)的表示包括指數(shù)和尾數(shù)部分,這些部分在內(nèi)存中的存儲方式復雜。通常,一種解決方案是將浮點數(shù)轉(zhuǎn)換為整數(shù)類型(如uint32_t),然后進行端序轉(zhuǎn)換,再轉(zhuǎn)回浮點數(shù)。
#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>
int main() {
float f = 123.45f;
uint32_t *int_ptr;
uint32_t int_val;
float f_net, f_back;
// 將浮點數(shù)轉(zhuǎn)換為整數(shù)
memcpy(&int_val, &f, sizeof(f));
// 轉(zhuǎn)換到網(wǎng)絡(luò)字節(jié)序
int_val = htonl(int_val);
// 將整數(shù)轉(zhuǎn)換回浮點數(shù)
memcpy(&f_net, &int_val, sizeof(f_net));
// 轉(zhuǎn)換回主機字節(jié)序
int_val = ntohl(int_val);
memcpy(&f_back, &int_val, sizeof(f_back));
printf("Original float: %f\n", f);
printf("Network order float: %f\n", f_net);
printf("Back to host order float: %f\n", f_back);
return 0;
}
示例中默認字節(jié)序是小端序。在實際應(yīng)用中,可以通過__BYTE_ORDER__宏在GCC中檢查字節(jié)序,在需要時才進行端序轉(zhuǎn)換。對于浮點數(shù)的端序轉(zhuǎn)換,需要注意IEEE 754標準對浮點數(shù)表示的影響,以及不同平臺和編譯器可能產(chǎn)生的差異。