提高SDN控制器的拓?fù)浒l(fā)現(xiàn)性能
SDN網(wǎng)絡(luò)的一大特點(diǎn)就是資源由控制器集中管理,控制器管理網(wǎng)絡(luò),最基本的當(dāng)然需要知道網(wǎng)絡(luò)的拓?fù)洌W(wǎng)絡(luò)拓?fù)淇赡軙r(shí)時(shí)發(fā)生變化,所以控制器需要時(shí)時(shí)監(jiān)測(cè),對(duì)于整個(gè)網(wǎng)絡(luò)來說,控制器擔(dān)負(fù)了太多的計(jì)算任務(wù),所以如果能夠幫助控制器減壓,則會(huì)提高整個(gè)網(wǎng)絡(luò)的性能。本篇文章將以ryu控制器為例,首先介紹傳統(tǒng)網(wǎng)絡(luò)和現(xiàn)在SDN網(wǎng)絡(luò)的拓?fù)浒l(fā)現(xiàn)原理,然后介紹改進(jìn)算法,最后講解改寫后的代碼邏輯。
一. LLDP拓?fù)浒l(fā)現(xiàn)原理
傳統(tǒng)網(wǎng)絡(luò)中的鏈路發(fā)現(xiàn)協(xié)議為L(zhǎng)LDP(Link Layer Discovery Protocol),LLDP允許局域網(wǎng)中的結(jié)點(diǎn)告訴其他結(jié)點(diǎn)他自己的capabilities和neighbours。在傳統(tǒng)以太網(wǎng)交換機(jī)中,交換機(jī)從自己的每個(gè)端口發(fā)送LLDP數(shù)據(jù)包,這個(gè)數(shù)據(jù)包不會(huì)被其他交換機(jī)轉(zhuǎn)發(fā),壽命只有一跳,LLDP負(fù)載被封裝在以太網(wǎng)幀中,結(jié)構(gòu)如下圖,其中深灰色的即為L(zhǎng)LDP負(fù)載,Chassis ID TLV, Port ID TLV和Time to live TLV三個(gè)是強(qiáng)制字段,分別代表交換機(jī)標(biāo)識(shí)符(在局域網(wǎng)中是獨(dú)一無二的),端口號(hào)和TTL。這個(gè)數(shù)據(jù)發(fā)出并被鄰居結(jié)點(diǎn)收到之后進(jìn)行解析,就可以知道這條鏈路的源目的交換機(jī)以及源目的接口。
二. ryu拓?fù)浒l(fā)現(xiàn)原理
OpenFlow的官方?jīng)]有規(guī)定標(biāo)準(zhǔn)的拓?fù)浒l(fā)現(xiàn)方法,現(xiàn)在的OFDP(OpenFlow Discovery Protocol)利用的仍然是傳統(tǒng)網(wǎng)絡(luò)中的鏈路發(fā)現(xiàn)協(xié)議LLDP,接下來介紹ryu如何利用LLDP發(fā)現(xiàn)拓?fù)洌僭O(shè)現(xiàn)在有兩個(gè)OpenFlow交換機(jī)連接在控制器上,如下圖,簡(jiǎn)述拓?fù)浒l(fā)現(xiàn)步驟(以S1作為主體,S2的類似):
1. SDN控制器構(gòu)造PacketOut消息向S1的三個(gè)端口分別發(fā)送上圖所示的LLDP數(shù)據(jù)包,其中將Chassis ID TLV和Port ID TLV分別置為S1的dpid和端口號(hào);
2. 控制器向交換機(jī)S1中下發(fā)流表,流表規(guī)則為:將從Controller端口收到的LLDP數(shù)據(jù)包從他的對(duì)應(yīng)端口發(fā)送出去;
3. 控制器向交換機(jī)S2中下發(fā)流表,流表規(guī)則為:將從非Controller接收到LLDP數(shù)據(jù)包發(fā)送給控制器;
4. 控制器通過解析LLDP數(shù)據(jù)包,得到鏈路的源交換機(jī),源接口,通過收到的PacketIn消息知道目的交換機(jī)和目的接口;

現(xiàn)在的ryu發(fā)現(xiàn)拓?fù)涫菍?duì)整個(gè)數(shù)據(jù)平面的所有交換機(jī)的所有端口發(fā)送PacketOut數(shù)據(jù)包,對(duì)于Fattree等網(wǎng)絡(luò)來說,端口的數(shù)量是交換機(jī)數(shù)量的k倍,因此導(dǎo)致了很多資源的消耗,所以是否可以對(duì)這個(gè)拓?fù)浒l(fā)現(xiàn)的機(jī)制進(jìn)行改進(jìn),讓發(fā)送的PacketOut消息和交換機(jī)的數(shù)量相同?
三. 改進(jìn)后的ryu拓?fù)浒l(fā)現(xiàn)機(jī)理
為了實(shí)現(xiàn)上面所提到的改進(jìn)目標(biāo),需要將LLDP負(fù)載中的Port ID TLV進(jìn)行改進(jìn),或者有其他的域和Port ID TLV一一映射也可以,這里提供一種解決辦法,在LLDP數(shù)據(jù)包從交換機(jī)端口轉(zhuǎn)發(fā)出去的時(shí)候,將這個(gè)以太網(wǎng)數(shù)據(jù)包的源MAC地址替換成為這個(gè)端口的MAC地址,而控制器在早先的配置階段已經(jīng)獲得了關(guān)于交換機(jī)的端口的所有信息,所以對(duì)控制器來說,MAC地址和交換機(jī)的端口號(hào)是一一對(duì)應(yīng)的,下面詳細(xì)講述改進(jìn)方案。
1. 更新控制器的LLDP PacketOut消息數(shù)量,由一個(gè)端口一個(gè),改為一個(gè)交換機(jī)一個(gè)PacketOut消息,LLDP數(shù)據(jù)包負(fù)載中的域Port ID TLV值置為零;
2. 控制器向流表下發(fā)一條規(guī)則:所有從端口Controller接收到的LLDP數(shù)據(jù)包,依次將其源MAC地址置為端口MAC地址,然后從相應(yīng)的端口轉(zhuǎn)發(fā)出去;
3. 更新控制器的PacketIn消息處理機(jī)制,根據(jù)LLDP數(shù)據(jù)包的來源,可以得到目的交換機(jī),目的端口,通過解析LLDP數(shù)據(jù)包,得到源MAC和源交換機(jī),通過源MAC地址查找對(duì)應(yīng)的端口號(hào);
4. 由于是修改的代碼,所以不要忘了刪除原來的以端口主導(dǎo)的相關(guān)代碼。
四. 代碼分析
首選需要添加的一些變量和類
* SwitchData類:包含了時(shí)間戳以及交換機(jī)所包含的LLDP數(shù)據(jù)Shell
- class SwitchData(object):
- #store the lldp information
- #send one LLDP information per switch
- def init (self, lldpdata):
- super(SwitchData, self).init()
- self.lldp_data = lldp_data
- self.timestamp = None
- self.sent = 0
- def lldp_sent(self):
- self.timestamp = time.time()
- self.sent += 1
- def lldp_received(self):
- self.sent = 0
- def lldp_dropped(self):
- return self.sent
- def clear_timestamp(self):
- self.timestamp = None
- def __str__(self):
- return 'SwitchData<timestamp=%s, sent=%d>' \
- % (self.timestamp, self.sent)
* SwitchDataState:類似于PortDataState類,繼承自字典,保存從Switch類到SwitchData類的映射,維護(hù)了一個(gè)類似雙向鏈表的數(shù)據(jù)結(jié)構(gòu)Shell
- class SwitchDataState(dict):
- # dict: Switch class -> SwitchData class
- # slimed down version of OrderedDict as python 2.6 doesn't support it.
- _PREV = 0
- _NEXT = 1
- _KEY = 2
- def __init__(self):
- super(SwitchDataState, self).__init__()
- self._root = root = [] # sentinel node
- root[:] = [root, root, None] # [_PREV, _NEXT, _KEY]
- # doubly linked list
- self._map = {}
- def _remove_key(self, key):
- link_prev, link_next, key = self._map.pop(key)
- link_prev[self._NEXT] = link_next
- link_next[self._PREV] = link_prev
- def _append_key(self, key):
- root = self._root
- last = root[self._PREV]
- last[self._NEXT] = root[self._PREV] = self._map[key] = [last, root, key]
- def _prepend_key(self, key):
- root = self._root
- first = root[self._NEXT]
- first[self._PREV] = root[self._NEXT] = self._map[key] = [root, first, key]
- def _move_last_key(self, key):
- self._remove_key(key)
- self._append_key(key)
- def _move_front_key(self, key):
- self._remove_key(key)
- self._prepend_key(key)
- def add_switch(self, dp, lldp_data):
- if dp not in self:
- self._prepend_key(dp)
- self[dp] = SwitchData( lldp_data)
- def lldp_sent(self, dp):
- switch_data = self[dp]
- switch_data.lldp_sent()
- self._move_last_key(dp)
- return switch_data
- def lldp_received(self, dp):
- self[dp].lldp_received()
- def move_front(self, dp):
- switch_data = self.get(dp, None)
- if switch_data is not None:
- switch_data.clear_timestamp()
- self._move_front_key(dp)
- def get_switch(self, dp):
- return self[dp]
- def del_port(self, dp):
- del self[dp]
- self._remove_key(dp)
- def __iter__(self):
- root = self._root
- curr = root[self._NEXT]
- while curr is not root:
- yield curr[self._KEY]
- curr = curr[self._NEXT]
- def clear(self):
- for node in self._map.values():
- del node[:]
- root = self._root
- root[:] = [root, root, None]
- self._map.clear()
- dict.clear(self)
- def items(self):
- 'od.items() ->;gt; list of (key, value) pairs in od'
- return [(key, self[key]) for key in self]
- def iteritems(self):
- 'od.iteritems -> an iterator over the (key, value) pairs in od'
- for k in self:
- yield (k, self[k])
接著簡(jiǎn)述修改的核心代碼,對(duì)應(yīng)上面第三部分提到的四點(diǎn)
1. 更新控制器的LLDP PacketOut消息數(shù)量,由一個(gè)端口一個(gè),改為一個(gè)交換機(jī)一個(gè)PacketOut消息,LLDP數(shù)據(jù)包負(fù)載中的域Port ID TLV值置為零;
- #construct LLDP packet for switch
- def switchadded(self, dp):
- lldpdata = LLDPPacket.lldppacket(
- dp.dp.id, 0, '00:00:00:00:00:00', self.DEFAULTTTL)
- self.switches.addswitch(dp, lldpdata)
2.控制器向流表下發(fā)一條規(guī)則:所有從端口Controller接收到的LLDP數(shù)據(jù)包,依次將其源MAC地址置為端口MAC地址,然后從相應(yīng)的端口轉(zhuǎn)發(fā)出去;
- if dp.ofproto.OFPVERSION>= ofprotov12.OFPVERSION:
- for portinfor in self.portstate[dp.id].values():
- if portinfor.name != "tap:":
- actions.append(dp.ofprotoparser.OFPActionSetField(ethsrc=portinfor.hwaddr))
- actions.append(dp.ofprotoparser.OFPActionOutput(portinfor.portno))
- #actions = [dp.ofprotoparser.OFPActionOutput(self.portstate[dp].portno)]
- out = dp.ofprotoparser.OFPPacketOut(
- datapath=dp, inport=dp.ofproto.OFPP_CONTROLLER,
- bufferid=dp.ofproto.OFPNOBUFFER, actions=actions,
- data=switchdata.lldpdata)
- dp.sendmsg(out)
- else:
- LOG.error('cannot send lldp packet. unsupported version. %x',
- dp.ofproto.OFPVERSION)
3.更新控制器的PacketIn消息處理機(jī)制,根據(jù)LLDP數(shù)據(jù)包的來源,可以得到目的交換機(jī),目的端口,通過解析LLDP數(shù)據(jù)包,得到源MAC和源交換機(jī),通過源MAC地址查找對(duì)應(yīng)的端口號(hào);
- for port in self.portstate[srcdpid].values():
- if port.hwaddr == srcmac:
- srcportno = port.portno
4.由于是修改的代碼,所以不要忘了刪除原來的以端口主導(dǎo)的相關(guān)代碼。完整的代碼見github。
五. 實(shí)驗(yàn)驗(yàn)證
用Mininet建立一個(gè)二層二叉樹,s3作為根節(jié)點(diǎn)分別連接s1和s2。如下圖:
寫個(gè)簡(jiǎn)單的ryu應(yīng)用來調(diào)用拓?fù)浒l(fā)現(xiàn)模塊提供的API接口,應(yīng)用為topo_learner.py,代碼見github用wireshark抓取OpenFlow和LLDP數(shù)據(jù)包來進(jìn)行驗(yàn)證

首先抓取交換機(jī)對(duì)控制器的響應(yīng)消息,查看交換機(jī)的端口以及對(duì)應(yīng)的MAC地址,從解析可以看到這是s3交換機(jī),擁有四個(gè)端口(分別連接控制器,s1,s2,h3),下圖是截取到的一個(gè)LLDP數(shù)據(jù)包,可以看出圖中藍(lán)色背景的LLDP的數(shù)據(jù)包的源MAC地址是s3交換機(jī)的3端口的MAC地址,說明前面的代碼修改成功。
