iBGP pomiędzy ASR1001-x flapowanie sesji

Problemy związane z routingiem

Moderatorzy: mikrobi, aron, garfield, gangrena, Seba

Wiadomość
Autor
felix
wannabe
wannabe
Posty: 142
Rejestracja: 13 lis 2014, 21:46

iBGP pomiędzy ASR1001-x flapowanie sesji

#1

#1 Post autor: felix »

Cześć

Mam dziwny problem z sesją ibgp pomiędzy dwoma routerami asr1001-x, softy 16.09.08 oba 16GB ram. Jeden router posiada pełny feed z sesji ebgp, drugi robi tylko redystrybucję tras connected i zaciąga pełną tablicę od pierwszego. Wszystko działało pięknie i ładnie przez rok, albo lepiej, aż awaria zasilania w jednej z serwerowni zrestartowała router, który nie ma sesji ebgp. Po restarcie z pierwotną konfiguracją flapuje sesja ibgp, a routery nie otrzymują ogłoszeń prefixów jeżeli jest ich więcej niż 100. W skrócie sprawa wygląda tak, że jeżeli filtrami nie limituje ogłaszanych prefixów, to drugi router ich tak jakby nie otrzymuje, a sesja flapuje co 2-3min. Jeżeli ograniczę ilość rozgłaszanych prefixów pomiędzy routerami, to sesja jest stabilna i routery przyjmują prefixy wpisując je do RIB i FIB. W debug`u widzę, że dany router ogłasza trasy, ale w tym samy czasie na drugim routerze w debug`u cisza - tak jakby update`y do niego nie docierały. W momencie zerwania sesji, jeden z routerów wysyła reset z tytułu hold time expired. Przejrzałem cały konfig 10 razy, usunąłem go, dodałem na nowo, nic nie pomaga. Problem jest zarówno wtedy, gdy z z routera z sesją ebgp próbuję ogłosić pełny feed do drugiego jak również w przypadku, gdy prefixy z tras connected (jest ich kilka tysięcy) są ogłaszane do routera z sesją ebgp. Czarna magia, może ktoś coś podpowie :)

Aha zauważyłem też, że momencie gdy ogłaszam więcej niż 100 prefixów rośnie kolejka w show ip bgp sum:

Neighbor V AS MsgRcvd MsgSent TblVer InQ OutQ Up/Down State/PfxRcd
x.x.x.x 4 asxxx 7 5 20601 0 19 00:02:01 0

lbromirs
CCIE
CCIE
Posty: 4101
Rejestracja: 30 lis 2006, 08:44

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#2

#2 Post autor: lbromirs »

Brzmi to bardzo magicznie.

Sprawdziłbym (jeśli do tej pory problemu nie rozwiązałeś) czy przypadkiem po awarii prądu w którymś z routerów nie poleciała pamięć lub nie pojawiły się inne problemy. Po drugie, rosnąca kolejka OutQ oznacza, że sąsiad nie potwierdza odebrania segmentów, co zapewne oznacza, że się "zapycha" - albo coś niedobrego dzieje się na interfejsach łączących routery, albo w sieci pomiędzy nimi (jakieś dupleksy się źle wyautonegocjowały?). A potem zostaje już tylko krakowski TAC :)

felix
wannabe
wannabe
Posty: 142
Rejestracja: 13 lis 2014, 21:46

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#3

#3 Post autor: felix »

No wygląda to bardzo magicznie i do tej pory nie jestem w stanie tego rozwiązać, bo klient wypiął się na support :)

Brakuje mi już pomysłów, komunikację pomiędzy ASR`ami sprawdziłem na wszystkie znane mi sposoby, razem z ip sla, sprawdzeniem MTU, itd. Nie widzę żadnych nieprawidłowości. Co ciekawe, mam drugi case, gdzie na cisco ASR 1001-x i ASR 1002-x po restarcie prądowym jednego z nich dzieje się dokładnie to samo. Cuda na kiju :)

psles
wannabe
wannabe
Posty: 143
Rejestracja: 04 sie 2011, 06:09
Lokalizacja: Gdynia

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#4

#4 Post autor: psles »

Sprawdź cef, czy tam nie masz problemu w szczególności miedzy peerami. Kiedyś mi się zdarzyło. Ale dawno o szczegółów sobie nie przypomnę. I to właśnie na ASR100x.
Tylko sugestia. Nie rozwiązanie, ale może pomoże coś znaleźć.
.ılı..ılı.

felix
wannabe
wannabe
Posty: 142
Rejestracja: 13 lis 2014, 21:46

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#5

#5 Post autor: felix »

Sprawa okazała się śmiesznie prosta, a spędziłem nad tym naprawdę sporo czasu. Trzeba było iść w pierwszy trop, który podpowiadała intuicja. Dopiero jak problem pojawił się w drugim miejscu, to zacząłem szukać wspólnych mianowników. Były nimi przełączniki huawei, które pomimo prawidłowo ustawionego MTU nie pozwalały przesyłać wszystkich pakietów dłuższych niż 1500bajtów. ICMP tak, część TCP tak, ale pakiety BGP były dropowane jeżeli miały więcej niż 1500bajtów. Magia. Obniżone MTU na ASR i temat zgłoszony do producenta switchy.

ODPOWIEDZ