iBGP pomiędzy ASR1001-x flapowanie sesji

Problemy związane z routingiem

Moderatorzy: mikrobi, aron, garfield, gangrena, Seba

Wiadomość
Autor
felix
wannabe
wannabe
Posty: 140
Rejestracja: 13 lis 2014, 21:46

iBGP pomiędzy ASR1001-x flapowanie sesji

#1

#1 Post autor: felix »

Cześć

Mam dziwny problem z sesją ibgp pomiędzy dwoma routerami asr1001-x, softy 16.09.08 oba 16GB ram. Jeden router posiada pełny feed z sesji ebgp, drugi robi tylko redystrybucję tras connected i zaciąga pełną tablicę od pierwszego. Wszystko działało pięknie i ładnie przez rok, albo lepiej, aż awaria zasilania w jednej z serwerowni zrestartowała router, który nie ma sesji ebgp. Po restarcie z pierwotną konfiguracją flapuje sesja ibgp, a routery nie otrzymują ogłoszeń prefixów jeżeli jest ich więcej niż 100. W skrócie sprawa wygląda tak, że jeżeli filtrami nie limituje ogłaszanych prefixów, to drugi router ich tak jakby nie otrzymuje, a sesja flapuje co 2-3min. Jeżeli ograniczę ilość rozgłaszanych prefixów pomiędzy routerami, to sesja jest stabilna i routery przyjmują prefixy wpisując je do RIB i FIB. W debug`u widzę, że dany router ogłasza trasy, ale w tym samy czasie na drugim routerze w debug`u cisza - tak jakby update`y do niego nie docierały. W momencie zerwania sesji, jeden z routerów wysyła reset z tytułu hold time expired. Przejrzałem cały konfig 10 razy, usunąłem go, dodałem na nowo, nic nie pomaga. Problem jest zarówno wtedy, gdy z z routera z sesją ebgp próbuję ogłosić pełny feed do drugiego jak również w przypadku, gdy prefixy z tras connected (jest ich kilka tysięcy) są ogłaszane do routera z sesją ebgp. Czarna magia, może ktoś coś podpowie :)

Aha zauważyłem też, że momencie gdy ogłaszam więcej niż 100 prefixów rośnie kolejka w show ip bgp sum:

Neighbor V AS MsgRcvd MsgSent TblVer InQ OutQ Up/Down State/PfxRcd
x.x.x.x 4 asxxx 7 5 20601 0 19 00:02:01 0

lbromirs
CCIE
CCIE
Posty: 4101
Rejestracja: 30 lis 2006, 08:44

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#2

#2 Post autor: lbromirs »

Brzmi to bardzo magicznie.

Sprawdziłbym (jeśli do tej pory problemu nie rozwiązałeś) czy przypadkiem po awarii prądu w którymś z routerów nie poleciała pamięć lub nie pojawiły się inne problemy. Po drugie, rosnąca kolejka OutQ oznacza, że sąsiad nie potwierdza odebrania segmentów, co zapewne oznacza, że się "zapycha" - albo coś niedobrego dzieje się na interfejsach łączących routery, albo w sieci pomiędzy nimi (jakieś dupleksy się źle wyautonegocjowały?). A potem zostaje już tylko krakowski TAC :)

felix
wannabe
wannabe
Posty: 140
Rejestracja: 13 lis 2014, 21:46

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#3

#3 Post autor: felix »

No wygląda to bardzo magicznie i do tej pory nie jestem w stanie tego rozwiązać, bo klient wypiął się na support :)

Brakuje mi już pomysłów, komunikację pomiędzy ASR`ami sprawdziłem na wszystkie znane mi sposoby, razem z ip sla, sprawdzeniem MTU, itd. Nie widzę żadnych nieprawidłowości. Co ciekawe, mam drugi case, gdzie na cisco ASR 1001-x i ASR 1002-x po restarcie prądowym jednego z nich dzieje się dokładnie to samo. Cuda na kiju :)

psles
wannabe
wannabe
Posty: 143
Rejestracja: 04 sie 2011, 06:09
Lokalizacja: Gdynia

Re: iBGP pomiędzy ASR1001-x flapowanie sesji

#4

#4 Post autor: psles »

Sprawdź cef, czy tam nie masz problemu w szczególności miedzy peerami. Kiedyś mi się zdarzyło. Ale dawno o szczegółów sobie nie przypomnę. I to właśnie na ASR100x.
Tylko sugestia. Nie rozwiązanie, ale może pomoże coś znaleźć.
.ılı..ılı.

ODPOWIEDZ