Jump to content

Linux gateway - Unusual latency


dobriloff

Recommended Posts

Здравейте,

 

Сблъсквам се с много странен проблем който се проявява от време на време понякога на 2-3дни друг път на 2-3 месеца  но винаги в работно време , става въпрос за огромен LAG на 1ви хоп на моя рутер, тоест забавянето е между мен и рутера на доставчика, двете машини са свързани с UTP кабел, съответно проблема мисля ,че е в моя рутер. След рестартиране на машината всичко се оправя. Става въпроса за пинг от порядъка на 900ms , обичайно е 

0.1ms което е нормално :) . Постановката е следната: Debian 6 инсталиран на  машина Intel Core -i3 , 4GB RAM , няколко лан карти , десетина VLAN-a , около 300 хоста зад рутера в различни VLANs. Днес проблема пак се случи и в предвид ,че не е работен и активността на потребителите е доста слаба успях да поровя повече време преди пак да прибягна към рестарт. Опитах да сваля един от физическите интерфейси на който са закачени потребителите и съответно ping падна на около 90-100ms , което пак е ненормално но показва ,че явно конекциите имат нещо общо. В connrack таблицата стойността беше в нормален порядък 3000-4000 , в работно време стигаме и до 20000-30000 и нещата са ОК , съответно явно проблема  не е от голям броя конекции. Другото което забелязах беше ,че машината нямаше натоварване както си е обичайно. Трафика по интерфейсите не беше голям.

Вероятно нещо някак си се препълва и при рестарт се зачиства , имате ли някакви идей , при следваща такава случка какво мога да проверя друго или съответно ако някой вече се е сблъсквал с този проблем на какво се дължи?

 

 

Адрес на коментара
Сподели в други сайтове

  • Администратор

Поне едно cacti или obsevium пусни да гледаш за какво иде реч като пакети трафици.

Правил ли си оптимизации на ядро и т.н.

Харесай поста ^^^
acer.gif htc.gifsigpic4024_2.gif

Форумът е за взаимопомощ а не за свършване на чужда работа


ɹɐǝɥ uɐɔ noʎ ǝɹoɯ ǝɥʇ 'ǝɯoɔǝq noʎ ɹǝʇǝınb ǝɥʇ

Адрес на коментара
Сподели в други сайтове

Какви са ти мрежовите карти? Да не са някои Realtek-и? Тунинговани ли са?

В dmesg-а има ли нещо (командата е dmesg)?

Шейпъри имаш ли на машината? Ако да - опита ли да ги спреш да видиш резултата?

Като цяло, дай повече информация от машината.

ethtool -i ethX
ethtool -k ethX
ethtool -g ethX
ethtool -S ethX
Адрес на коментара
Сподели в други сайтове

Ползвам smokeping , от където разбирам и че проблемите се получават само в работно време.
 
Що се отнася до ядрото ползвам това което идва със Debian Squeeze 2.6.32 , като съм сложил пачове за layer7 и imq. Като реално не ползвам imq-то.
Относно параметрите на ядрото , единственото което съм настройвал е:
net.ipv4.ip_forward = 1
net.ipv4.tcp_timestamps = 0
всичко останало съм го оставил по default.
Относно картите ползвам Realtek да :) , не е изключено да има и бъг в модула де , поради тази причина преди време си теглих последния версия от сайта на Realtek, но проблема пак се появи след време.
Относно dmesg , нищо ново след съобщенията които са при boot.
Не правя никакъв шейпинг .
 
Това са резултатите от ethertool в момента когато нещата са ОК. 
 
#ethtool -i eth1
driver: r8169
version: 2.3LK-NAPI
firmware-version:
bus-info: 0000:06:01.0
 
#ethtool -k eth1
Offload parameters for eth1:
rx-checksumming: on
tx-checksumming: off
scatter-gather: off
tcp-segmentation-offload: off
udp-fragmentation-offload: off
generic-segmentation-offload: off
generic-receive-offload: off
large-receive-offload: off
ntuple-filters: off
receive-hashing: off
 
#ethtool -g eth1
Ring parameters for eth1:
Cannot get device ring settings: Operation not supported
 
 
#ethtool -S eth1
NIC statistics:
     tx_packets: 14975429
     rx_packets: 12730616
     tx_errors: 0
     rx_errors: 0
     rx_missed: 0
     align_errors: 0
     tx_single_collisions: 0
     tx_multi_collisions: 0
     unicast: 12709865
     broadcast: 20751
     multicast: 0
     tx_aborted: 0
     tx_underrun: 0
 

 

Адрес на коментара
Сподели в други сайтове

  • Администратор

Пусни един dist-upgrade и не се занимавай със стари бъгове.

Тея реалтеци ги подари на някой и си вземи нещо марково.

Харесай поста ^^^
acer.gif htc.gifsigpic4024_2.gif

Форумът е за взаимопомощ а не за свършване на чужда работа


ɹɐǝɥ uɐɔ noʎ ǝɹoɯ ǝɥʇ 'ǝɯoɔǝq noʎ ɹǝʇǝınb ǝɥʇ

Адрес на коментара
Сподели в други сайтове

Проблемът ти са мрежовите карти. Няма какво да го мислиш.

Вземи си Intel Pro/1000 Server, дори и да са втора употреба.

 

Може и от колегата plameni от форума ( ).

Адрес на коментара
Сподели в други сайтове

  • Администратор

след като сложиш подходящи мрежови карти ... http://itservice-bg.net/?p=1925

Адрес на коментара
Сподели в други сайтове

Благодаря ви за отговорите. Ще видя какво мога да направя по въпроса. Странното е ,че не ми крашва модула на картата съответно дъли проблема реално е в нея , тъй като съм пробвал да спирам модула и да го зареждам на ново и проблема си остава. Имам някакво съмнение ,че проблема изобщо липсваше преди да си сегментирам мрежата съответно на пусна vlans. Що се остана до distupgrade при Debian не ми харесва как минава и в предвид на това ,че става въпрос за Gateway/Router с около 300 потребителя , малко ми е рисково :) имам още няколко устройства с Debian 6 съответно пак със Realtek карти който имат други роли в мрежата с не по-малко натоварване и проблеми никога не е имало от това естество. При марковите карти опита ми е направо трагичен.. преди време трябваше да правя dedicated lan за iSCSI  и бях купил Intel PRO/1000 GT  , HP NC112T в предвид на не високата им цена... няма такива проблеми... накрая ги смених с Realtek . Вероятно при  Intel PRO/1000 MT нещата може да са по-добре макар ,че май ползваше съшия модул като GT модела. Все пак някой има ли идея кое точно може да се чупи при условие ,че модула на лан картата не крашва и съответно не се оправят нещата при презареждане а само при рестарт на машината, както казах и броя на конекциите не е висок

Адрес на коментара
Сподели в други сайтове

  • Администратор

Не модула на лан картата ами процесора и е проблем

може да минеш на по специализирана за целта дистрибуция

относно влан-ове това е работа на суич не на рутера 

Но както писахме по горе сложи един мониторинг да може да се видят 
параметри от машината как играят IRQ примерно

Харесай поста ^^^
acer.gif htc.gifsigpic4024_2.gif

Форумът е за взаимопомощ а не за свършване на чужда работа


ɹɐǝɥ uɐɔ noʎ ǝɹoɯ ǝɥʇ 'ǝɯoɔǝq noʎ ɹǝʇǝınb ǝɥʇ

Адрес на коментара
Сподели в други сайтове

  • 3 weeks later...

Мен много ми прилича този проблем на препълване на Contrack таблицата. Пробвай като видиш пак проблема да напишеш тези 2 команди като root

 

echo 1048320 > /proc/sys/net/nf_conntrack_max
echo 300 > /proc/sys/net/netfilter/nf_conntrack_tcp_timeout_established
 
Ако се оправи на момента ... значи е това - не знам къде се слагат тези стойности в Debian , но ако ги забиеш в rc.local скрипта при зареждане ще са ок.
Адрес на коментара
Сподели в други сайтове

лан кабел до доставчика? в една сграда ли сте?

ако не на какво точно си вързан от другата страна?

Сещам се за поне 10 причини това да се случва и

нито една не е от твоята страна ;)

Адрес на коментара
Сподели в други сайтове

Създайте нов акаунт или се впишете, за да коментирате

За да коментирате, трябва да имате регистрация

Създайте акаунт

Присъединете се към нашата общност. Регистрацията става бързо!

Регистрация на нов акаунт

Вход

Имате акаунт? Впишете се оттук.

Вписване
  • Потребители разглеждащи страницата   0 потребители

    • No registered users viewing this page.
×
×
  • Създай нов...

Important Information

By using this site, you agree to our Terms of Use.