On 02/23/18 19:29, lrnzo via Nordwest wrote:
Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
%< *schnips
Rebooten der Meshroutern bringt hingegen nichts. woran kann das liegen? Ein Hardwarefehler ist sehr unwahrscheinlich, da wir genau dieses Phänomen auch schon hatten, als der Uplink und einer der Meshrouter getauscht war. Kann das an irgendwelche Funkstörungen liegen? Betreibt da jemand eine defekte Mikrowelle, oder sind es am Ende doch Erdstrahlen? Andere WLANs gibt es dort jedenfalls kaum:
Rebooten bringt nix ? Das hört sich sehr komisch an. Hattes du beide Router rebooted?
%< *schnips
Wie gesagt: nirgendwo anders habe ich das bislang gesehen, also vermute ich irgendeinen lokalen Zusammenhang. Oder hattet ihr so etwas schon einmal irgendwo?
mir kommt da gerade so ein Gedanke: könnte es nicht sein, dass es sich hierbei um ein Ereignis handelt, das häufiger auftritt, aber eben meist unbeobachtet bleibt? Könnte es mit dafür verantwortlich sein, dass manchmal Router einfach nicht mehr meshen und könnte die Lösung in vielen solchen Fällen ein einfacher WLANscan wie oben sein? Könnte man hierfür nicht einen kleinen crondog schreiben, der falls #WLAN-Originators plötzlich von n auf 0 geht, nen logread mailt und iwinfo anwirft?
Ich hätte Erstmal auf den ath9k bug getippt. Zumindest hört sich das verhalten so an.
gleiches hab ich am Mainframe beobachtet (leider kann ich dir kein Link schicken da das setup scheinbar offline genommen wurde...).
Konntest du bei den betroffenen Geräten eine hohe load feststellen? Oder einen hohen RAM verbrauch so das der OOM Killer kam?
vg Tarek