Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] ce:fd:bd:12:64:42 3.260s (203) fa:ad:7f:44:5d:fa [ ibss0] ce:fd:bd:12:64:42 3.260s (206) c6:96:65:cc:4a:da [ ibss0] * ce:fd:bd:12:64:42 3.260s (244) ce:fd:bd:12:64:42 [ ibss0] fa:ad:7f:44:5d:fa 2.530s (209) c6:96:65:cc:4a:da [ ibss0] fa:ad:7f:44:5d:fa 2.530s (205) ce:fd:bd:12:64:42 [ ibss0] * fa:ad:7f:44:5d:fa 2.530s (255) fa:ad:7f:44:5d:fa [ ibss0] c6:96:65:cc:4a:da 0.850s (194) ce:fd:bd:12:64:42 [ ibss0] c6:96:65:cc:4a:da 0.850s (218) fa:ad:7f:44:5d:fa [ ibss0] * c6:96:65:cc:4a:da 0.850s (240) c6:96:65:cc:4a:da [ ibss0] * ce:fd:bd:12:64:43 2.560s (238) ce:fd:bd:12:64:42 [ ibss0] * fa:ad:7f:44:5d:fb 1.940s (255) fa:ad:7f:44:5d:fa [ ibss0] * c6:96:65:cc:4a:db 2.570s (242) c6:96:65:cc:4a:da [ ibss0]
Rebooten der Meshroutern bringt hingegen nichts. woran kann das liegen? Ein Hardwarefehler ist sehr unwahrscheinlich, da wir genau dieses Phänomen auch schon hatten, als der Uplink und einer der Meshrouter getauscht war. Kann das an irgendwelche Funkstörungen liegen? Betreibt da jemand eine defekte Mikrowelle, oder sind es am Ende doch Erdstrahlen? Andere WLANs gibt es dort jedenfalls kaum:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# iwinfo radio0 scan | grep -B1 Channel ESSID: "mesh.ffnw" Mode: Ad-Hoc Channel: 6 -- ESSID: "nordwest.freifunk.net" Mode: Master Channel: 6 -- ESSID: "nordwest.freifunk.net" Mode: Master Channel: 6 -- ESSID: "nordwest.freifunk.net" Mode: Master Channel: 6 -- ESSID: "WLAN-821154" Mode: Master Channel: 6 -- ESSID: "Home2011G" Mode: Master Channel: 1 -- ESSID: "WLAN-821154" Mode: Master Channel: 6 -- ESSID: "FRITZ!Box Fon WLAN 7360" Mode: Master Channel: 11
Wie gesagt: nirgendwo anders habe ich das bislang gesehen, also vermute ich irgendeinen lokalen Zusammenhang. Oder hattet ihr so etwas schon einmal irgendwo?
mir kommt da gerade so ein Gedanke: könnte es nicht sein, dass es sich hierbei um ein Ereignis handelt, das häufiger auftritt, aber eben meist unbeobachtet bleibt? Könnte es mit dafür verantwortlich sein, dass manchmal Router einfach nicht mehr meshen und könnte die Lösung in vielen solchen Fällen ein einfacher WLANscan wie oben sein? Könnte man hierfür nicht einen kleinen crondog schreiben, der falls #WLAN-Originators plötzlich von n auf 0 geht, nen logread mailt und iwinfo anwirft?
On 02/23/18 19:29, lrnzo via Nordwest wrote:
Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
%< *schnips
Rebooten der Meshroutern bringt hingegen nichts. woran kann das liegen? Ein Hardwarefehler ist sehr unwahrscheinlich, da wir genau dieses Phänomen auch schon hatten, als der Uplink und einer der Meshrouter getauscht war. Kann das an irgendwelche Funkstörungen liegen? Betreibt da jemand eine defekte Mikrowelle, oder sind es am Ende doch Erdstrahlen? Andere WLANs gibt es dort jedenfalls kaum:
Rebooten bringt nix ? Das hört sich sehr komisch an. Hattes du beide Router rebooted?
%< *schnips
Wie gesagt: nirgendwo anders habe ich das bislang gesehen, also vermute ich irgendeinen lokalen Zusammenhang. Oder hattet ihr so etwas schon einmal irgendwo?
mir kommt da gerade so ein Gedanke: könnte es nicht sein, dass es sich hierbei um ein Ereignis handelt, das häufiger auftritt, aber eben meist unbeobachtet bleibt? Könnte es mit dafür verantwortlich sein, dass manchmal Router einfach nicht mehr meshen und könnte die Lösung in vielen solchen Fällen ein einfacher WLANscan wie oben sein? Könnte man hierfür nicht einen kleinen crondog schreiben, der falls #WLAN-Originators plötzlich von n auf 0 geht, nen logread mailt und iwinfo anwirft?
Ich hätte Erstmal auf den ath9k bug getippt. Zumindest hört sich das verhalten so an.
gleiches hab ich am Mainframe beobachtet (leider kann ich dir kein Link schicken da das setup scheinbar offline genommen wurde...).
Konntest du bei den betroffenen Geräten eine hohe load feststellen? Oder einen hohen RAM verbrauch so das der OOM Killer kam?
vg Tarek
Hallo,
dies Problem habe ich schon länger, mit einem TP-Link CPE210 v1.0. Gefühlt kam es in der vorletzten Version selten, in der letzten Version schon mal häfiger vor, allerdings in der aktuellen Version ist kaum noch Betrieb möglich (20% Betrieb, 80% ausser Betrieb). Der Router hört nicht nur auf zu meshen, sondern schaltet das Wifi fast komplett ab, also auch kein Client connect. Die Mesh-Verbindungen gehen auf ein Minimum zurück, Linkqualität zwischen 2 und 6%, dabei werden die Verbindungen in rot auf der Map gezeigt. Die Load ist im Betrieb um die 0.3, beim Fehler unter 0.1.
Durch den Befehl "iwinfo radio0 scan" funktioniert wieder alles, vielen Dank für diesen workaround. Habe jetzt einen cronjob angelegt (* */1 * * * iwinfo radio0 scan), mal sehen wie sich das auswirkt. Router läuft jetzt seid ca. vier Stunden fehlerfrei, werde berichten, wie es Morgen aussieht. Schönen Abend, wope
Am 02.03.2018 um 02:57 schrieb Jan-Tarek Butt via Nordwest:
On 02/23/18 19:29, lrnzo via Nordwest wrote:
Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
Hallo,
der cronjob hat wohl seinen Dienst getan, seit über 24h keine Ausfälle mehr. Also vielen Dank für den Tip, lrnzo! Gruß, wope
Am 17.03.2018 um 22:49 schrieb wope via Nordwest:
Hallo,
dies Problem habe ich schon länger, mit einem TP-Link CPE210 v1.0. Gefühlt kam es in der vorletzten Version selten, in der letzten Version schon mal häfiger vor, allerdings in der aktuellen Version ist kaum noch Betrieb möglich (20% Betrieb, 80% ausser Betrieb). Der Router hört nicht nur auf zu meshen, sondern schaltet das Wifi fast komplett ab, also auch kein Client connect. Die Mesh-Verbindungen gehen auf ein Minimum zurück, Linkqualität zwischen 2 und 6%, dabei werden die Verbindungen in rot auf der Map gezeigt. Die Load ist im Betrieb um die 0.3, beim Fehler unter 0.1.
Durch den Befehl "iwinfo radio0 scan" funktioniert wieder alles, vielen Dank für diesen workaround. Habe jetzt einen cronjob angelegt (* */1 * * * iwinfo radio0 scan), mal sehen wie sich das auswirkt. Router läuft jetzt seid ca. vier Stunden fehlerfrei, werde berichten, wie es Morgen aussieht. Schönen Abend, wope
Am 02.03.2018 um 02:57 schrieb Jan-Tarek Butt via Nordwest:
On 02/23/18 19:29, lrnzo via Nordwest wrote:
Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
.
Freut mich einerseits, andererseits nehmen solche würgarounds natürlich auch den Leidensdruck und damit die Motivation, das Problem zu lösen ... egal. muss ja irgendwie weitergehen.
Am 18.03.2018 um 22:14 schrieb wope via Nordwest:
Hallo,
der cronjob hat wohl seinen Dienst getan, seit über 24h keine Ausfälle mehr. Also vielen Dank für den Tip, lrnzo! Gruß, wope
Am 17.03.2018 um 22:49 schrieb wope via Nordwest:
Hallo,
dies Problem habe ich schon länger, mit einem TP-Link CPE210 v1.0. Gefühlt kam es in der vorletzten Version selten, in der letzten Version schon mal häfiger vor, allerdings in der aktuellen Version ist kaum noch Betrieb möglich (20% Betrieb, 80% ausser Betrieb). Der Router hört nicht nur auf zu meshen, sondern schaltet das Wifi fast komplett ab, also auch kein Client connect. Die Mesh-Verbindungen gehen auf ein Minimum zurück, Linkqualität zwischen 2 und 6%, dabei werden die Verbindungen in rot auf der Map gezeigt. Die Load ist im Betrieb um die 0.3, beim Fehler unter 0.1.
Durch den Befehl "iwinfo radio0 scan" funktioniert wieder alles, vielen Dank für diesen workaround. Habe jetzt einen cronjob angelegt (* */1 * * * iwinfo radio0 scan), mal sehen wie sich das auswirkt. Router läuft jetzt seid ca. vier Stunden fehlerfrei, werde berichten, wie es Morgen aussieht. Schönen Abend, wope
Am 02.03.2018 um 02:57 schrieb Jan-Tarek Butt via Nordwest:
On 02/23/18 19:29, lrnzo via Nordwest wrote:
Hallo Leute,
folgendes Problem konnte ich bisher nur dort [1] beobachten: Von Zeit zu Zeit (habe noch keine Regelmäßigkeit feststellen können) hören die Router einfach auf zu meshen:
root@FF-Bad-Iburg-Dornkampshaus-Uplink:~# batctl o | grep -v vpn [B.A.T.M.A.N. adv 2017.2, MainIF/MAC: primary0/ea:b6:2d:3f:25:a3 (bat0/f4:f2:6d:52:72:30 BATMAN_IV)] Originator last-seen (#/255) Nexthop [outgoingIF] root@FF-Bad-Iburg-Dornkampshaus-Uplink:~#
Abhilfe schafft bisher stets zuverlässig, sich einfach die WLANs mit "iwinfo radio0 scan" anzugucken. Wenige Sekunden später sind die WLAN-Meshnachbarn wieder da:
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
.
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
On 03/19/18 14:21, lrnzo via Nordwest wrote:
Freut mich einerseits, andererseits nehmen solche würgarounds natürlich auch den Leidensdruck und damit die Motivation, das Problem zu lösen ... egal. muss ja irgendwie weitergehen.
Das von wope beschriebene Problem weiß identische Verhaltensweisen zum Ath9k bug auf. Dieser könnte jetzt natürlich wieder verstärkt auftreten aufgrund der parallel fahrenden mesh Interfaces ibss und 11s. Mit dem Folge update wo dann nur auf 11s umgestellt wird, würde ich mich gerne nochmal über ein Feedback freuen.
Schöne Grüße Tarek
Hallo Tarek,
jetzt, zwei Tage nach dem neuen Update (20180403) kann ich sagen, dass mein CPE210 v1.0 (loy-wope8) fast keine Probleme mehr hat. Es gibt keinen Totalausfall mehr (alle WLAN Links auf ca. 5% runter). Es gibt allerdings sporadisch noch Abfälle einzelner Links bis auf ca 40-50%. Das verschwindet aber wieder von alleine. Alles in Allem also ein großer Erfolg für die neue Firmware. Ach ja, der workaround mit dem cronjob hat das update überstanden, er war also nach dem Update noch vorhanden und ich habe ihn wieder entfernt.
Gruß, wope
Am 19.03.2018 um 16:01 schrieb Jan-Tarek Butt via Nordwest:
On 03/19/18 14:21, lrnzo via Nordwest wrote:
Freut mich einerseits, andererseits nehmen solche würgarounds natürlich auch den Leidensdruck und damit die Motivation, das Problem zu lösen ... egal. muss ja irgendwie weitergehen.
Das von wope beschriebene Problem weiß identische Verhaltensweisen zum Ath9k bug auf. Dieser könnte jetzt natürlich wieder verstärkt auftreten aufgrund der parallel fahrenden mesh Interfaces ibss und 11s. Mit dem Folge update wo dann nur auf 11s umgestellt wird, würde ich mich gerne nochmal über ein Feedback freuen.
Schöne Grüße Tarek
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
Hi wope,
On 04/09/18 18:30, wope via Nordwest wrote:
Hallo Tarek,
jetzt, zwei Tage nach dem neuen Update (20180403) kann ich sagen, dass mein CPE210 v1.0 (loy-wope8) fast keine Probleme mehr hat. Es gibt keinen Totalausfall mehr (alle WLAN Links auf ca. 5% runter). Es gibt allerdings sporadisch noch Abfälle einzelner Links bis auf ca 40-50%. Das verschwindet aber wieder von alleine. Alles in Allem also ein großer Erfolg für die neue Firmware. Ach ja, der workaround mit dem cronjob hat das update überstanden, er war also nach dem Update noch vorhanden und ich habe ihn wieder entfernt.
Das Feadback freut mich sehr. Das sinken auf 40-50% kann ich dir allerdings gerade nicht erklären. Wo stellst du das abfallen der link Qualität fest?
vg Tarek
Auf der ffnw-map unter "Links" steht die Qualität und in der map selbst wird der Link dann braun. Das passiert aber nicht so häufig und es ist meistens nur ein Link, der dann nach fünf Minuten wieder grün ist. Eine Erklärung war mir auch nicht wichtig, sondern nur ein Hinweis für dich! Wichtig ist mir nur das ich nicht immer einen Reset oder eben anders eingreifen muss (cronjob). Ich weiss auch nicht, wie ausagekräftig die Karte ist, aber das kannst du besser beurteilen. Erst mal vielen Dank und noch einen schönen Abend.
Gruß, wope
Am 10.04.2018 um 00:06 schrieb Jan-Tarek Butt via Nordwest:
Hi wope,
On 04/09/18 18:30, wope via Nordwest wrote:
Hallo Tarek,
jetzt, zwei Tage nach dem neuen Update (20180403) kann ich sagen, dass mein CPE210 v1.0 (loy-wope8) fast keine Probleme mehr hat. Es gibt keinen Totalausfall mehr (alle WLAN Links auf ca. 5% runter). Es gibt allerdings sporadisch noch Abfälle einzelner Links bis auf ca 40-50%. Das verschwindet aber wieder von alleine. Alles in Allem also ein großer Erfolg für die neue Firmware. Ach ja, der workaround mit dem cronjob hat das update überstanden, er war also nach dem Update noch vorhanden und ich habe ihn wieder entfernt.
Das Feadback freut mich sehr. Das sinken auf 40-50% kann ich dir allerdings gerade nicht erklären. Wo stellst du das abfallen der link Qualität fest?
vg Tarek
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
die map ist zu langsam um damit vernünftige Aussagen zum Echtzeitverhalten machen zu können. Wenn du selber ipv6 hast (zB im FF-Netz) und auf die oberste ipv6-addresse eines Routers klickst, kommst du ja auf dessen statuspage. Dort siehst du das Echtzeitverhalten.
LG Lorenz
Am 10.04.2018 um 18:15 schrieb wope via Nordwest:
Auf der ffnw-map unter "Links" steht die Qualität und in der map selbst wird der Link dann braun. Das passiert aber nicht so häufig und es ist meistens nur ein Link, der dann nach fünf Minuten wieder grün ist. Eine Erklärung war mir auch nicht wichtig, sondern nur ein Hinweis für dich! Wichtig ist mir nur das ich nicht immer einen Reset oder eben anders eingreifen muss (cronjob). Ich weiss auch nicht, wie ausagekräftig die Karte ist, aber das kannst du besser beurteilen. Erst mal vielen Dank und noch einen schönen Abend.
Gruß, wope
Am 10.04.2018 um 00:06 schrieb Jan-Tarek Butt via Nordwest:
Hi wope,
On 04/09/18 18:30, wope via Nordwest wrote:
Hallo Tarek,
jetzt, zwei Tage nach dem neuen Update (20180403) kann ich sagen, dass mein CPE210 v1.0 (loy-wope8) fast keine Probleme mehr hat. Es gibt keinen Totalausfall mehr (alle WLAN Links auf ca. 5% runter). Es gibt allerdings sporadisch noch Abfälle einzelner Links bis auf ca 40-50%. Das verschwindet aber wieder von alleine. Alles in Allem also ein großer Erfolg für die neue Firmware. Ach ja, der workaround mit dem cronjob hat das update überstanden, er war also nach dem Update noch vorhanden und ich habe ihn wieder entfernt.
Das Feadback freut mich sehr. Das sinken auf 40-50% kann ich dir allerdings gerade nicht erklären. Wo stellst du das abfallen der link Qualität fest?
vg Tarek
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de
Nordwest mailing list -- nordwest@lists.ffnw.de To unsubscribe send an email to nordwest-leave@lists.ffnw.de