Das Problem lag/liegt bei Seagate - die haben unsinnigste Smartwerte - die zählen die Zugriffe teils als Fehler mit, so dass einschlägig geraten wird, diese speziellen Kenner bei speziell diesen Platten einfach zu ignorieren. Leider stimmt das nicht ganz
Die Kenner zählen schon mögliche Fehler mit, aber eigentlich unsichtbar, man sollte dann bestimmte Bits des Zählers ausmaskieren und würde die richtigen Werte erhalten (nirgendwo richtig dokumentiert) - macht aber nichts, jetzt sind da WDs drin, die zählen wieder anders.
und das war einfach Zufall - auf gut deutsch ging mir das Verhalten vom Forum auf den Sack, nachdem ich alles getauscht hatte, was man an software tauschen kann und das Verhalten mit dem Einfrieren auch die ssh-Verbindungen betraf, brachte schließlich inxi die Bestätigung - das Abfragen der Raids ging schweinelangsam, also die Platte rausgesucht, die mutmaßlich karpott war und um Wechsel gebeten.
Womit ich allerdings nicht im Traum gerechnet hätte: Eine kurze Überprüfung durch Hetzner brachte Probleme in beiden Platten. Diese Werkzeuge hätte ich dann gerne auch
-- nu gut, ich hab die Platte, die mir als unauffällig vorkam als ganz definiert und angewiesen, nur die "kaputtere" Platte zu tauschen - und nachdem der Spiegel ein neues, ganzes Mitglied hatte und in sync war, hab ich die "nicht so kaputte" Platte tauschen lassen - Ein echtes Scheissspiel.
Alles in allem war Murphy kurz davor, mal wieder zuzuschlagen - die eine Platte hatte eine Laufzeit von knapp 850 Tagen, die andere nur 430 Tage, so dass die nicht aus einer Marge stammen sollten, weiss man aber nicht wirklich. Auf jeden Fall gibts jetzt dann auch bei uns asap einen gespiegelten SQL-Server, der Scheiss sichert sich im laufenden Betrieb ansonsten echt räudig - und die reinen Dateien habe ich eh schon immer per rsync auf eine 2. Maschine gepackt. Dooferweise sind halt alle relevanten Bewegungsdaten in SQL - und ein Tag oder ein halber wäre schon ärgerlich, an den Dateien ändert sich fast nie was.