|
| Ups - Raid på vej ned ... Fra : Martin Stender |
Dato : 06-04-06 08:25 |
|
Hej alle
Fik denne her i min mail den anden dag:
"A Fail event had been detected on md device /dev/md2.
Faithfully yours, etc."
Og denne her fra logwatch'en:
WARNING: Kernel Errors Present
end_request: I/O error, dev hde, sector...: 1 Time(s)
hde: dma_intr: error=0x40 { Uncorrect...: 1 Time(s)
hde: dma_intr: status=0x51 { DriveReady SeekComplete Error }...: 1
Time(s)
raid1: hde: unrecoverable I/O read error for block 158511...: 1
Time(s)
Så tilsyneladende er en af diskene i et mirror-raid på vej ned.
Er der nogen som ved hvordan man finde ud af præcis hvilken af de to
diske der er syg?
Og når man ved det, hvordan er proceduren så?
På forhånd tak!
Martin
| |
Jacob Bunk Nielsen (06-04-2006)
| Kommentar Fra : Jacob Bunk Nielsen |
Dato : 06-04-06 08:48 |
|
"Martin Stender" <stenderdk@gmail.com> writes:
> Er der nogen som ved hvordan man finde ud af præcis hvilken af de to
> diske der er syg?
Det skriver den jo til dig. Det er hde.
--
Jacob
| |
Mogens Kjaer (06-04-2006)
| Kommentar Fra : Mogens Kjaer |
Dato : 06-04-06 09:13 |
|
Jacob Bunk Nielsen wrote:
> "Martin Stender" <stenderdk@gmail.com> writes:
>
>
>>Er der nogen som ved hvordan man finde ud af præcis hvilken af de to
>>diske der er syg?
>
>
> Det skriver den jo til dig. Det er hde.
>
For en sikkerheds skyld bør man kigge ind i maskinen og se
om der er aktivitetslamper på diskene. Den disk, der er smidt
af RAID'en, har så ikke aktivitet.
Mogens
--
Mogens Kjaer, Carlsberg A/S, Computer Department
Gamle Carlsberg Vej 10, DK-2500 Valby, Denmark
Phone: +45 33 27 53 25, Fax: +45 33 27 47 08
Email: mk@crc.dk Homepage: http://www.crc.dk
| |
Martin Stender (06-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 06-04-06 12:28 |
|
Tak - jeg kigger ind i den når jeg kommer hjem
Men er det så bare at skifte den, boote op og så sync'er den selv,
eller hvordan?
Igen, på forhånd tak,
Martin
| |
Claus Rasmussen (06-04-2006)
| Kommentar Fra : Claus Rasmussen |
Dato : 06-04-06 13:13 |
|
Martin Stender wrote:
> Men er det så bare at skifte den, boote op og så sync'er den selv,
> eller hvordan?
Først skal du have en kopi af diskens partitionstabel. Den laver du med
sfdisk -d /dev/hde >hde.part
Dernæst skal du have pillet den ud af RAIDet, så maskinen ikke forsøger at
tage den med i RAIDet, når du booter. Hvilken fil, du skal rette i,
afhænger af din linux version. Men prøv med /etc/mdadm.conf
eller /etc/raidtab.
Når det er gjort, kan du skifte disken.
Når maskinen er kommet op igen, skal du have den nye disk partitioneret som
den gamle:
sfdisk /dev/hde <hde.part
Så retter du indstillinger i /etc/mdadm.conf tilbage igen og genstarter
maskinen. Når du er i luften igen, vil du kunne følge synkroniseringen ved
at kigge i file /proc/mdstat .
-Claus
| |
Mogens Kjaer (06-04-2006)
| Kommentar Fra : Mogens Kjaer |
Dato : 06-04-06 13:44 |
|
Claus Rasmussen wrote:
....
> Dernæst skal du have pillet den ud af RAIDet, så maskinen ikke forsøger at
> tage den med i RAIDet, når du booter. Hvilken fil, du skal rette i,
> afhænger af din linux version. Men prøv med /etc/mdadm.conf
> eller /etc/raidtab.
....
Er det ikke mange år siden at man skulle pille i disse konfigurationsfiler?
Normalt bruger man mdadm kommandoen til at fjerne/tilføje partitioner
til raids.
Mogens
--
Mogens Kjaer, Carlsberg A/S, Computer Department
Gamle Carlsberg Vej 10, DK-2500 Valby, Denmark
Phone: +45 33 27 53 25, Fax: +45 33 27 47 08
Email: mk@crc.dk Homepage: http://www.crc.dk
| |
Claus Rasmussen (06-04-2006)
| Kommentar Fra : Claus Rasmussen |
Dato : 06-04-06 14:34 |
|
Mogens Kjaer wrote:
>> /etc/mdadm.conf eller /etc/raidtab.
>
> Er det ikke mange år siden at man skulle pille i disse
> konfigurationsfiler?
>
> Normalt bruger man mdadm kommandoen til at fjerne/tilføje partitioner
> til raids.
SVJV gemmer mdadm ikke mappet mellem RAID UUID og device name mellem
reboot's. Det kan dog også være, at mdadm vil scanne den nye disk for RAID
partitioner; give en warning når den ikke finder nogen; og så ellers
fortsætte med et degraderet RAID bestående af partioner fra den gamle disk,
så man ikke behøves at rette i konfigurationen.
Det er nogen tid siden, jeg har kigget på det, så det kan være, du har ret.
Men det vil kræve lidt eksperimentering at afgøre det.
-Claus
| |
Michael Rasmussen (06-04-2006)
| Kommentar Fra : Michael Rasmussen |
Dato : 06-04-06 19:13 |
|
On Thu, 06 Apr 2006 14:13:29 +0200, Claus Rasmussen wrote:
> Så retter du indstillinger i /etc/mdadm.conf tilbage igen og genstarter
> maskinen. Når du er i luften igen, vil du kunne følge synkroniseringen
> ved at kigge i file /proc/mdstat .
Hvorfor genstart? kan man ikke lave hotadd?
--
Hilsen/Regards
Michael Rasmussen
http://keyserver.veridis.com:11371/pks/lookup?op=get&search=0xE3E80917
| |
Mogens Kjaer (07-04-2006)
| Kommentar Fra : Mogens Kjaer |
Dato : 07-04-06 07:45 |
|
Michael Rasmussen wrote:
....
> Hvorfor genstart? kan man ikke lave hotadd?
Det er ikke sikkert at hardwaren er til hotadd.
Så må man genstarte for ikke at lave flere ulykker.
Mogens
--
Mogens Kjaer, Carlsberg A/S, Computer Department
Gamle Carlsberg Vej 10, DK-2500 Valby, Denmark
Phone: +45 33 27 53 25, Fax: +45 33 27 47 08
Email: mk@crc.dk Homepage: http://www.crc.dk
| |
Martin Stender (07-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 07-04-06 12:16 |
|
Tak for rådene!
Så vil jeg købe en ny disk og se hvordan det går.
Jeg glemete i øvrigt at skrive, at det er en Fedore 3, der kører på
den. Ved ikke om det har nogen betydning.
Jeg har også webmin kørende, og der er et panel til Linux Raid (som
ganske rigtigt også melder, at den ene disk er nede, men at Raid'et
ellers er 'Clean'.
Hilsen
Martin
| |
Martin Stender (08-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 08-04-06 11:30 |
|
Hej igen igen
Nå, det kører ikke ligefrem ...
Jeg fjernede den døde disk og satte en ny i - men så vil den
overhovedet ikke boote. (Den hænger med en besked om at "replace
bootdevice" eller noget i den stil.)
Men den nye disk var selvfølgelig helt ny og uformatteret, så jeg
koblede den raske raid'ede disk fra, bootede fra en ældre FC1 cd og
formatterede den nye. Det gav desværre ikke nogen forskel.
Jeg har fundet ud af, at Fedora 3 ikke længere bruger Raidtools, men
mdadm i stedet. Jeg har så været inde og fjerne den gamle disk fra
raid'et med:
#mdadm /dev/mdo --remove /dev/hde1
#mdadm /dev/md1 --remove /dev/hde2
#mdadm /dev/md2 --remove /dev/hde3
.... i håb om, at den ikke ville forsøge at boote fra begge diske, men
det ændrer ikke noget.
Men systemet kan godt boote med kun den raske disk siddende i.
Siden jeg har raid'et siddende på et PCI-controller kort, så har jeg
i realiteten en IDE plads ledig på selve motherboardet, så jeg kunne
evt. sætte den nye disk på der - midlertidigt - og måske slippe af
sted med at oprette raid-partitioner, sync'e og så bagefter flytte den
over på PCI-controlleren?
Ville det virke?
På forhånd tak
Martin (lettere desperat ...
| |
Kent Friis (08-04-2006)
| Kommentar Fra : Kent Friis |
Dato : 08-04-06 11:41 |
|
Den 8 Apr 2006 03:30:22 -0700 skrev Martin Stender:
> Hej igen igen
>
> Nå, det kører ikke ligefrem ...
>
> Jeg fjernede den døde disk og satte en ny i - men så vil den
> overhovedet ikke boote. (Den hænger med en besked om at "replace
> bootdevice" eller noget i den stil.)
Det lyder som BIOS'en. Det skulle vel ikke være primary master du
har skiftet?
Mvh
Kent
--
Hard work may pay off in the long run, but laziness pays off right now.
| |
Claus Rasmussen (08-04-2006)
| Kommentar Fra : Claus Rasmussen |
Dato : 08-04-06 23:04 |
|
Martin Stender wrote:
> Men systemet kan godt boote med kun den raske disk siddende i.
Der plejer at være en option i BIOS, hvor du kan bestemme hvilken disk,
maskinen skal boote fra. Det lyder som om, der er sat til først at prøve at
boote fra den plads, hvor den syge disk sad, og derefter fra den plads,
hvor den raske disk sidder. Prøv at ændre det til at den skal prøve den
raske disk først.
-Claus
| |
Martin Stender (08-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 08-04-06 13:35 |
|
Hmmm - begge diske er vel primary's - da de jo sidder på hver sin bus
på controller'en.
mvh
Martin
| |
Ukendt (08-04-2006)
| Kommentar Fra : Ukendt |
Dato : 08-04-06 18:11 |
|
Martin Stender skrev:
> Hmmm - begge diske er vel primary's - da de jo sidder på hver sin bus
> på controller'en.
Ikke nødvendigvis... Hvad står der i din bios? og den døde disk, er det
primary master, hvis det er det, så må du få den til at boote fra den
disk der ikke døde.
--
Med venlig hilsen
René Madsen --- Webhotel, PHP/MySQL, 500Mb, 5xPOP3 for kun 9,-/md.
Schultz Consult --- www.schultzconsult.dk/Hosting
Din IT Leverandør --- tlf. 46 95 08 81 / 28 34 36 85
| |
Kent Friis (08-04-2006)
| Kommentar Fra : Kent Friis |
Dato : 08-04-06 18:28 |
|
Den 8 Apr 2006 05:35:22 -0700 skrev Martin Stender:
> Hmmm - begge diske er vel primary's - da de jo sidder på hver sin bus
> på controller'en.
Ok, så siger vi det på en anden måde. Var den disk der døde den der
sad på 0x80?
Mvh
Kent
--
Hard work may pay off in the long run, but laziness pays off right now.
| |
Martin Stender (09-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 09-04-06 16:08 |
|
Tak for rådene!
Det, jeg endte med at gøre, var simpelthen at bytte om på de to IDE
kabler, så den gamle, raske 'hdg' blev opfattet som 'hde'. Så
bootede dyret, og jeg kunne - via webmin - oprette identiske
partitioner og tilføje disse til raid'et.
Det var sikkert noget i den stil, du var inde på, Kent -
tilsyneladende kigger maskinen kun på én af diskene når den booter
....
I følge '# top' kører der nu et par resync-processer....
Mindre vigtigt - kan man se hvor langt resync processen er nået? Nu
ligger den jo skilt ad, og jeg vil jo gerne undgå at tage den ned (for
at samle den), før den er 100% i sync...
Hilsen
Martin
| |
Martin Stender (09-04-2006)
| Kommentar Fra : Martin Stender |
Dato : 09-04-06 16:17 |
|
Hov - det var jo det, som Claus Rasmussen skrev : cat /proc/mdstat ...
sorry
Martin
| |
|
|