/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Hvad betyder det her? Er min disk død?
Fra : Esben von Buchwald


Dato : 12-02-10 00:49

Her til formiddag havde jeg opdateret min Ubuntu server og den fortalte
mig at det var en god ide at reboote, så det gjorde jeg - og efter det,
kom den ikke op igen...

Da jeg kom hjem tog jeg den ud af skabet og satte en skærm til - og
kunne se at linux stopper under boot og checker mine diske, og herefter
brokker den sig over fejl på en af diskene, og jeg skal trykke CTRL-D
for at den booter videre op (og aktiverer netværk osv)

Anyway, så kører jeg en fsck på /dev/sc1 og får en ordentlig bunke fejl
tilbage (1)


Jeg googlede så på fejlen og kunne se at nogen anbefalede mig at checke
at fstab stemmer overens med partitionstabellen
http://www.linuxquestions.org/questions/mandriva-30/fsck.ext3-attempt-to-read-block-from-filesystem-trouble-379551/

- nederst har jeg kopieret info fra fdisk, blkid og fstab ind (2) - og
jeg synes det ser fint ud for /dev/sdc1 umiddelbart...

Efter jeg havde kørt en fsck og trykket ja til det hele, var der ikke
mere brok fra serveren.....

Jeg kunne se i dmesg at der stod noget ala (3), første gang jeg bootede
den - men efter en reboot hvor filsystemet var blevet fixet, var der
ingen brok....

Mit spørgsmål: Er disken ved at stå af? Den er under 1½ år gammel og er
ikke blevt brugt ret meget - eller er der bare sket en uheldig fejl i
mit filsystem? Jeg ved ikke helt om fejlene nævnt i (1) betyder fysiske
bad sectors eller bare at der er rod i filsystemet?

På forhånd tak,
mvh: Esben


1: output af $ sudo fsck -C /dev/sdc1
------------------------------------------------------------------------
Error reading block 204537977 (Attempt to read block from filesystem
resulted in short read) while getting next inode from scan. Ignore
error<y>? yes

Force rewrite<y>? yes

Error reading block 209289218 (Attempt to read block from filesystem
resulted in short read) while getting next inode from scan. Ignore
error<y>? yes

Force rewrite<y>? yes
------------------------------------------------------------------------



2: fdisk -l, blkid og fstab
------------------------------------------------------------------------
Disk /dev/sdc: 1000.2 GB, 1000204886016 bytes
255 heads, 63 sectors/track, 121601 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Disk identifier: 0x12971b99

Device Boot Start End Blocks Id System
/dev/sdc1 1 121601 976760001 83 Linux




/dev/sda1: UUID="a3e56b9f-aee1-46ea-a458-99bbc926d45f" TYPE="reiserfs"
/dev/sdb1: UUID="a371a89f-d439-4e83-a23e-8b5ae5abe0ca" TYPE="reiserfs"
/dev/sda2: TYPE="swap" UUID="65e50253-5b06-4099-8092-ac78aaa919a7"
/dev/sdc1: UUID="25fe5d9f-6bf1-4ed1-8858-71de19be86c7" SEC_TYPE="ext2"
TYPE="ext3"
/dev/sdd1: UUID="6540aab6-1be0-4ef1-9e2c-230545803970" TYPE="reiserfs"




# /etc/fstab: static file system information.
#
# <file system> <mount point> <type> <options> <dump> <pass>
proc /proc proc defaults 0 0


#/dev/sda1:
UUID=a3e56b9f-aee1-46ea-a458-99bbc926d45f / reiserfs
notail 0 1

#/dev/sda2:
UUID=65e50253-5b06-4099-8092-ac78aaa919a7 none swap sw
0 0

/dev/hdc /media/cdrom0 udf,iso9660 user,noauto 0 0

#/dev/sda1
UUID=a371a89f-d439-4e83-a23e-8b5ae5abe0ca /mnt/bigdisk reiserfs
defaults 0 2

#/dev/sda1
#UUID=d2140921-0d06-4d44-a02c-43d3fa6c2b50 /mnt/maxtor120 reiserfs
defaults 0 2

#/dev/sdc1 ## sdd1 hedder den nu
UUID=6540aab6-1be0-4ef1-9e2c-230545803970 /mnt/maxtor300 reiserfs
defaults 0 2

#/dev/sdb1
#UUID=dd89280e-f2e9-4c36-992f-989dc304f521 /mnt/maxtor80 reiserfs
defaults 0 2

#/dev/sdc1
UUID=25fe5d9f-6bf1-4ed1-8858-71de19be86c7 /mnt/wd1000 ext3
defaults,relatime 0 2



3: uddrag fra dmesg
------------------------------------------------------------------------
[ 1587.087439] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 1587.087495] ata3.00: BMDMA stat 0x4
[ 1587.087547] ata3.00: cmd 25/00:00:0f:03:88/00:01:61:00:00/e0 tag 0
dma 131072 in
[ 1587.087548] res 51/40:00:0c:04:88/40:00:61:00:00/e0 Emask
0x9 (media error)
[ 1587.087675] ata3.00: status: { DRDY ERR }
[ 1587.087724] ata3.00: error: { UNC }
------------------------------------------------------------------------


 
 
Thorbjørn Ravn Ander~ (12-02-2010)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 12-02-10 01:00

Esben von Buchwald skrev:

> [ 1587.087439] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
> [ 1587.087495] ata3.00: BMDMA stat 0x4
> [ 1587.087547] ata3.00: cmd 25/00:00:0f:03:88/00:01:61:00:00/e0 tag 0
> dma 131072 in
> [ 1587.087548] res 51/40:00:0c:04:88/40:00:61:00:00/e0 Emask
> 0x9 (media error)
> [ 1587.087675] ata3.00: status: { DRDY ERR }
> [ 1587.087724] ata3.00: error: { UNC }

Det ser rigtigt skidt ud. ("media error")

Har fabrikanten et testværktøj du kan hente og køre?

(og er din sikkerhedskopi ajour?)

--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Frank Damgaard (12-02-2010)
Kommentar
Fra : Frank Damgaard


Dato : 12-02-10 12:47

Esben von Buchwald wrote:
> Her til formiddag havde jeg opdateret min Ubuntu server og den fortalte
> mig at det var en god ide at reboote, så det gjorde jeg - og efter det,
> kom den ikke op igen...
>
> Da jeg kom hjem tog jeg den ud af skabet og satte en skærm til - og
> kunne se at linux stopper under boot og checker mine diske, og herefter
> brokker den sig over fejl på en af diskene, og jeg skal trykke CTRL-D
> for at den booter videre op (og aktiverer netværk osv)
>
> Anyway, så kører jeg en fsck på /dev/sc1 og får en ordentlig bunke fejl
> tilbage (1)

Du burde først køre smartctrl og efterfølgende badblock på disken
hvis du mistænker defekt på disk.

smartctl -a /dev/sdc # for disk /dev/sdc

evt. først en "smartctl -s on /dev/xxx" hvis smartctl er slået fra på disken.

giver smartctl ikke nogen info, kan du prøve en læsetest med badblocks
og så evt. også efterfølgende køre smartctrl.



PS.
det kan også være du har fejl på kabler eller lignende til disken, så check også dette.


Esben von Buchwald (14-02-2010)
Kommentar
Fra : Esben von Buchwald


Dato : 14-02-10 16:26

On 12-02-2010 12:46, Frank Damgaard wrote:
> Esben von Buchwald wrote:
>> Her til formiddag havde jeg opdateret min Ubuntu server og den fortalte
>> mig at det var en god ide at reboote, så det gjorde jeg - og efter det,
>> kom den ikke op igen...
>>
>> Da jeg kom hjem tog jeg den ud af skabet og satte en skærm til - og
>> kunne se at linux stopper under boot og checker mine diske, og herefter
>> brokker den sig over fejl på en af diskene, og jeg skal trykke CTRL-D
>> for at den booter videre op (og aktiverer netværk osv)
>>
>> Anyway, så kører jeg en fsck på /dev/sc1 og får en ordentlig bunke fejl
>> tilbage (1)
>
> Du burde først køre smartctrl og efterfølgende badblock på disken
> hvis du mistænker defekt på disk.
>
> smartctl -a /dev/sdc # for disk /dev/sdc
>
> evt. først en "smartctl -s on /dev/xxx" hvis smartctl er slået fra på disken.
>
> giver smartctl ikke nogen info, kan du prøve en læsetest med badblocks
> og så evt. også efterfølgende køre smartctrl.
>
>
>
> PS.
> det kan også være du har fejl på kabler eller lignende til disken, så check også dette.
>

Ovenstående, er det noget der smadrer indhold? eller er det ligesom at
hente et diagnostics tool fra producenten?

Frank Damgaard (14-02-2010)
Kommentar
Fra : Frank Damgaard


Dato : 14-02-10 18:04

Esben von Buchwald wrote:

>> Du burde først køre smartctrl og efterfølgende badblock på disken
>> hvis du mistænker defekt på disk.
>>
>> smartctl -a /dev/sdc # for disk /dev/sdc
>>
>> evt. først en "smartctl -s on /dev/xxx" hvis smartctl er slået fra på
>> disken.
>>
>> giver smartctl ikke nogen info, kan du prøve en læsetest med badblocks
>> og så evt. også efterfølgende køre smartctrl.
>>

smartctl -a
denne ændrer ikke noget, men lister disken interne log info.


badblocks laver som standard kun læsetest, og burde ikke ødelægge noget.
Men nogen gange kan den interne sektor-reallokering få en
syg disk til at blive helt syg.
Det er sket en gang for mig, men det var en disk med utrolig mange fejl....


>> PS.
>> det kan også være du har fejl på kabler eller lignende til disken, så
>> check også dette.
>>
>
> Ovenstående, er det noget der smadrer indhold? eller er det ligesom at
> hente et diagnostics tool fra producenten?


"smart" til diske er en standard. normalt ingen grund til at hente
diagnostisk fra producenten, og disse er ofte dos eller windows så.....


Esben von Buchwald (14-02-2010)
Kommentar
Fra : Esben von Buchwald


Dato : 14-02-10 19:09

Har lige kørt en SMART ting som viser nedenstående - det ser umiddelbart
ikke slemt ud eller hvad?

Jeg har også sat badblocks i gang, ved ikke om det er meningen men den
har stået nu i et par timer og arbejdet uden at skrive noget som helst?
Jeg skrev: $ sudo badblocks /dev/sdc > sdc_badblocks



smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: WDC WD10EACS-65D6B0
Serial Number: WD-WCAU42040146
Firmware Version: 01.01A01
User Capacity: 1.000.204.886.016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Feb 14 19:05:18 2010 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82)   Offline data collection activity
               was completed without error.
               Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0)   The previous self-test routine
completed
               without error or no self-test has ever
               been run.
Total time to complete Offline
data collection:        (22800) seconds.
Offline data collection
capabilities:           (0x7b) SMART execute Offline immediate.
               Auto Offline data collection on/off support.
               Suspend Offline collection upon new
               command.
               Offline surface scan supported.
               Self-test supported.
               Conveyance Self-test supported.
               Selective Self-test supported.
SMART capabilities: (0x0003)   Saves SMART data before entering
               power-saving mode.
               Supports SMART auto save timer.
Error logging capability: (0x01)   Error logging supported.
               General Purpose Logging supported.
Short self-test routine
recommended polling time:     ( 2) minutes.
Extended self-test routine
recommended polling time:     ( 255) minutes.
Conveyance self-test routine
recommended polling time:     ( 5) minutes.
SCT capabilities:     (0x303f)   SCT Status supported.
               SCT Feature Control supported.
               SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0027 161 157 021 Pre-fail
Always - 6950
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 541
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x002e 100 253 051 Old_age
Always - 0
9 Power_On_Hours 0x0032 089 089 000 Old_age
Always - 8725
10 Spin_Retry_Count 0x0032 100 100 051 Old_age
Always - 0
11 Calibration_Retry_Count 0x0032 100 253 051 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 40
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always
- 5
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always
- 541
194 Temperature_Celsius 0x0022 113 102 000 Old_age Always
- 37
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always
- 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always
- 42
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age
Offline - 6
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always
- 0
200 Multi_Zone_Error_Rate 0x0008 200 199 051 Old_age
Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



Frank Damgaard (14-02-2010)
Kommentar
Fra : Frank Damgaard


Dato : 14-02-10 20:57

Esben von Buchwald wrote:
> Har lige kørt en SMART ting som viser nedenstående - det ser umiddelbart
> ikke slemt ud eller hvad?

nej, det syntes ikke til at smart i disken har registreret noget fejl.

måske dårlig ledning, eller andet hardwarefejl?

eller måske sort uheld med at fået slukket PC inden den var færdig
med at skrive til disk?

>
> Jeg har også sat badblocks i gang, ved ikke om det er meningen men den
> har stået nu i et par timer og arbejdet uden at skrive noget som helst?
> Jeg skrev: $ sudo badblocks /dev/sdc > sdc_badblocks

så ser du ikke noget før den er slut ;)

det tager sin tid at læse hele disk.

du kunne prøve i en anden terminal: tail -f sdc_badblocks
men først når den er helt slut kan du regne med logfilen.

Se også i /var/log/syslog hvis der kommer fejl.


jeg sætter ofte "-v" på , men se "man badblocks"


Esben von Buchwald (14-02-2010)
Kommentar
Fra : Esben von Buchwald


Dato : 14-02-10 22:32

On 14-02-2010 20:57, Frank Damgaard wrote:

>> Jeg skrev: $ sudo badblocks /dev/sdc> sdc_badblocks
>
> så ser du ikke noget før den er slut ;)
>
> det tager sin tid at læse hele disk.
>
> du kunne prøve i en anden terminal: tail -f sdc_badblocks
> men først når den er helt slut kan du regne med logfilen.
>
> Se også i /var/log/syslog hvis der kommer fejl.
>
>
> jeg sætter ofte "-v" på , men se "man badblocks"
>

Jaja, jeg har selvfølgelig holdt øje med filen med en tail-f

Esben von Buchwald (14-02-2010)
Kommentar
Fra : Esben von Buchwald


Dato : 14-02-10 22:36

On 14-02-2010 20:57, Frank Damgaard wrote:
> det tager sin tid at læse hele disk.
>
Det ser ud til at filen er tom, efter at badblocks har kørt - så det
betyder vel at der ik er nogen fejl på disken?

bonus-spørgsmål:

Hvordan undgår jeg, at linux starter op i den mode, hvor jeg skal trykke
CTRL-D for at få den til at boote ordentligt op (dvs. netværket er først
oppe efter ctrl-d), næste gang der er knas med filsystemet på en af
diskene? Det er lidt belastende at skulle hive serveren ud af skabet og
sætte skærm til for at finde ud af hvad der er galt - og disken der
brokkede sig var bare en med nogle non kritiske data....

Thorbjørn Ravn Ander~ (18-02-2010)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 18-02-10 18:13

Esben von Buchwald skrev:
> On 14-02-2010 20:57, Frank Damgaard wrote:
>> det tager sin tid at læse hele disk.
>>
> Det ser ud til at filen er tom, efter at badblocks har kørt - så det
> betyder vel at der ik er nogen fejl på disken?

Køb en ny!

--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Keld Jørn Simonsen (18-02-2010)
Kommentar
Fra : Keld Jørn Simonsen


Dato : 18-02-10 04:41

Den Sun, 14 Feb 2010 22:36:00 +0100 skrev Esben von Buchwald:

> On 14-02-2010 20:57, Frank Damgaard wrote:
>> det tager sin tid at læse hele disk.
>>
> Det ser ud til at filen er tom, efter at badblocks har kørt - så det
> betyder vel at der ik er nogen fejl på disken?

Det kan også være at den første fsck har repareret din disk.
den spurgte jo om du skulle overskrive de to dårlige sektorer.
Og det fik den lov til. Derved kan læsefejlene være fjernet, idet disken
nu igen kan læse fejlfrit.

men der kan vel være fejl i data i de to blokke med læsefejl?
Hvordan kan fsck skrive rigtige data ud, når den ikke kunne læse data?

Så du må hellere tjekke de filer der indeholdt de to fejlblokke.
Hvis det er ext2/3/4 kan det gøres med fsdebug-kommandoen icheck

Hilsen
keld

Søg
Reklame
Statistik
Spørgsmål : 177558
Tips : 31968
Nyheder : 719565
Indlæg : 6408914
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste