|
| FreeBSD 4,4 der rebooter out of the blue Fra : Dennis Pedersen |
Dato : 12-09-03 08:13 |
|
Jeg havde for nogle måneder siden problemer med at en BSD 4,4 box havde det
med at boote ud af den blå luft. Efter at have smidt samtlige job ud af
/etc/periodic (og remmet alt fra /etc/cron) stoppede rebooterriet.
Men nu for 5dage siden kom det sku igen(!)
Der er ikke ændret noget på maskinen, og mønsteret er præcis det samme som
sidst.
Samme tidspunkt på dagen give or take 10-15minutter rebooter den (eller
crasher er det vel nærmere fordi i messeages står der '/kernel: WARNING: /
was not properly dismounted').
Maskinen sidder på UPS og kører intet andet end ipfw.
Nogen der har en idé til andre ting der kan køre på tidsudløsning?
/Dennis
| |
Adam Sjøgren (12-09-2003)
| Kommentar Fra : Adam Sjøgren |
Dato : 12-09-03 09:19 |
|
On Fri, 12 Sep 2003 09:12:38 +0200, Dennis wrote:
> Jeg havde for nogle måneder siden problemer med at en BSD 4,4 box
> havde det med at boote ud af den blå luft. Efter at have smidt
> samtlige job ud af /etc/periodic (og remmet alt fra /etc/cron)
> stoppede rebooterriet. Men nu for 5dage siden kom det sku igen(!)
> Der er ikke ændret noget på maskinen, og mønsteret er præcis det
> samme som sidst. Samme tidspunkt på dagen give or take
> 10-15minutter rebooter den (eller crasher er det vel nærmere fordi i
> messeages står der '/kernel: WARNING: / was not properly
> dismounted'). Maskinen sidder på UPS og kører intet andet end ipfw.
> Nogen der har en idé til andre ting der kan køre på tidsudløsning?
Passer det med at den f.eks. er belastet på det tidspunkt? Kan det
være et hardware-problem (dårlig RAM?)?
Rene gæt...
Mvh.
--
"Från och med nu så är 'så snart som möjligt' 53 Adam Sjøgren
timmar!" asjo@koldfront.dk
| |
Dennis Pedersen (12-09-2003)
| Kommentar Fra : Dennis Pedersen |
Dato : 12-09-03 09:48 |
|
"Adam Sjøgren" <spamtrap@koldfront.dk> wrote in message
news:87znhaiflx.fsf@virgil.koldfront.dk...
> On Fri, 12 Sep 2003 09:12:38 +0200, Dennis wrote:
>
> > Jeg havde for nogle måneder siden problemer med at en BSD 4,4 box
> > havde det med at boote ud af den blå luft. Efter at have smidt
> > samtlige job ud af /etc/periodic (og remmet alt fra /etc/cron)
> > stoppede rebooterriet. Men nu for 5dage siden kom det sku igen(!)
> > Der er ikke ændret noget på maskinen, og mønsteret er præcis det
> > samme som sidst. Samme tidspunkt på dagen give or take
> > 10-15minutter rebooter den (eller crasher er det vel nærmere fordi i
> > messeages står der '/kernel: WARNING: / was not properly
> > dismounted'). Maskinen sidder på UPS og kører intet andet end ipfw.
> > Nogen der har en idé til andre ting der kan køre på tidsudløsning?
>
> Passer det med at den f.eks. er belastet på det tidspunkt?
Der var eet punkt i ovenstående der var lidt inforstået - den kører en IPsec
tunnel til en anden afdelingen. Men det er kun en 512kilobit ADSL og
hardwaren er P2 233 med 64mb ram - og cpu er 95-98% idle
>Kan det
> være et hardware-problem (dårlig RAM?)?
Jeg vil ikke udelukke det, men sidst jeg løb ind i det var der 2 helt
uafhængie maskiner der gjorde det.
Men det skulle da være lidt godt uheldigt hvis dårlig ram skulle kunne hive
den ned med tidsinterval give or take 10min?
/Dennis
| |
Adam Sjøgren (12-09-2003)
| Kommentar Fra : Adam Sjøgren |
Dato : 12-09-03 11:49 |
|
On Fri, 12 Sep 2003 10:48:05 +0200, Dennis wrote:
>> Kan det være et hardware-problem (dårlig RAM?)?
> Jeg vil ikke udelukke det, men sidst jeg løb ind i det var der 2
> helt uafhængie maskiner der gjorde det. Men det skulle da være lidt
> godt uheldigt hvis dårlig ram skulle kunne hive den ned med
> tidsinterval give or take 10min?
Ja, det er rent gæt fra min side (jeg ville bare indskyde den idé
også, hvis du alene kiggede på software).
Hvis det var hang sammen med belastning, så var det nok mere
sandsynligt.
Hvis det er en x86-maskine og det er muligt at tage den af tjenesten
kan du jo prøve Memtest86 og udelukke den fejlkilde for good.
Hvis det er noget der kører på et specifikt tidspunkt lyder det vel
også mærkeligt at det ikke er præcis på samme tidspunkt hver gang den
genstarter?
Mvh.
--
"Från och med nu så är 'så snart som möjligt' 53 Adam Sjøgren
timmar!" asjo@koldfront.dk
| |
Dennis Pedersen (12-09-2003)
| Kommentar Fra : Dennis Pedersen |
Dato : 12-09-03 11:59 |
|
"Adam Sjøgren" <spamtrap@koldfront.dk> wrote in message
news:874qziz3hv.fsf@virgil.koldfront.dk...
> On Fri, 12 Sep 2003 10:48:05 +0200, Dennis wrote:
>
> >> Kan det være et hardware-problem (dårlig RAM?)?
>
> > Jeg vil ikke udelukke det, men sidst jeg løb ind i det var der 2
> > helt uafhængie maskiner der gjorde det. Men det skulle da være lidt
> > godt uheldigt hvis dårlig ram skulle kunne hive den ned med
> > tidsinterval give or take 10min?
>
> Ja, det er rent gæt fra min side (jeg ville bare indskyde den idé
> også, hvis du alene kiggede på software).
Det har været galt før med præcis samme symtomer , der var det /etc/periodic
der drillede mig. Derfor tvivl jeg lidt på hardware..
Hvis det derimod havde været spontane tidspunkter i løbet af dagen havde
snakken været en anden
> Hvis det var hang sammen med belastning, så var det nok mere
> sandsynligt.
>
> Hvis det er en x86-maskine og det er muligt at tage den af tjenesten
> kan du jo prøve Memtest86 og udelukke den fejlkilde for good.
Det må jeg lige prøve på et tidspunkt
> Hvis det er noget der kører på et specifikt tidspunkt lyder det vel
> også mærkeligt at det ikke er præcis på samme tidspunkt hver gang den
> genstarter?
ps aux :
root 337 0.0 0.2 412 244 p0 R+ 3:16PM 0:00.00 ps aux
root 1 0.0 0.3 544 320 ?? ILs 3:06PM 0:00.04 /sbin/init --
root 2 0.0 0.0 0 0 ?? DL 3:06PM 0:00.03 (pagedaemon)
root 3 0.0 0.0 0 0 ?? DL 3:06PM 0:00.00 (vmdaemon)
root 4 0.0 0.0 0 0 ?? DL 3:06PM 0:00.14 (bufdaemon)
root 5 0.0 0.0 0 0 ?? DL 3:06PM 0:00.56 (syncer)
root 28 0.0 0.1 208 92 ?? Is 3:06PM 0:00.00 adjkerntz -i
root 117 0.0 0.3 500 288 ?? Ss 1:06PM 0:22.59
/sbin/natd -inter
root 209 0.0 0.3 472 332 ?? Ss 1:06PM 0:00.12 routed -q
root 221 0.0 0.6 932 648 ?? Ss 1:06PM 0:00.43
/usr/sbin/syslogd
root 243 0.0 1.4 2176 1484 ?? Is 1:06PM 0:02.23 /usr/sbin/sshd
root 273 0.0 1.6 2236 1748 ?? Ss 1:06PM 0:09.47
/usr/local/sbin/racoon
root 299 0.0 0.6 944 656 v0 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 300 0.0 0.6 944 656 v1 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 301 0.0 0.6 944 656 v2 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 302 0.0 0.6 944 656 v3 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 303 0.0 0.6 944 656 v4 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 304 0.0 0.6 944 656 v5 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 305 0.0 0.6 944 656 v6 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 306 0.0 0.6 944 656 v7 Is+ 1:06PM 0:00.03
/usr/libexec/gett
root 307 0.0 1.7 2260 1824 ?? S 1:07PM 0:01.07 sshd:
<fjernet>@ttyp
<fjernet> 308 0.0 0.4 632 436 p0 Is 1:07PM 0:00.09 -sh (sh)
root 310 0.0 0.9 1392 1012 p0 S 1:08PM 0:00.61 _su (csh)
root 0 0.0 0.0 0 0 ?? DLs 3:06PM 0:00.02 (swapper)
Umiddelbart ser ovenstående jo tilforladeligt ud?
Jeg var ved at kigge på om der skulle være annonceret nogen sikkerhedshuller
i sshd - det så det ikke ud til.
/Dennis
| |
Dennis Pedersen (17-09-2003)
| Kommentar Fra : Dennis Pedersen |
Dato : 17-09-03 11:13 |
|
"Dennis Pedersen" <usenetspam@*FJERNDETTE*daydreamer.dk> wrote in message
news:3f6171bd$0$83048$edfadb0f@dtext01.news.tele.dk...
> Jeg havde for nogle måneder siden problemer med at en BSD 4,4 box havde
det
> med at boote ud af den blå luft. Efter at have smidt samtlige job ud af
Efter at have gransket lidt i sagen ser det ud til at det er : adjkerntz
Der laver missæren.
Det er en gammel HP netserver og den kan åbenbart ikke finde ud af synce
bios tiden. Slår jeg adjkerntz ned kører det som det skal (og hvis jeg
tænker mig om kan det faktisk godt passe boxen har kørt i nogle måneder uden
at have været booted så jeg også fik lukket den sidste gang det var galt..)
/Dennis
| |
|
|