On Sat, 16 Jul 2005 09:27:10 +0200, Søren Helskov <master.clio@45move.dk>  
 wrote:
 
 > Hej
 >
 > Uden at starte en Amd vs Intel diskussion kunne jeg godt tænke mig
 > at vide hvad forskellen er på de to cpu'er hvis man tager Athlon64 og  
 > f.eks
 > en
 > prescott.
 > Intel kører med meget høj FSB iforhold til Amd. Hvorfor?
 > Hvorfor kører Amd mindst ligeså hurtigt når den på papiret i
 > Mhz og Fsb osv er "langsommere"?
 >
 
 Her følger et (stadig generelt) svar.  Alle tal er rene eksempler uden
 reference til bestemte CPU-er.
 
 Et par oplysninger med relevans for FSB frekvensen:
 
 1. En moderne FSB fungerer sådan at det kan blive lidt akademisk om den  
 helt
    samme FSB (altså fysisk samme maskine) skal kaldes f.eks. 100MHz, 200MHz
    eller endnu mere, alt efter hvor små "skridt" i FSB-operationen der skal
    tælles som 1 cyclus.
 
 2. AMD og Intel har hver deres FSB-interface mellem CPU og chipset, derfor
    kan det selv med samme definition af 1 cyclus være ret forskelligt hvor
    mange bits der overføres pr. cyclus.  Til performance-sammenligning er
    GB/s mere relevant, men når man skal matche en CPU til den rigtige model
    Motherboard er den konkrete frekvens i MHz det eneste der kan bruges til
    noget.
 
 3. AMDs 64 bit chips (Opteron og Athlon64) har en direkte forbindelse fra
    CPU til RAM uden om FSB, så på disse chips har FSB kun betydning for I/O
    til f.eks. skærmkortet, og skal derudover kun trække den brøkdel af
    data som ikke bruger genvejen til/fra RAM.
 
 Et par oplysninger med relevans for CPU core frekvensen:
 
 1. Hvor meget en CPU-pipeline laver pr. clockcyclus kommer an på hvor mange
    transistorer etc. der sidder "efter hinanden" mellem hvert trin (stage) i
    den pipeline.
 
    Hvis en pipeline i et trin både henter et tal fra et register regner på
    det tal og skriver det tilbage igen, koster det kun 1 clockcyclus, men
    signalet skal igennem så mange transistorer at minimumstiden for den ene
    clockcyclus er en del større.
 
    Hvis den samme operation skal igennem f.eks. 4 trin, så koster den 4
    clockcycler men hver clockcyclus kan så til gengæld være en del kortere
    (højere clockfrekvens).  Dette kaldes en dybere pipeline.
 
 2. En pipeline kan i princippet håndtere 1 operation pr. clockcyclus  
 alligevel,
    hvor hvert trin så behandler den næste del af programmet.  Dette kan dog
    kun udnyttes hvis de operationer som skal ind i køen efter hinanden er  
 klar,
    og ikke er nødt til at stå udenfor pipelinen og vente på at et bestemt  
 resultat
    først er kommet ud af den anden ende.
 
 3. En meget stor del af designet af moderne CPU-er går derfor på at lave  
 nogle
    ekstremt indviklede (men stadig lynhurtige) systemer som kan holde flest  
 muligt
    bolde (operationer) i luften på en gang.
 
 4. Et af de mere specielle tricks er Intels Hyperthreading, som simpelthen  
 går ud
    på at der er bolde fra to forskellige programmer i CPU-en på en gang, da  
 disse
    jo er uafhængige skal de ikke vente på hinandens resultater og Intel kan  
 på den
    måde forøge den procentdel af tiden hvor hvert trin laver noget for  
 pengene.
 
 Intel og AMD er rørende enige om at det med at sammenligne rå  
 clockfrekvenser
 var meget mere relevant på 386 og ældre CPU-er, hvor hver enkelt  
 programlinie
 brugte et veldefineret antal clockcycler, som var næsten det samme for  
 begge
 fabrikater.  Dengang var der ingen cache og FSB=CPUclock=RAMclock.
 
 På moderne CPU-er som Opteron, Xeon m.fl. er clockfrekvensen en nærmest  
 ligegyldig
 mellemregning som kun omtales fordi folk spørger efter den.  Både Intel og  
 AMD
 har lavet nogle nærmest absurde stunts for at tilfredsstille dette  
 markedsgøgl:
 
 Pentium IV blev bygget med en meget dyb pipeline og kørte faktisk  
 langsommere ved
 samme clockfrekvens end både den gamle Pentium III og den senere Pentium  
 M.  Der
 var en del pressespekulationer om dette design var for at kunne prale med  
 den
 højere clock som var mulig på grund af de små trin.
 
 AthlonXP blev konsekvent betegnet med et tal som IKKE var frekvensen på  
 CPU-en
 men et performancemål hvor 1000=ca. hastigheden på en bestemt 1GHz  
 Intel-CPU.
 
 Opteron har konsekvent ingen hastighed i modelnummeret og man skal grave  
 dybt
 på AMDs site for at finde ud af hvor hurtig en Opteron er i forhold til en  
 anden.
 Det samme gælder vist for Itanium2.
 
 m.v.h.
 
 Jakob
 
 -- 
 #include <disclaimer>
  
            
             |