ΤΕΛΕΥΤΑΙΑ ΝΕΑ

Intel Core i7 4770K και ανάλυση σε βάθος..

Πριν ασχοληθούμε με τις επιδόσεις του CPU, καλό θα ήταν να πούμε μερικά πράγματα τόσο για την αρχιτεκτονική του, όσο και για τα features που ενσωματώνει. Για ρίξτε μια ματιά ξανά στον τίτλο του review. It's all about efficiency. Αυτός ακριβώς ήταν ο στόχος της Intel με τους νέους Haswell. Λέγοντας efficiency δεν εννοούμε μόνο την ωμή απόδοση του επεξεργαστή, αλλά και την χαμηλή ενεργειακή κατανάλωση, η οποία και αποτελούσε έναν από τους πρωταρχικούς στόχους της Intel στο επερχόμενο tock. 

Ουσιαστικά η Intel εφάρμοσε τρεις διαφορετικές "τεχνικές" προκειμένου να μειώσει την κατανάλωση. Το πρώτο που έκανε ήταν να επικεντρωθεί σε στοιχεία της μητρικής και να βελτιώσει την ενεργειακή συμπεριφορά τους (πχ third party controllers, voltage regulation κ.τ.λ). Το δεύτερο ήταν η προσθήκη power gating αλλά και low power modes, πράγμα παραδοσιακό μεν, αποδοτικό δε. Το έξτρα power gating δίνει την δυνατότητα στο power control unit (pcu) να απενεργοποιεί ευκολότερα τα μέρη του πυρήνα που δεν χρησιμοποιούνται. Επιπλέον, η μετάβαση των Haswell μεταξύ διαφορετικών power states πραγματοποιείται 25% γρηγορότερα από ότι στους Ivy Bridge, πράγμα που απελευθερώνει λίγο το pcu και το κάνει αρκετά πιο επιθετικό στην εναλλαγή power states. Να το πούμε πιο πρακτικά; Όταν κάποιοι πυρήνες του επεξεργαστή μπαίνουν σε sleep mode, δεν απαιτούν ρεύμα. Παρόλο που το φαινόμενο αυτό συμβαίνει στιγμιαία (μιλάμε για milliseconds), εν τέλει η ενεργειακή κατανάλωση μειώνεται! Η τρίτη κίνηση του μπλε στρατοπέδου έχει να κάνει με την λιθογραφική μέθοδο των 22nm. Μην ξεχνάτε ότι κάθε Tick είναι μια καινούρια λιθογραφική μέθοδος και κάθε Tock, μια καινούρια αρχιτεκτονική στους επεξεργαστές. Εφόσον τώρα βρισκόμαστε στο Tock, οι Haswell αποτελούν την δεύτερη μιρκο-αρχιτεκτονική που εκμεταλλεύεται τα πλεονεκτήματα των 22nm tri-gate transistors. Τα συγκεκριμένα, εκτός του ότι πλεονεκτούν σε "διαστάσεις", πλεονεκτούν και λόγω σχεδιασμού, ερχόμενα με σαφώς μικρότερο leakage σε σχέση με τα παλιότερα 2D planar και και με μεγαλύτερο Gate Delay. 


Intel Core i7 4770K Review: It's all about efficiencyIntel Core i7 4770K Review: It's all about efficiency


Ας εστιάσουμε τώρα λίγο περισσότερο στην αρχιτεκτονική του Haswell και πιο συγκεκριμένα στο front end. Οι Conroe ήταν οι πρώτοι επεξεργαστές με 4-wide front end, πράγμα που σημαίνει ότι μπορούσαν να καλέσουν και να αποκωδικοποιήσουν παράλληλα μέχρι 4 instructions. Στην περίπτωση των Haswell, το front end παραμένει 4-wide, με την διαφορά ότι φέρει βελτιωμένο branch predictor και hardware prefetcher, βελτιώνοντας έτσι το efficiency. Το stage pipeline έχει παραμείνει 14-19 όπως και στους Sandy Bridge, το ίδιο και οι L1/L2 cache latencies. Επιπλέον και οι Haswell με τη σειρά τους υποστηρίζουν 2-way SMT/Hyper Threading. Αυτά εν ολίγοις για το front end του pipeline. Τι γίνεται όμως με το back end; 
Το Out of Οrder Window Buffer Size, από 168 στους Sandy Bridge πλέον έφτασε τα 192. Έτσι τα execution units δύναται να εξάγουν παράλληλα περισσότερες εντολές, με αποτέλεσμα την περαιτέρω αύξηση του single threaded performance. 
Από τους Conroe μέχρι και τους Ivy Bridge, η μικροαρχιτεκτονική της Intel υποστήριζε την παράλληλη εκτέλεση μέχρι και έξι micro-ops. Παρόλο που μες στο σύστημα υπάρχουν περισσότερα από έξι execution units, υπάρχουν μόνο έξι ports (port 0 - port 5). Οι τρεις από αυτές τις θύρες χρησιμοποιούνται για memory operations και οι άλλες τρεις για μαθηματικούς υπολογισμούς. Οι Sandy Bridge ήταν οι πρώτοι επεξεργαστές με 256-bit AVX operations (το περίφημο AVX), πράγμα που σήμαινε ότι προσέθεταν επιπλέον execution units, παραμένοντας πάντα όμως σε 6 port αρχιτεκτονική. Επιτέλους αυτό αλλάζει με τους Haswell οι οποίοι και φέρουν δύο ακόμα ports, μία για integer math & branches (port 6) και μία για store address calculation (port 7).


Intel Core i7 4770K Review: It's all about efficiencyIntel Core i7 4770K Review: It's all about efficiencyIntel Core i7 4770K Review: It's all about efficiency


Η άλλη μεγάλη προσθήκη που έγινε στους Haswell, είναι η υποστήριξη Intel AVX2 instructions! Αυτό τι σημαίνει; Περισσότερα SP & DP FLOPs per cycle, προσθήκη του FMA (Fused Multiply-Add), εκ νέου σχεδιασμένα 256-bit FMA units και νέα integer instructions (indexing & hashing, cryptography & endian conversion). Πρακτικά μιλάμε για καλύτερες επιδόσεις σε high performance computing, παιχνίδια και διεργασίες audio/video. 
 Τι παρατηρούμε από τα παραπάνω; Η Intel αύξησε κατά πολύ την "ιπποδύναμη" των Haswell χωρίς όμως να επιβαρύνει τους νέους επεξεργαστές στον τομέα της κατανάλωσης. Όλα τα νέα units απενεργοποιούνται αυτόματα όταν δεν χρησιμοποιούνται. Με λίγα λόγια: Αν δεν κάνετε δουλειά, το σύστημα δεν καταναλώνει ενέργεια.
Συνεχίζουμε να εμβαθύνουμε περισσότερο στην αρχιτεκτονική των Haswell, κάνοντας μια σύντομη αναφορά και στο Cache Bandwidth, το οποίο και διπλασιάστηκε! Για ποιο λόγο όμως; Εφόσον το peak FP throughput διπλασιάστηκε, η Intel έπρεπε να εξασφαλίσει ότι τα execution units έχουν επαρκές bandwidth στις caches, ώστε οι επιδόσεις να παραμείνουν σε υψηλό επίπεδο. Έτσι λοιπόν έχουμε διπλασιασμό του L1 bandwidth, και του interface μεταξύ των L1 και L2 caches. 
Μία από τις μεγαλύτερες διαφορές των Haswell με τις προηγούμενες γενιές επεξεργαστών, είναι η "αποσύνδεση" της L3 Cache. Για να καταλάβετε τι εννοούμε, πάρτε σαν παράδειγμα τους Nehalem. Περιείχαν δύο ξεχωριστά clock domains για την CPU (core + uncore) και ένα off-die intergrated graphics core. Το core clock είχε να κάνει με την συχνότητα λειτουργίας των πυρήνων του επεξεργαστή, ενώ το uncore clock έλεγχε την ταχύτητα της L3 Cache. Με τους Sandy Bridge, η Intel εφάρμοσε ένα καινούριο σκεπτικό. Τα CPU Cores και η L3 Cache έτρεχαν στην ίδια συχνότητα. Απλά τα πράγματα. Το πρόβλημα που υπήρχε τότε, ήταν: Τι θα συνέβαινε αν η GPU χρειαζόταν πρόσβαση στην L3 Cache, όταν το CPU (και κατ' επέκταση η L3 Cache) βρισκόταν σε low frequency state; Η λύση ήταν είτε η CPU και η L3 Cache να αναγκάζοταν να τρέξουν σε μεγαλύτερη ταχύτητα, ή να παραμείνει η L3 Cache σε χαμηλή συχνότητα για να μην ενεργοποιήσει χωρίς λόγο επιπλέον CPU cores. Η τελική λύση στο πρόβλημα αυτό ήρθε με τους Ivy Bridge όπου έφεραν μια μικρή graphics L3 cache, η οποία είχε ανεξάρτητη πρόσβαση στην κύρια L3 cache χωρίς να αυξάνει την ενεργειακή κατανάλωση. 

Δεν υπάρχουν σχόλια