بررسي عملکرد پردازنده AMD Opteron 2435
AMD بطور سنتي از دامنه سرور/ ايستگاه کاري پردازنده هاي Opteron خود براي آغاز کار فناوريهاي جديد استفاده کرده است. پردازنده هاي Opteron اولين پردازنده هاي 2 هسته اي و 4 هسته اي اين شرکت بودند و اکنون مي توانيم بگوئيم که آنها اولين پردازنده هاي AMD با 6 هسته فيزيکي هستند. اين پردازنده هاي 6 هسته اي جديد تحت عنوان سريهاي 8400 و 2400 شناخته مي شوند. تفاوت دو سري مذکور در اين است که تنها دو Opteron از سري 2400 مي توانند بر روي يک مادربرد نصب شوند، در حاليکه اين تعداد براي پردازنده هاي سري 8400 به 8 عدد مي رسد.
هر دو نوع پردازنده هاي Opteron جديد همانند اسلاف خود از بسته بندي سوکت F استفاده مي کنند، ولي با توجه به اين واقعيت که ما فکر نمي کنيم تعداد زيادي از خوانندگان ما اقدام به تهيه سرورهائي براي يک Data-Center نمايند، تصميم گرفتيم که در اين مقاله به بررسي Opteron 2435 يعني بالاترين مدل سري 2400 بپردازيم.
6 هسته پردازنده Opteron 2435 با سرعت کلاک 2/6 گيگاهرتز کار مي کنند که بالاتر از فرکانس کلاک هر Opteron 6 هسته اي ديگري به حساب مي آيد، هر چند که 500 مگاهرتز از سريعترين Opteron4 هسته اي (2393) پائين تر است. Opteron 2393 به پردازنده گريزان شهرت يافته است، زيرا تنها تعداد اندکي از خريداران خوش شانس توانسته اند آن را در بازار بيابند. در نتيجه، ما مجبور شديم Opteron 2435 را با دومين پردازنده برتر خانواده Opteronهاي 4 هسته اي يعني 2382 مقايسه نمائيم که بطور يکساني با فرکانس 2/6 گيگاهرتز کار مي کند.
عليرغم آنکه مدل جديد 2435 دو هسته بيشتر از Opteronهاي قبلي دارد، اما با همان TDP پائين 75 واتي عرضه مي شود که تقريبا نصف TDP 130 واتي سريعترين پردازنده سرور/ ايستگاه کاري اينتل يعني Xeon W5580 مي باشد.
با اينحال، AMD تنها دو هسته ديگر را به Opteron 2435 اضافه نکرده است، بلکه چندين ويژگي معماري جديد نيز در آن به چشم مي خورند. مهمترين مورد در ميان آنها، لينک Hyper-Transport ارتقاء يافته از نسخه 1/0 به نسخه 3/0 است که به اين ترتيب فرکانس موثر آن از 1 گيگاهرتز به 2/4 گيگاهرتز افزايش مي يابد.
از آنجائيکه گذرگاه Hyper-Transport براي برقراري تمام ارتباطات ميان CPU و ساير قسمتهاي سيستم مورد استفاده قرار مي گيرد. اين بهبود مي تواند يک افزايش عملکرد قابل توجه را در تمام نرم افزارهاي کاربردي به همراه داشته باشد. متاسفانه، از آنجائيکه هيچيک از مادربردهاي Socket F دو پردازنده اي فعلي از Hyper-Transport 3.0 پشتيباني نمي کنند، Opteron 2435 ناچار است به يک گذرگاه 1 گيگاهرتزي محدود مي شود. مادربردهاي سازگار با Hyper-Transport 3.0 بر اساس يک چيپ ست جديد AMD در طول يک يا دو ماه آينده عرضه خواهند شد.
Opteron 2435 در عين حال با معرفي ويژگي جديد ديگري نيز همراه است: HT Assist . اين فناوري به کاهش تعداد Probe هائي که يک هسته بايد در هنگام جستجوي داده هائي که احتمالا در کاشه هسته هاي ديگر ذخيره شده اند انجام دهد، کمک مي نمايد. با اينحال بعيد به نظر مي رسد اين ويژگي با يک بهبود عملکرد چشمگير در يک سيستم دو پردازنده اي 12 هسته اي همراه باشد، بلکه مزيت واقعي خود را در يک پيکربندي 8 يا 4 پردازنده اي با 24 هسته و بالاتر به نمايش خواهد گذاشت.
-هسته:Istanbul
-بسته بندي:Socket F
- کاشه 128: L1 کيلوبايت براي هر هسته
- کاشه 512: L2 کيلوبايت براي هر هسته
- کاشه 6: L3 مگابايت که براي تمام هسته ها قابل دسترسي است
- کنترلر حافظه: 2/2 گيگاهرتز
- حافظه :800MHz-ECC registered DDR2 دو کاناله
- 75: TDP وات
با اينحال، ما متوجه شده ايم که تعدادي از خوانندگان ما مي خواهند يک PC براي انجام تمام وظايف احتمالي داشته باشند و به همين دليل است که تصميم گرفتيم يک مجموعه فراگير از آزمايشهاي مقايسه اي نرم افزارهاي کاربردي حرفه اي و عمومي را براي اين مقاله طراحي کنيم. اين مجموعه از بسته هاي انيميشن و راندوي 3 بعدي گرفته تا شبيه سازيهاي HPC(high-performance computing) بلادرنگ که معمولا بر روي کلاسترهاي عظيم اجرا مي شوند را در بر مي گيرد. فهرست نرم افزارهاي کاربردي عمومي، بازيها و نرم افزارهاي کاربردي حرفه اي مورد استفاده ما براي انجام آزمايشها، به ترتيب عبارتند از :
-Zip-7
- Handbrake
- GIMP
- Media Player Classic
- Wprime
- Prime95
- X3:Terran Conflict
- Euler 3D
- FlamMap
- LightWave 9.6
- Terragen 2
براي قرار دادن Opteron 2435 (يا بطور دقيق تر، دو عدد از آنها) در مسير آزمايش، ما آنها را با يک مادربرد Supermicro H8DAE-2(شکل[2]) و 16 گيگابايت حافظه 6400Crucial ECC registered DDR2-PC2 همراه کرديم . براي اهداف مقايسه اي، ما مجموعه مشابهي از آزمايشها را بر روي سيستمهاي مبتني بر دو پردازنده Opteron 2382 و دو پردازنده Xeon 5580 نيز اجرا کرده ايم. نمودارهاي مقايسه اي ما در عين حال نتايج يک سيستم مبتني بر دو پردازنده Xeon 5482 ( سريعترين نسخه نسل قبلي اين پردازنده ها) را نيز در بر مي گيرند.
- درايو ديسک سخت: Samsung SpinPoint P120S 250GB SATA II
- منبع تغذيه: Enermax Galaxy 1KW,Supermicro 800W
- درايور کارت گرافيک: Nvidia GeForce 185.85
- سيستم 16: Opteron 2435 گيگابايت 6400-Crucial PC2 ECC registered DDR2
- سيستم 4: Opteron 2382 گيگابايت Supermicro PC2-5300 ECC registered DDR2
- سيستم 12: Xeon W5580 گيگابايت CT3KIT25672BB1339 ECC registered DDR3
- سيستم 4: Xeon گيگابايت Crucial CT12872AF80E FB-DIMM DDR2
با وجود آنکه يک عدم انطباق در مجموع حافظه قابل دسترسي براي سيستمهاي آزمايشي وجود دارد، فکر مي کنيم بهتر است اين وضعيت را در ابتداي کار مشخص کنيم که اکثر آزمايشهاي مقايسه اي مورد استفاده ما بر عملکرد CPU تمرکز دارند، بنابراين از در اختيار داشتن حافظه اي بيش از 4 گيگابايت سود نخواهند برد.
براي اجراي آزمايش حافظه Unbuffered کافي است صفحه Benchmarks را باز کرده، به بخش Options رفته و گزينه Buffering را غير فعال نمائيد. اين تنظيمات، قرائت نامتناقض و دقيق تري از توان عبوردهي (Tjroughput) حافظه را در اختيار شما قرار مي دهد. سپس وارد منوي Graphs شده و گزينه هاي Animate Controls و Animate Tools را غير فعال کنيد. اين گزينه ها براي نمايشگاه هائي نظير Computex يا CES طراحي شده اند و براي کاربران نهائي صرفا آزاردهنده خواهند بود.
کليد F5 را براي اجراي آزمايشها فشار دهيد و پس از اتمام فرآيند آزمايش وارد منوي Graph شده و چند بار بر روي Change Controls Mode کليک کنيد تا به ظاهري مشابه نمودارهاي ما برسيد. حالا شما مي توانيد متوسط ارقام متوسط Internal Memory Bandwidth و Float Memory Bandwidth را بدست آورده و عملکرد حافظه Unbuffered را اندازه گيري نمائيد.
اجراي آزمايش تاخير بسيار آسانتر خواهد بود: ابزار Memory Latency را در صفحه Benchmarks يافته و آن را به سادگي با فشار کليد F5 اجرا کنيد. تاخير حافظه شما، نتيجه بالائي در پنجره متني خواهد بود.
ما کار را با آزمايش مجدد Xeon W5580 آغاز کرديم، زيرا يک نسخه جديد از Sandra که از پياده سازي NUMA توسط شرکت اينتل پشتيباني مي کند، به تازگي عرضه شده است. اين نتايج جديد نشان مي دهند که سيستم Xeon W5580 از پهناي باند حافظه به مراتب بالاتر و همچنين تاخير پائين تري در مقايسه با هر يک از سيستمهاي Opteron برخوردار مي باشد. اگر نرم افزارهاي کاربردي متعددي را بطور همزمان اجرا مي کنيد (مثلا بر روي سرورهاي مورد استفاده جهت راه اندازي چند ماشين مجازي) اين نتيجه مي تواند يک ملاحظه مهم براي شما به حساب آيد. با اينحال، شرايط در اينجا بطور يکطرفه اي به نفع اينتل نيست زيرا سيستمهاي قديمي تر Xeon X5482 بوضوح بخاطر حافظه FB-DIMM خود که بطور وحشتناکي کند است، از سايرين عقب افتاده.
دو پردازنده 6 هسته اي Opteron 2435 بطور نااميد کننده اي در دو آزمايش مقايسه اي ما بازيها ناتوان بودند. اين پردازنده ها در Crysis اندکي سريعتر از پردازنده هاي Opteron 2382 بودند(به ترتيب با نرخ فريم 23/30 در مقابل 21/28). با اينحال، X3:Terran Conflict بر روي سيستم مبتني بر پردازنده هاي Opteron 2382 سريعتر اجرا مي شود. در هر صورت اگر مي خواهيد بازيهائي را بر روي ايستگاه کاري دو پردازنده اي خود اجرا کنيد، يک جفت پردازنده Xeon W5580 يقينا گزينه بسيار بهتري خواهند بود زيرا مي توانند Crysis را با يک نرخ فريم حداقل و متوسط ( به ترتيب) 36 و 47 فريم بر ثانيه اي اجرا کنند. اين سيستم در عين حال در اجراي بازي X3:Terran Conflict نيز بطور قابل ملاحظه اي سريعتر از دو سيستم Opteron مي باشد.
امتيازها در مقايسه با يک PC مرجع که به يک پردازنده Core 2 Duo E6700 با سرعت اسمي، 2 گيگابايت حافظه DDR2 و يک مادربرد سريع P45 مجهز است، استانداردسازي شده اند. اين PC استاندارد 1000 را به خود اختصاص داده است، بنابراين اگر شما امتياز 1300 را بدست آوريد مي توانيد نتيجه بگيريد که PC شما 30 درصد از سيستم مرجع سريعتر است. از سوي ديگر اگر امتيازي پائين تر از 1000 را بدست آوريد، طبيعتا به اين معني خواهد بود که PC شما از سيستمي با اين مشخصات کندتر مي باشد.
در Euler3D باز هم 4 هسته اضافي و پهناي باند بالاتر سيستم دو پردازنده اي Opteron 2435 با کسب امتياز 4/005 هرتز در مقابل 2/780 هرتز، برتري چشمگيري را نسبت به سيستم دو پردازنده اي Opteron 2382 در اختيار آن قرار داده است. با اينحال، سيستم مبتني بر پردازنده هاي Xeon W5580 که يک هيولا در محاسبات نوع CFD به حساب مي آيد به امتياز نفس گير 6/897 هرتز دست يافته است.
Opteron 2435 شش هسته اي در آزمايش FlamMap نيز بسيار سريعتر از Opteron 2382 بوده است. اين پردازنده ها آزمايش مذکور را در 177 ثانيه به اتمام رسانده اند، در حاليکه پردازنده هاي Opteron 2382 براي تکميل کار خود به 310 ثانيه وقت نياز داشته اند. در اين آزمايش نيز پردازنده هاي Xeon W5580 سريعترين شرکت کنندگان به حساب مي آيند و آزمايش را در 130 ثانيه به اتمام رسانده اند.
در يک وضعيت نااميد کننده، پردازنده هاي Opteron 2435 در آزمايشهاي LightWave 9.6 ما که يک بسته انيميشن و مدلسازي 3 بعدي است، نتيجه بهتري را نسبت به پردازنده هاي Opteron 2382 بدست نياوردند. آنطور که Task manager نشان مي دهد، LightWave 9.6 از هر 12 هسته سيستم Opteron 2435 استفاده مي کرده است و به همين دليل باز هم قادر به تشريح دليل اين نتايج ضعيف نيستيم. به هر حال در اين آزمايش نيز همچنان Xeon W5580 صدرنشين است.
عليرغم آنکه Terragen2 قادر به پشتيباني بيش از 8 رشته پردازشي نمي باشد، اما سيستم Opteron 2435 در اين آزمايش (که يک صحنه بسيار واقعگرايانه از کوهستان را براي استفاده بعنوان پس زمينه يک فيلم راندو مي کند) توانسته همکار مبتني بر پردازنده هاي Opteron 2382 خود را پشت سر بگذارد. اما شرکت کننده برتر ما در اينجا نيز جايگاه خود را حفظ مي کند.
براي آنکه Terragen2 را وادار نمائيم که بجاي هسته هاي منطقي پردازنده هاي W5580 (مبتني بر فناوري HyperThreading آن) از هسته هاي فيزيکي استفاده کند، آزمايش را پس از غيرفعال نمودن اين فناوري در BIOS سيستم اجرا کرديم. در اين پيکربندي، پردازنده هاي Xeon W5580 به نتيجه بسيار بهتر 8 دقيقه و 43 ثانيه دست يافتند که 15 درصد سريعتر از عملکرد پردازنده هاي Xeon 5482 است.
براي اجراي اين آزمايش، ابتدا Core Count را بررسي کنيد تا مطمئن شويد که WPrime تمام هسته هاي فيزيکي و مجازي پردازنده ها را تحت فشار کاري قرار خواهد داد. سپس مي توانيد آزمايش 32M را اجرا نمائيد. نتايج بصورت زمان مورد نياز براي محاسبه ريشه دوم مجموعه اعداد (32 ميليون عدد در آزمايش استاندارد) بيان مي شوند. بنابراين، يک امتياز پائين تر در اين آزمايش به معناي عملکرد بهتر خواهد بود.
در اين پيکربندي، پردازنده هاي Opteron2435 310 وات برق مصرف کردند که با يک کاهش کوچک در مقايسه با 327 وات پردازنده هاي Opteron 2382 همراه بود. اين موضوع زماني تاثيرگذارتر به نظر مي رسد که توجه داشته باشيد سيستم Opteron 2382 داراي 4 هسته بيشتر بوده و RAM آن با فرکانس بالاتري کار مي کند. در مقابل، پردازنده هاي Xeon W5580 با عطش زيادي 386 وات را مصرف مي کنند. هرچند که اين ميزان مصرف برق نسبتا بالا به نظر مي رسد، اما عملکرد بسيار بهتر پردازنده هاي Xeon W5580 در مقايسه با رقبايش به معناي آن است که از بازدهي انرژي بهتري برخوردار مي باشد، زيرا با اين سيستم شما مي توانيد کارهاي خود را سريعتر به اتمام برسانيد.
با اينحال، در حاليکه مصرف برق نسبتا پائين پردازنده هاي Opteron 2435 مي تواند جذابيت آنها را براي گروهي که در حال ارتقاء يک Data-Center با محدوديت مصرف برق هستند افزايش دهد، اما شيوه محدودسازي مصنوعي عملکرد اين پردازنده ها توسط AMD از طريق پائين نگهداشتن فرکانس کاري آنها به اين معني خواهد بود که خريد جذابي براي يک ايستگاه کاري يا سرورHPC به حساب نمي آيند.
در چنين سناريوهائي، مهمترين عامل اين است که چه مقدار قدر پردازشي را مي توانيد در يک جعبه واحد جاي دهيد. بر اساس اين معيار بايد بگوئيم که Xeon W5580 يک گزينه بي رقيب به حساب مي آيد، خصوصا حالا که قيمت آنها بطور قابل ملاحظه اي کاهش يافته است.
منبع:بزرگراه رايانه، شماره 121.
هر دو نوع پردازنده هاي Opteron جديد همانند اسلاف خود از بسته بندي سوکت F استفاده مي کنند، ولي با توجه به اين واقعيت که ما فکر نمي کنيم تعداد زيادي از خوانندگان ما اقدام به تهيه سرورهائي براي يک Data-Center نمايند، تصميم گرفتيم که در اين مقاله به بررسي Opteron 2435 يعني بالاترين مدل سري 2400 بپردازيم.
6 هسته پردازنده Opteron 2435 با سرعت کلاک 2/6 گيگاهرتز کار مي کنند که بالاتر از فرکانس کلاک هر Opteron 6 هسته اي ديگري به حساب مي آيد، هر چند که 500 مگاهرتز از سريعترين Opteron4 هسته اي (2393) پائين تر است. Opteron 2393 به پردازنده گريزان شهرت يافته است، زيرا تنها تعداد اندکي از خريداران خوش شانس توانسته اند آن را در بازار بيابند. در نتيجه، ما مجبور شديم Opteron 2435 را با دومين پردازنده برتر خانواده Opteronهاي 4 هسته اي يعني 2382 مقايسه نمائيم که بطور يکساني با فرکانس 2/6 گيگاهرتز کار مي کند.
عليرغم آنکه مدل جديد 2435 دو هسته بيشتر از Opteronهاي قبلي دارد، اما با همان TDP پائين 75 واتي عرضه مي شود که تقريبا نصف TDP 130 واتي سريعترين پردازنده سرور/ ايستگاه کاري اينتل يعني Xeon W5580 مي باشد.
با اينحال، AMD تنها دو هسته ديگر را به Opteron 2435 اضافه نکرده است، بلکه چندين ويژگي معماري جديد نيز در آن به چشم مي خورند. مهمترين مورد در ميان آنها، لينک Hyper-Transport ارتقاء يافته از نسخه 1/0 به نسخه 3/0 است که به اين ترتيب فرکانس موثر آن از 1 گيگاهرتز به 2/4 گيگاهرتز افزايش مي يابد.
از آنجائيکه گذرگاه Hyper-Transport براي برقراري تمام ارتباطات ميان CPU و ساير قسمتهاي سيستم مورد استفاده قرار مي گيرد. اين بهبود مي تواند يک افزايش عملکرد قابل توجه را در تمام نرم افزارهاي کاربردي به همراه داشته باشد. متاسفانه، از آنجائيکه هيچيک از مادربردهاي Socket F دو پردازنده اي فعلي از Hyper-Transport 3.0 پشتيباني نمي کنند، Opteron 2435 ناچار است به يک گذرگاه 1 گيگاهرتزي محدود مي شود. مادربردهاي سازگار با Hyper-Transport 3.0 بر اساس يک چيپ ست جديد AMD در طول يک يا دو ماه آينده عرضه خواهند شد.
Opteron 2435 در عين حال با معرفي ويژگي جديد ديگري نيز همراه است: HT Assist . اين فناوري به کاهش تعداد Probe هائي که يک هسته بايد در هنگام جستجوي داده هائي که احتمالا در کاشه هسته هاي ديگر ذخيره شده اند انجام دهد، کمک مي نمايد. با اينحال بعيد به نظر مي رسد اين ويژگي با يک بهبود عملکرد چشمگير در يک سيستم دو پردازنده اي 12 هسته اي همراه باشد، بلکه مزيت واقعي خود را در يک پيکربندي 8 يا 4 پردازنده اي با 24 هسته و بالاتر به نمايش خواهد گذاشت.
مشخصات فني پردازنده Opteron 2435
-هسته:Istanbul
-بسته بندي:Socket F
- کاشه 128: L1 کيلوبايت براي هر هسته
- کاشه 512: L2 کيلوبايت براي هر هسته
- کاشه 6: L3 مگابايت که براي تمام هسته ها قابل دسترسي است
- کنترلر حافظه: 2/2 گيگاهرتز
- حافظه :800MHz-ECC registered DDR2 دو کاناله
- 75: TDP وات
پيکربندي آزمايش
با اينحال، ما متوجه شده ايم که تعدادي از خوانندگان ما مي خواهند يک PC براي انجام تمام وظايف احتمالي داشته باشند و به همين دليل است که تصميم گرفتيم يک مجموعه فراگير از آزمايشهاي مقايسه اي نرم افزارهاي کاربردي حرفه اي و عمومي را براي اين مقاله طراحي کنيم. اين مجموعه از بسته هاي انيميشن و راندوي 3 بعدي گرفته تا شبيه سازيهاي HPC(high-performance computing) بلادرنگ که معمولا بر روي کلاسترهاي عظيم اجرا مي شوند را در بر مي گيرد. فهرست نرم افزارهاي کاربردي عمومي، بازيها و نرم افزارهاي کاربردي حرفه اي مورد استفاده ما براي انجام آزمايشها، به ترتيب عبارتند از :
1- نرم افزارهاي کاربردي عمومي:
-Zip-7
- Handbrake
- GIMP
- Media Player Classic
- Wprime
- Prime95
2- بازيها:
- X3:Terran Conflict
3- نرم افزارهاي کاربردي حرفه اي:
- Euler 3D
- FlamMap
- LightWave 9.6
- Terragen 2
براي قرار دادن Opteron 2435 (يا بطور دقيق تر، دو عدد از آنها) در مسير آزمايش، ما آنها را با يک مادربرد Supermicro H8DAE-2(شکل[2]) و 16 گيگابايت حافظه 6400Crucial ECC registered DDR2-PC2 همراه کرديم . براي اهداف مقايسه اي، ما مجموعه مشابهي از آزمايشها را بر روي سيستمهاي مبتني بر دو پردازنده Opteron 2382 و دو پردازنده Xeon 5580 نيز اجرا کرده ايم. نمودارهاي مقايسه اي ما در عين حال نتايج يک سيستم مبتني بر دو پردازنده Xeon 5482 ( سريعترين نسخه نسل قبلي اين پردازنده ها) را نيز در بر مي گيرند.
مولفه هاي تکميلي
- درايو ديسک سخت: Samsung SpinPoint P120S 250GB SATA II
- منبع تغذيه: Enermax Galaxy 1KW,Supermicro 800W
- درايور کارت گرافيک: Nvidia GeForce 185.85
حافظه
- سيستم 16: Opteron 2435 گيگابايت 6400-Crucial PC2 ECC registered DDR2
- سيستم 4: Opteron 2382 گيگابايت Supermicro PC2-5300 ECC registered DDR2
- سيستم 12: Xeon W5580 گيگابايت CT3KIT25672BB1339 ECC registered DDR3
- سيستم 4: Xeon گيگابايت Crucial CT12872AF80E FB-DIMM DDR2
با وجود آنکه يک عدم انطباق در مجموع حافظه قابل دسترسي براي سيستمهاي آزمايشي وجود دارد، فکر مي کنيم بهتر است اين وضعيت را در ابتداي کار مشخص کنيم که اکثر آزمايشهاي مقايسه اي مورد استفاده ما بر عملکرد CPU تمرکز دارند، بنابراين از در اختيار داشتن حافظه اي بيش از 4 گيگابايت سود نخواهند برد.
عملکرد حافظه:Sisoft Sandra
براي اجراي آزمايش حافظه Unbuffered کافي است صفحه Benchmarks را باز کرده، به بخش Options رفته و گزينه Buffering را غير فعال نمائيد. اين تنظيمات، قرائت نامتناقض و دقيق تري از توان عبوردهي (Tjroughput) حافظه را در اختيار شما قرار مي دهد. سپس وارد منوي Graphs شده و گزينه هاي Animate Controls و Animate Tools را غير فعال کنيد. اين گزينه ها براي نمايشگاه هائي نظير Computex يا CES طراحي شده اند و براي کاربران نهائي صرفا آزاردهنده خواهند بود.
کليد F5 را براي اجراي آزمايشها فشار دهيد و پس از اتمام فرآيند آزمايش وارد منوي Graph شده و چند بار بر روي Change Controls Mode کليک کنيد تا به ظاهري مشابه نمودارهاي ما برسيد. حالا شما مي توانيد متوسط ارقام متوسط Internal Memory Bandwidth و Float Memory Bandwidth را بدست آورده و عملکرد حافظه Unbuffered را اندازه گيري نمائيد.
اجراي آزمايش تاخير بسيار آسانتر خواهد بود: ابزار Memory Latency را در صفحه Benchmarks يافته و آن را به سادگي با فشار کليد F5 اجرا کنيد. تاخير حافظه شما، نتيجه بالائي در پنجره متني خواهد بود.
ما کار را با آزمايش مجدد Xeon W5580 آغاز کرديم، زيرا يک نسخه جديد از Sandra که از پياده سازي NUMA توسط شرکت اينتل پشتيباني مي کند، به تازگي عرضه شده است. اين نتايج جديد نشان مي دهند که سيستم Xeon W5580 از پهناي باند حافظه به مراتب بالاتر و همچنين تاخير پائين تري در مقايسه با هر يک از سيستمهاي Opteron برخوردار مي باشد. اگر نرم افزارهاي کاربردي متعددي را بطور همزمان اجرا مي کنيد (مثلا بر روي سرورهاي مورد استفاده جهت راه اندازي چند ماشين مجازي) اين نتيجه مي تواند يک ملاحظه مهم براي شما به حساب آيد. با اينحال، شرايط در اينجا بطور يکطرفه اي به نفع اينتل نيست زيرا سيستمهاي قديمي تر Xeon X5482 بوضوح بخاطر حافظه FB-DIMM خود که بطور وحشتناکي کند است، از سايرين عقب افتاده.
Crysis
X3:Terran Conflict
دو پردازنده 6 هسته اي Opteron 2435 بطور نااميد کننده اي در دو آزمايش مقايسه اي ما بازيها ناتوان بودند. اين پردازنده ها در Crysis اندکي سريعتر از پردازنده هاي Opteron 2382 بودند(به ترتيب با نرخ فريم 23/30 در مقابل 21/28). با اينحال، X3:Terran Conflict بر روي سيستم مبتني بر پردازنده هاي Opteron 2382 سريعتر اجرا مي شود. در هر صورت اگر مي خواهيد بازيهائي را بر روي ايستگاه کاري دو پردازنده اي خود اجرا کنيد، يک جفت پردازنده Xeon W5580 يقينا گزينه بسيار بهتري خواهند بود زيرا مي توانند Crysis را با يک نرخ فريم حداقل و متوسط ( به ترتيب) 36 و 47 فريم بر ثانيه اي اجرا کنند. اين سيستم در عين حال در اجراي بازي X3:Terran Conflict نيز بطور قابل ملاحظه اي سريعتر از دو سيستم Opteron مي باشد.
مقايسه هاي Custom PC Media
امتيازها در مقايسه با يک PC مرجع که به يک پردازنده Core 2 Duo E6700 با سرعت اسمي، 2 گيگابايت حافظه DDR2 و يک مادربرد سريع P45 مجهز است، استانداردسازي شده اند. اين PC استاندارد 1000 را به خود اختصاص داده است، بنابراين اگر شما امتياز 1300 را بدست آوريد مي توانيد نتيجه بگيريد که PC شما 30 درصد از سيستم مرجع سريعتر است. از سوي ديگر اگر امتيازي پائين تر از 1000 را بدست آوريد، طبيعتا به اين معني خواهد بود که PC شما از سيستمي با اين مشخصات کندتر مي باشد.
آزمايش GIMP Image Editing
کدگذاري H.264 با Handbrake
عملکرد چند وظيفه اي
امتياز کلي
Cinebench R10
Euler3D
FlamMap
در Euler3D باز هم 4 هسته اضافي و پهناي باند بالاتر سيستم دو پردازنده اي Opteron 2435 با کسب امتياز 4/005 هرتز در مقابل 2/780 هرتز، برتري چشمگيري را نسبت به سيستم دو پردازنده اي Opteron 2382 در اختيار آن قرار داده است. با اينحال، سيستم مبتني بر پردازنده هاي Xeon W5580 که يک هيولا در محاسبات نوع CFD به حساب مي آيد به امتياز نفس گير 6/897 هرتز دست يافته است.
Opteron 2435 شش هسته اي در آزمايش FlamMap نيز بسيار سريعتر از Opteron 2382 بوده است. اين پردازنده ها آزمايش مذکور را در 177 ثانيه به اتمام رسانده اند، در حاليکه پردازنده هاي Opteron 2382 براي تکميل کار خود به 310 ثانيه وقت نياز داشته اند. در اين آزمايش نيز پردازنده هاي Xeon W5580 سريعترين شرکت کنندگان به حساب مي آيند و آزمايش را در 130 ثانيه به اتمام رسانده اند.
LightWave 9.6
در يک وضعيت نااميد کننده، پردازنده هاي Opteron 2435 در آزمايشهاي LightWave 9.6 ما که يک بسته انيميشن و مدلسازي 3 بعدي است، نتيجه بهتري را نسبت به پردازنده هاي Opteron 2382 بدست نياوردند. آنطور که Task manager نشان مي دهد، LightWave 9.6 از هر 12 هسته سيستم Opteron 2435 استفاده مي کرده است و به همين دليل باز هم قادر به تشريح دليل اين نتايج ضعيف نيستيم. به هر حال در اين آزمايش نيز همچنان Xeon W5580 صدرنشين است.
Terragen 2
عليرغم آنکه Terragen2 قادر به پشتيباني بيش از 8 رشته پردازشي نمي باشد، اما سيستم Opteron 2435 در اين آزمايش (که يک صحنه بسيار واقعگرايانه از کوهستان را براي استفاده بعنوان پس زمينه يک فيلم راندو مي کند) توانسته همکار مبتني بر پردازنده هاي Opteron 2382 خود را پشت سر بگذارد. اما شرکت کننده برتر ما در اينجا نيز جايگاه خود را حفظ مي کند.
براي آنکه Terragen2 را وادار نمائيم که بجاي هسته هاي منطقي پردازنده هاي W5580 (مبتني بر فناوري HyperThreading آن) از هسته هاي فيزيکي استفاده کند، آزمايش را پس از غيرفعال نمودن اين فناوري در BIOS سيستم اجرا کرديم. در اين پيکربندي، پردازنده هاي Xeon W5580 به نتيجه بسيار بهتر 8 دقيقه و 43 ثانيه دست يافتند که 15 درصد سريعتر از عملکرد پردازنده هاي Xeon 5482 است.
WPrime32M
براي اجراي اين آزمايش، ابتدا Core Count را بررسي کنيد تا مطمئن شويد که WPrime تمام هسته هاي فيزيکي و مجازي پردازنده ها را تحت فشار کاري قرار خواهد داد. سپس مي توانيد آزمايش 32M را اجرا نمائيد. نتايج بصورت زمان مورد نياز براي محاسبه ريشه دوم مجموعه اعداد (32 ميليون عدد در آزمايش استاندارد) بيان مي شوند. بنابراين، يک امتياز پائين تر در اين آزمايش به معناي عملکرد بهتر خواهد بود.
مصرف برق
در اين پيکربندي، پردازنده هاي Opteron2435 310 وات برق مصرف کردند که با يک کاهش کوچک در مقايسه با 327 وات پردازنده هاي Opteron 2382 همراه بود. اين موضوع زماني تاثيرگذارتر به نظر مي رسد که توجه داشته باشيد سيستم Opteron 2382 داراي 4 هسته بيشتر بوده و RAM آن با فرکانس بالاتري کار مي کند. در مقابل، پردازنده هاي Xeon W5580 با عطش زيادي 386 وات را مصرف مي کنند. هرچند که اين ميزان مصرف برق نسبتا بالا به نظر مي رسد، اما عملکرد بسيار بهتر پردازنده هاي Xeon W5580 در مقايسه با رقبايش به معناي آن است که از بازدهي انرژي بهتري برخوردار مي باشد، زيرا با اين سيستم شما مي توانيد کارهاي خود را سريعتر به اتمام برسانيد.
کلام آخر
با اينحال، در حاليکه مصرف برق نسبتا پائين پردازنده هاي Opteron 2435 مي تواند جذابيت آنها را براي گروهي که در حال ارتقاء يک Data-Center با محدوديت مصرف برق هستند افزايش دهد، اما شيوه محدودسازي مصنوعي عملکرد اين پردازنده ها توسط AMD از طريق پائين نگهداشتن فرکانس کاري آنها به اين معني خواهد بود که خريد جذابي براي يک ايستگاه کاري يا سرورHPC به حساب نمي آيند.
در چنين سناريوهائي، مهمترين عامل اين است که چه مقدار قدر پردازشي را مي توانيد در يک جعبه واحد جاي دهيد. بر اساس اين معيار بايد بگوئيم که Xeon W5580 يک گزينه بي رقيب به حساب مي آيد، خصوصا حالا که قيمت آنها بطور قابل ملاحظه اي کاهش يافته است.
منبع:بزرگراه رايانه، شماره 121.
/ج