APU، سيستم پردازشي با قابليتهاي اضافي
AMD هرگز نتوانسته در زمينه حجم فروش CPU بر اينتل غلبه پيدا كند. با اينحال، واقعيت مذكور به هيچوجه به معناي آن نيست كه شركت AMD نقش ثانويهاي را در دنياي پردازندههاي x86 ايفا ميكند. در واقع بارها اتفاق افتاده كه نوآوريهاي اين شركت در زمينه توسعه معماري ريزپردازندههاي x86 خودش در نهايت به يك گرايش بازاري در سطح جهان تبديل شده و حتي اينتل نيز چارهاي جز پذيرش آنها نداشته است. در واقع اين AMD بود كه ضمايم 64 بيتي را براي معماري x86 توسعه داد و در عين حال اولين توليدكنندهاي بود كه آنها را در محصولات واقعي پيادهسازي كرد. حالا همين ضمايم به يك بخش جدايي ناپذير از معماري ريزپردازندهها تبديل شدهاند. همچنين، AMD اولين شركتي بود كه ايده ادغام پردازنده و پل شمالي چيپست را مطرح كرد و همچنين اولين توليدكنندهاي بود كه كنترلر حافظه را به داخل پردازنده انتقال داد. تمام اين موارد و بسياري مثالهاي ديگر نشان ميدهند كه دومين توليدكننده بزرگ بازار ريزپردازندهها اصلا در حاشيه قرار نگرفته، بلكه پتانسيل تكنولوژيكي و مهندسي عظيمي را نيز به نمايش ميگذارد.
چند سال پيش، اين پتانسيل با تصاحب شركت ATI Technologies تقويت شد و دسترسي به فناوريهاي صدرنشين گرافيكي را در اختيار AMD قرار داد. اين فناوريها به AMD كمك كردند تا به نوآوريهاي چشمگيرتري دست پيدا كند كه APU يكي از آنها است. APU يا Accelerated Processing Unit كه در ابتدا بهعنوان يك اصطلاح عمومي مورد استفاده قرار ميگرفت، يك سيستم پردازشي با قابليتهاي اضافي است كه براي شتابدهي يك يا چند نوع از محاسبات خارج از يك CPU طراحي شده است. امروزه بيشتر APUها بهعنوان يك ابزار پردازشي توصيف ميشوند كه در آنها يك CPU و GPU روي يك die واحد تركيب شدهاند. اين تركيب، نرخ انتقال داده مابين مولفههاي مذكور را بهبود بخشيده و در عين حال مصرف برق كلي سيستم را كاهش ميدهد. APUها در عين حال ميتوانند شامل شتابدهندههاي پردازش ويديويي يا ساير شتابدهندهها با كاربردهاي خاص باشند. AMD Fusion، IBM CELL و Intel HD Graphics همگي مثالهايي از APUها بهشمار ميآيند. ما در اين مقاله به بحث در مورد AMD Fusion خواهيم پرداخت.
همانطور كه توضيح داديم، ايده پشت Fusion شامل تركيب هستههاي محاسباتي سنتي با يك هسته گرافيكي است كه انبوهي از پردازندههاي جريان با قابليت پردازش كارامد محاسبات موازي را در بر ميگيرد. اين روزها يك پردازنده با هسته گرافيكي مجتمع به هيچوجه يك موضوع غافلگير كننده بهشمار نميآيد. در واقع اينتل مدتي است كه چنين محصولاتي را روانه بازار كرده است.با اينحال، AMD يك روش متفاوت را براي همزيستي هستههاي محاسباتي و گرافيكي انتخاب كرده. به گفته مهندسين اين شركت، هسته گرافيكي صرفا نبايد مسئوليت نمايش تصوير روي مانيتور را بر عهده داشته باشد. در واقع اين هسته در عين حال بايد با توابع عمومي پردازنده نيز درگير شود.
معماري هستههاي گرافيكي معاصر به آنها امكان ميدهد تا آرايههاي بزرگي از دادهها را بهطور موازي پردازش كنند. بنابراين، ذخيره محاسباتي هسته گرافيكي قادر است بهطور كارامدي در وظايف مختلف نظير پردازش تصوير و ويديو، الگوريتمهاي رمزنگاري و حل مسايل علمي درگير شود. البته فرآيند مذكور مستلزم آن است كه نرمافزارهاي موجود بهطور صحيحي بهينهسازي شوند.اولين نسل از محصولات مبتني بر مفهوم Fusion مدتي است كه روانه بازار شدهاند. در واقع پردازندههايي كه با اسامي رمز Ontario و Zacate شناخته ميشوند و به سريهاي E و C محصولات AMD تعلق دارند، كارايي خود را در سيستمهاي موبايل و دسكتاپ ارزانقيمت مبتني بر پلتفرم Brazos به اثبات رساندهاند. با اينحال، پردازندههاي مذكور در اصل براي سيستمهاي فشرده و كممصرف در نظر گرفته شده بودند و به همين دليل عملكرد نسبتا پايين را با حوزههاي كاربرد بسيار محدود ارايه ميكردند. كاملا واضح است كه AMD براي آنكه بتواند مفهوم Fusion را به يك پذيرش جهاني برساند، به پلتفرمها و پردازندههاي عمومي بيشتري با سطح عملكرد مناسب در اين بازار نياز دارد. بنابراين، AMD پس از Brazos دو پلتفرم جديد Fusion را معرفي كرد: Sabine موبايل و Lynx دسكتاپ. هر دو پلتفرم مذكور مبتني بر پردازندههاي جديد سري A هستند كه با اسم رمز Llano شناخته ميشوند. قرار است Llano يكي از مدافعان اصلي شهرت Fusion در بازار پردازندههاي عمومي باشد.اجازه بدهيد نگاه دقيقتري به اولين پردازندههاي Llano انداخته و ببينيم آيا ما همانقدر كه AMD پافشاري ميكند به يك معماري پيوندي انقلابي نياز داريم يا خير.
از سوي ديگر، با وجود آنكه Llano دومين پردازنده در خانواده Fusion بهشمار ميآيد، اما ساختار كلي اين پردازنده تنها نكته جديد درباره آن است. بهعبارت ديگر، كل APU جديد صرفا با استفاده از مولفههاي قديمي و با حداقل نوآوري تركيب شده است. اگر قرار بود اين محصول جديد را بدون بحث عميق در مورد ويژگيهاي آن توصيف كنيم، ميتوانستيم بگوييم كه Llano تركيبي از يك پردازنده Athlon II X4، هسته گرافيكي Radeon HD 5570 و چيپست AMD 870 است كه در داخل يك بستهبندي مشترك روي يك die نيمههادي واحد قرار گرفتهاند. البته اين توضيح كاملا نسبي است زيرا پردازنده جديد Llano از نوآوريهاي محدود و پيادهسازيهاي فني منحصربهفردي را نيز به همراه دارد، اما بهطور كلي هيچ نكته جديدي در اين APU به چشم نميخورد.
بهطور كلي ميتوان گفت اين واقعيت كه چند واحد بسيار پيچيده در داخل يك die نيمههادي واحد در كنار يكديگر قرار گرفتهاند، به نوبه خود يك قدم جدي به سمت جلو محسوب ميشود. اينكار تنها با بهرهگيري از فناوري پردازش بسيار ظريف 32 نانومتري امكانپذير شده است كه شريك توليدي AMD يعني GlobalFoundries سرانجام به اندازه كافي در آن مهارت پيدا كرده. به اين ترتيب AMD حالا پردازندههايي را ارايه ميكند كه با آخرين فناوري پردازش موجود توليد شدهاند، كاري كه اينتل نزديك به يكسال قبل انجام داده بود.پيچيدگي داخلي die نيمههادي Llano به 1,45 ميليارد ترانزيستور رسيده است. از اين نظر، پردازندههاي پيوندي جديد AMD اندكي از پردازندههاي Sandy Bridge اينتل پيشي گرفتهاند. با اينحال، اندازه die هر دو پردازنده مذكور بسيار به يكديگر نزديك است (228 در مقابل 216 ميليمتر مربع). بهعبارت ديگر، اين پردازندهها داراي هزينه توليد قابل مقايسهاي هستند، البته اگر اين واقعيت را ناديده بگيريم كه تيم مهندسي اينتل تلاش بسيار بيشتري را براي توسعه و بهسازي Sandy Bridge صرف كرده است.
با اينحال، شباهت دو پردازنده AMD و اينتل در همينجا به پايان ميرسد زيرا توزيع «موجودي ترانزيستور» در آنها بهطور چشمگيري با يكديگر تفاوت دارد. در حالي كه محصول اينتل بيشتر يك CPU با يك هسته گرافيكي مجتمع است كه چيزي بيشتر از 20 درصد die آن را اشغال نميكند، Llano تاكيد بسيار بيشتري بر هسته گرافيكي خود دارد. به همين دليل، هسته گرافيكي اين پردازنده همان مقدار فضايي را در die نيمههادي اشغال ميكند كه به مجموعه چهار هسته پردازنده آن اختصاص داده شده.اين وضعيت بهطور كلي آنچه كه پردازنده Llano ميتواند در اختيار كاربران قرار دهد را آشكار ميسازد. در واقع AMD تمركز خود را روي چيزي گذاشته كه در حال حاضر به بهترين شكل ممكن ميتواند تحويل دهد: هسته گرافيكي. هستههاي پردازنده فعلا در يك جايگاه ثانويه قرار ميگيرند و به همين دليل است كه موفقيت پردازنده تا حدود زيادي با موفقيت كلي مفهوم Fusion ارتباط دارد. اگر AMD واقعا بتواند بار عملياتي اصلي را به پردازندههاي جريان GPU انتقال دهد، Llano بدون ترديد وضعيت برتري را نسبت به تمام رقباي موجود خود پيدا خواهد كرد. با اينحال، هنوز براي قضاوت در اين مورد بسيار زود است زيرا اكثر نرمافزارهاي موجود هنوز به روش قديمي يعني تكيه بر هستههاي پردازنده x86 سنتي كار ميكنند.
در عين حال، مهندسين AMD تلاش كردهاند تا ريزمعماري جديد خود را از بعضي جنبهها نوسازي كرده و عملكرد هستههاي Husky را حداقل نسبت به هستههاي داخل پردازندههاي Athlon II و Phenom II بهبود بخشند. واقعيت اين است كه دستيابي به اين هدف بسيار آسان بوده: صرفا با افزايش حافظه كاشه L2. به اين ترتيب، اكنون هر يك از هستههاي Llano به يك كاشه L2 يك مگابايتي مخصوص خودش مجهز شده. با اينحال، پردازنده جديد مطلقا فاقد كاشه L3 اشتراكي خواهد بود و به همين دليل مجموعه اندازه حافظه كاشه آن بر اساس استانداردهاي امروزي چندان بزرگ به نظر نميرسد.گذشته از افزايش كاشه، هستههاي Husky داراي يك واحد پيشبيني انشعاب بهبود يافته و بافرهاي اصلي بهينهسازي شده هستند: بافر بازچيني دستورالعملها اكنون 20 درصد بزرگتر شده و اندازه بافرهاي Load/Store نيز تا دو برابر افزايش پيدا كرده. بهعلاوه، Husky داراي يك مقسم (Divider) سختافزاري جداگانه است كه عمليات متناظر با آن را شتابدهي خواهد كرد. همانطور كه ميبينيد، تغييرات چنداني در ساختار پردازنده اعمال نشده است. پايه معماري K10 كاملا بدون تغيير باقي مانده و به همين دليل است كه Husky نميتواند چيزي بيش از 3 دستورالعمل را در هر سيكل كلاك خود پردازش كند (درست مثل تمام هستههاي قبلي).
در مقايسه با Redwood اصلي، تنها دو تغيير مهم در Sumo اعمال شدهاند. اول آنكه اينترفيس حافظه اصلاح شده تا تضمين كند GPU قادر است از طريق پل شمالي (و نه بهطور مستقيم) با DDR3 SDRAM دوكاناله كار كند. كار با زيرسيستم حافظه، يكي از گلوگاههاي سنتي هستههاي گرافيكي مجتمع بهشمار ميآيد و به همين دليل وقتي يك GPU سريع در داخل يك APU جديد قرار ميگيرد، بايد بعضي بهينهسازيها روي آن انجام شوند. متاسفانه Llano هيچ چيزي شبيه گذرگاه Ring اينتل ندارد و Sumo نميتواند از حافظه كاشه براي نيازهاي خودش استفاده كند. با اينحال، هسته مذكور از يك ويژگي متفاوت بهره ميگيرد كه براي يك هسته گرافيكي كاملا جديد است: اين هسته اكنون ميتواند بدون دخالت هستههاي پردازنده، دادهها را در حافظه سيستم بنويسد. بهعلاوه، تمام عمليات هسته گرافيكي با حافظه در پردازندههاي Llano از اولويت بالاتري نسبت به درخواستهاي هستههاي محاسباتي برخوردارند و به همين دليل كنترلر حافظه ابتدا آنها را پردازش ميكند.دومين تغيير مهم اين است كه واحد UVDم (Unified Video Decoder) در هسته Sumo با يك نسخه جديدتر جايگزين شده. سومين نسخه UVD در پردازندههاي Llano از تمام فرمتهاي ويديويي محبوب HD پشتيباني ميكند و باMVCم (Multi-View Codec) كه براي ويديوي 3 بعدي مورد استفاده قرار ميگيرد نيز سازگار است. بنابراين، پلتفرم Lynx برخلاف Brazos ميتواند 3D Blu-ray را از طريق اينترفيس HDMI پخش كند. بهعلاوه، UVD3 از بازدهي انرژي بهتري برخوردار است و ميتواند بهطور مستقل از ساير بخشهاي GPU كار كند. اين قابليت، امكان خاموش كردن پردازندههاي جريان در طول پخش ويديويي را فراهم خواهد كرد.
تغييراتي كه در بالا به آنها اشاره كرديم، به AMD امكان ميدهند تا از يك نام بازاري سري 6000 براي هسته گرافيكي Sumo خود استفاده كند. بنابراين بر حسب تعداد پردازندههاي جريان داخلي، Llano ميتواند به يك Radeon HD 6550D يا Radeon HD 6530D مجهز شده باشد.وجود يك معادل مجتمع از كارت گرافيكي Radeon 5570 ميتواند ويژگي وسوسهانگيزي باشد، اما براي همه مناسب نخواهد بود. بنابراين AMD امكان ارتقاي شتابدهنده داخلي APU خود با بهرهگيري از فناوري CrossFire را فراهم كرده است. در اين حالت، فناوري مذكور تحت عنوان Dual Graphics شناخته ميشود و امكان تركيب GPU مجتمع با يك كارت گرافيكي Radeon الحاقي را براي ايجاد يك پيكربندي نامتقارن CrossFire بهوجود ميآورد.
اين فناوري واقعا تاثيرگذار است زيرا يك سيستم Dual Graphics ميتواند يك كارت گرافيكي از هر نوعي را بپذيرد. با اينحال، اين تنوعپذيري با مشكلاتي نيز همراه خواهد بود. پيش از هر چيز، شما تنها در صورتي ميتوانيد عملكرد گرافيكي خود را بهبود بخشيد كه شتابدهنده الحاقي بيش از دو برابر سريعتر از هسته Sumo مجتمع APU مورد استفادهتان نباشد. بهعبارت ديگر، اگر يك Radeon HD 6850 داشته باشيد، استفاده از آن بهعنوان يك كارت الحاقي مستقل و غيرفعال كردن هسته گرافيكي مجتمع بهطور كامل، بسيار منطقيتر به نظر ميرسد. محدوديت دوم حتي از اين نيز جديتر است. حالتهاي نامتقارن CrossFire تنها در DirectX 10/11 كار ميكنند و به همين دليل Dual Graphics در بازيهاي مبتني بر DirectX 9 يا OpenGL نه تنها هيچ مزيتي را به همراه نخواهد داشت، بلكه عملكرد تا سطح كندترين GPU سيستم تنزل خواهد كرد. با اينحال، Dual Graphics يك شيوه عالي براي صرفهجويي در هزينهها را در اختيار كاربران قرار ميدهد كه باعث ميشود Llano به يك گزينه فوقالعاده براي سيستمهاي بازي سطح پايين تبديل گردد.
هسته گرافيكي بهوضوح به پهناي باند بالايي از گذرگاه حافظه نياز دارد. حتي خود AMD نيز به اين نكته اشاره ميكند كه استفاده از حافظه DDR3-1333 ميتواند عملكرد هسته گرافيكي مجتمع را بهطور چشمگيري كاهش دهد. با اينحال، پشتيباني از حافظه سريع بهعنوان خصوصيت اصلي پل شمالي در نظر گرفته نميشود. نكته بسيار جالبتر درباره اين پل شمالي، مسيرهاي داده جديد آن هستند كه عملكرد مولفههاي گرافيكي APU را بهينهسازي ميكنند. در كنار لينك سنتي مابين CPU و پل شمالي، Llano داراي دو اتصال گذرگاه اضافي مابين GPU و پل شمالي خود است.اتصال اول كه تحت عنوان Radeon Memory Bus شناخته ميشود، براي كاربردهاي گرافيكي عمومي مورد استفاده قرار ميگيرد. پهناي باند اين گذرگاه معادل 29,8 گيگابيت بر ثانيه است كه مشابه نرخ انتقال داده حافظههاي DDR3-1866 خواهد بود. درخواستهاي حافظهاي كه از اين گذرگاه عبور ميكنند داراي بالاترين اولويت هستند و كنترلر حافظه آنها را حتي پيش از درخواستهاي پردازنده پاسخ ميدهد.
اولين نكتهاي كه توجه شما را به خود جلب ميكند، اين است كه سرعتهاي كلاك Llano بهوضوح پايينتر از سطحي است كه پردازندههاي Athlon II و Phenom II به آن دست يافتهاند. اين نكته به معناي آن است كه سري Llano شامل پردازندههاي كندتري خواهد بود كه مزيت اصلي آنها عملكرد هستههاي x86 نيست، بلكه عملكرد هسته گرافيكيشان است. بنابراين ارتقا از يك پلتفرم AM3 به يك پلتفرم سوكت FM1 تنها زماني منطقي خواهد بود كه بهدنبال بازدهي انرژي بهتر باشيد، نه دستيابي به عملكرد بالاتر.
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb
چند سال پيش، اين پتانسيل با تصاحب شركت ATI Technologies تقويت شد و دسترسي به فناوريهاي صدرنشين گرافيكي را در اختيار AMD قرار داد. اين فناوريها به AMD كمك كردند تا به نوآوريهاي چشمگيرتري دست پيدا كند كه APU يكي از آنها است. APU يا Accelerated Processing Unit كه در ابتدا بهعنوان يك اصطلاح عمومي مورد استفاده قرار ميگرفت، يك سيستم پردازشي با قابليتهاي اضافي است كه براي شتابدهي يك يا چند نوع از محاسبات خارج از يك CPU طراحي شده است. امروزه بيشتر APUها بهعنوان يك ابزار پردازشي توصيف ميشوند كه در آنها يك CPU و GPU روي يك die واحد تركيب شدهاند. اين تركيب، نرخ انتقال داده مابين مولفههاي مذكور را بهبود بخشيده و در عين حال مصرف برق كلي سيستم را كاهش ميدهد. APUها در عين حال ميتوانند شامل شتابدهندههاي پردازش ويديويي يا ساير شتابدهندهها با كاربردهاي خاص باشند. AMD Fusion، IBM CELL و Intel HD Graphics همگي مثالهايي از APUها بهشمار ميآيند. ما در اين مقاله به بحث در مورد AMD Fusion خواهيم پرداخت.
همانطور كه توضيح داديم، ايده پشت Fusion شامل تركيب هستههاي محاسباتي سنتي با يك هسته گرافيكي است كه انبوهي از پردازندههاي جريان با قابليت پردازش كارامد محاسبات موازي را در بر ميگيرد. اين روزها يك پردازنده با هسته گرافيكي مجتمع به هيچوجه يك موضوع غافلگير كننده بهشمار نميآيد. در واقع اينتل مدتي است كه چنين محصولاتي را روانه بازار كرده است.با اينحال، AMD يك روش متفاوت را براي همزيستي هستههاي محاسباتي و گرافيكي انتخاب كرده. به گفته مهندسين اين شركت، هسته گرافيكي صرفا نبايد مسئوليت نمايش تصوير روي مانيتور را بر عهده داشته باشد. در واقع اين هسته در عين حال بايد با توابع عمومي پردازنده نيز درگير شود.
معماري هستههاي گرافيكي معاصر به آنها امكان ميدهد تا آرايههاي بزرگي از دادهها را بهطور موازي پردازش كنند. بنابراين، ذخيره محاسباتي هسته گرافيكي قادر است بهطور كارامدي در وظايف مختلف نظير پردازش تصوير و ويديو، الگوريتمهاي رمزنگاري و حل مسايل علمي درگير شود. البته فرآيند مذكور مستلزم آن است كه نرمافزارهاي موجود بهطور صحيحي بهينهسازي شوند.اولين نسل از محصولات مبتني بر مفهوم Fusion مدتي است كه روانه بازار شدهاند. در واقع پردازندههايي كه با اسامي رمز Ontario و Zacate شناخته ميشوند و به سريهاي E و C محصولات AMD تعلق دارند، كارايي خود را در سيستمهاي موبايل و دسكتاپ ارزانقيمت مبتني بر پلتفرم Brazos به اثبات رساندهاند. با اينحال، پردازندههاي مذكور در اصل براي سيستمهاي فشرده و كممصرف در نظر گرفته شده بودند و به همين دليل عملكرد نسبتا پايين را با حوزههاي كاربرد بسيار محدود ارايه ميكردند. كاملا واضح است كه AMD براي آنكه بتواند مفهوم Fusion را به يك پذيرش جهاني برساند، به پلتفرمها و پردازندههاي عمومي بيشتري با سطح عملكرد مناسب در اين بازار نياز دارد. بنابراين، AMD پس از Brazos دو پلتفرم جديد Fusion را معرفي كرد: Sabine موبايل و Lynx دسكتاپ. هر دو پلتفرم مذكور مبتني بر پردازندههاي جديد سري A هستند كه با اسم رمز Llano شناخته ميشوند. قرار است Llano يكي از مدافعان اصلي شهرت Fusion در بازار پردازندههاي عمومي باشد.اجازه بدهيد نگاه دقيقتري به اولين پردازندههاي Llano انداخته و ببينيم آيا ما همانقدر كه AMD پافشاري ميكند به يك معماري پيوندي انقلابي نياز داريم يا خير.
درون Llano
از سوي ديگر، با وجود آنكه Llano دومين پردازنده در خانواده Fusion بهشمار ميآيد، اما ساختار كلي اين پردازنده تنها نكته جديد درباره آن است. بهعبارت ديگر، كل APU جديد صرفا با استفاده از مولفههاي قديمي و با حداقل نوآوري تركيب شده است. اگر قرار بود اين محصول جديد را بدون بحث عميق در مورد ويژگيهاي آن توصيف كنيم، ميتوانستيم بگوييم كه Llano تركيبي از يك پردازنده Athlon II X4، هسته گرافيكي Radeon HD 5570 و چيپست AMD 870 است كه در داخل يك بستهبندي مشترك روي يك die نيمههادي واحد قرار گرفتهاند. البته اين توضيح كاملا نسبي است زيرا پردازنده جديد Llano از نوآوريهاي محدود و پيادهسازيهاي فني منحصربهفردي را نيز به همراه دارد، اما بهطور كلي هيچ نكته جديدي در اين APU به چشم نميخورد.
بهطور كلي ميتوان گفت اين واقعيت كه چند واحد بسيار پيچيده در داخل يك die نيمههادي واحد در كنار يكديگر قرار گرفتهاند، به نوبه خود يك قدم جدي به سمت جلو محسوب ميشود. اينكار تنها با بهرهگيري از فناوري پردازش بسيار ظريف 32 نانومتري امكانپذير شده است كه شريك توليدي AMD يعني GlobalFoundries سرانجام به اندازه كافي در آن مهارت پيدا كرده. به اين ترتيب AMD حالا پردازندههايي را ارايه ميكند كه با آخرين فناوري پردازش موجود توليد شدهاند، كاري كه اينتل نزديك به يكسال قبل انجام داده بود.پيچيدگي داخلي die نيمههادي Llano به 1,45 ميليارد ترانزيستور رسيده است. از اين نظر، پردازندههاي پيوندي جديد AMD اندكي از پردازندههاي Sandy Bridge اينتل پيشي گرفتهاند. با اينحال، اندازه die هر دو پردازنده مذكور بسيار به يكديگر نزديك است (228 در مقابل 216 ميليمتر مربع). بهعبارت ديگر، اين پردازندهها داراي هزينه توليد قابل مقايسهاي هستند، البته اگر اين واقعيت را ناديده بگيريم كه تيم مهندسي اينتل تلاش بسيار بيشتري را براي توسعه و بهسازي Sandy Bridge صرف كرده است.
با اينحال، شباهت دو پردازنده AMD و اينتل در همينجا به پايان ميرسد زيرا توزيع «موجودي ترانزيستور» در آنها بهطور چشمگيري با يكديگر تفاوت دارد. در حالي كه محصول اينتل بيشتر يك CPU با يك هسته گرافيكي مجتمع است كه چيزي بيشتر از 20 درصد die آن را اشغال نميكند، Llano تاكيد بسيار بيشتري بر هسته گرافيكي خود دارد. به همين دليل، هسته گرافيكي اين پردازنده همان مقدار فضايي را در die نيمههادي اشغال ميكند كه به مجموعه چهار هسته پردازنده آن اختصاص داده شده.اين وضعيت بهطور كلي آنچه كه پردازنده Llano ميتواند در اختيار كاربران قرار دهد را آشكار ميسازد. در واقع AMD تمركز خود را روي چيزي گذاشته كه در حال حاضر به بهترين شكل ممكن ميتواند تحويل دهد: هسته گرافيكي. هستههاي پردازنده فعلا در يك جايگاه ثانويه قرار ميگيرند و به همين دليل است كه موفقيت پردازنده تا حدود زيادي با موفقيت كلي مفهوم Fusion ارتباط دارد. اگر AMD واقعا بتواند بار عملياتي اصلي را به پردازندههاي جريان GPU انتقال دهد، Llano بدون ترديد وضعيت برتري را نسبت به تمام رقباي موجود خود پيدا خواهد كرد. با اينحال، هنوز براي قضاوت در اين مورد بسيار زود است زيرا اكثر نرمافزارهاي موجود هنوز به روش قديمي يعني تكيه بر هستههاي پردازنده x86 سنتي كار ميكنند.
هسته پردازنده Husky
در عين حال، مهندسين AMD تلاش كردهاند تا ريزمعماري جديد خود را از بعضي جنبهها نوسازي كرده و عملكرد هستههاي Husky را حداقل نسبت به هستههاي داخل پردازندههاي Athlon II و Phenom II بهبود بخشند. واقعيت اين است كه دستيابي به اين هدف بسيار آسان بوده: صرفا با افزايش حافظه كاشه L2. به اين ترتيب، اكنون هر يك از هستههاي Llano به يك كاشه L2 يك مگابايتي مخصوص خودش مجهز شده. با اينحال، پردازنده جديد مطلقا فاقد كاشه L3 اشتراكي خواهد بود و به همين دليل مجموعه اندازه حافظه كاشه آن بر اساس استانداردهاي امروزي چندان بزرگ به نظر نميرسد.گذشته از افزايش كاشه، هستههاي Husky داراي يك واحد پيشبيني انشعاب بهبود يافته و بافرهاي اصلي بهينهسازي شده هستند: بافر بازچيني دستورالعملها اكنون 20 درصد بزرگتر شده و اندازه بافرهاي Load/Store نيز تا دو برابر افزايش پيدا كرده. بهعلاوه، Husky داراي يك مقسم (Divider) سختافزاري جداگانه است كه عمليات متناظر با آن را شتابدهي خواهد كرد. همانطور كه ميبينيد، تغييرات چنداني در ساختار پردازنده اعمال نشده است. پايه معماري K10 كاملا بدون تغيير باقي مانده و به همين دليل است كه Husky نميتواند چيزي بيش از 3 دستورالعمل را در هر سيكل كلاك خود پردازش كند (درست مثل تمام هستههاي قبلي).
معماري بهينهسازي شده STARS
هسته گرافيكي Sumo
در مقايسه با Redwood اصلي، تنها دو تغيير مهم در Sumo اعمال شدهاند. اول آنكه اينترفيس حافظه اصلاح شده تا تضمين كند GPU قادر است از طريق پل شمالي (و نه بهطور مستقيم) با DDR3 SDRAM دوكاناله كار كند. كار با زيرسيستم حافظه، يكي از گلوگاههاي سنتي هستههاي گرافيكي مجتمع بهشمار ميآيد و به همين دليل وقتي يك GPU سريع در داخل يك APU جديد قرار ميگيرد، بايد بعضي بهينهسازيها روي آن انجام شوند. متاسفانه Llano هيچ چيزي شبيه گذرگاه Ring اينتل ندارد و Sumo نميتواند از حافظه كاشه براي نيازهاي خودش استفاده كند. با اينحال، هسته مذكور از يك ويژگي متفاوت بهره ميگيرد كه براي يك هسته گرافيكي كاملا جديد است: اين هسته اكنون ميتواند بدون دخالت هستههاي پردازنده، دادهها را در حافظه سيستم بنويسد. بهعلاوه، تمام عمليات هسته گرافيكي با حافظه در پردازندههاي Llano از اولويت بالاتري نسبت به درخواستهاي هستههاي محاسباتي برخوردارند و به همين دليل كنترلر حافظه ابتدا آنها را پردازش ميكند.دومين تغيير مهم اين است كه واحد UVDم (Unified Video Decoder) در هسته Sumo با يك نسخه جديدتر جايگزين شده. سومين نسخه UVD در پردازندههاي Llano از تمام فرمتهاي ويديويي محبوب HD پشتيباني ميكند و باMVCم (Multi-View Codec) كه براي ويديوي 3 بعدي مورد استفاده قرار ميگيرد نيز سازگار است. بنابراين، پلتفرم Lynx برخلاف Brazos ميتواند 3D Blu-ray را از طريق اينترفيس HDMI پخش كند. بهعلاوه، UVD3 از بازدهي انرژي بهتري برخوردار است و ميتواند بهطور مستقل از ساير بخشهاي GPU كار كند. اين قابليت، امكان خاموش كردن پردازندههاي جريان در طول پخش ويديويي را فراهم خواهد كرد.
تغييراتي كه در بالا به آنها اشاره كرديم، به AMD امكان ميدهند تا از يك نام بازاري سري 6000 براي هسته گرافيكي Sumo خود استفاده كند. بنابراين بر حسب تعداد پردازندههاي جريان داخلي، Llano ميتواند به يك Radeon HD 6550D يا Radeon HD 6530D مجهز شده باشد.وجود يك معادل مجتمع از كارت گرافيكي Radeon 5570 ميتواند ويژگي وسوسهانگيزي باشد، اما براي همه مناسب نخواهد بود. بنابراين AMD امكان ارتقاي شتابدهنده داخلي APU خود با بهرهگيري از فناوري CrossFire را فراهم كرده است. در اين حالت، فناوري مذكور تحت عنوان Dual Graphics شناخته ميشود و امكان تركيب GPU مجتمع با يك كارت گرافيكي Radeon الحاقي را براي ايجاد يك پيكربندي نامتقارن CrossFire بهوجود ميآورد.
اين فناوري واقعا تاثيرگذار است زيرا يك سيستم Dual Graphics ميتواند يك كارت گرافيكي از هر نوعي را بپذيرد. با اينحال، اين تنوعپذيري با مشكلاتي نيز همراه خواهد بود. پيش از هر چيز، شما تنها در صورتي ميتوانيد عملكرد گرافيكي خود را بهبود بخشيد كه شتابدهنده الحاقي بيش از دو برابر سريعتر از هسته Sumo مجتمع APU مورد استفادهتان نباشد. بهعبارت ديگر، اگر يك Radeon HD 6850 داشته باشيد، استفاده از آن بهعنوان يك كارت الحاقي مستقل و غيرفعال كردن هسته گرافيكي مجتمع بهطور كامل، بسيار منطقيتر به نظر ميرسد. محدوديت دوم حتي از اين نيز جديتر است. حالتهاي نامتقارن CrossFire تنها در DirectX 10/11 كار ميكنند و به همين دليل Dual Graphics در بازيهاي مبتني بر DirectX 9 يا OpenGL نه تنها هيچ مزيتي را به همراه نخواهد داشت، بلكه عملكرد تا سطح كندترين GPU سيستم تنزل خواهد كرد. با اينحال، Dual Graphics يك شيوه عالي براي صرفهجويي در هزينهها را در اختيار كاربران قرار ميدهد كه باعث ميشود Llano به يك گزينه فوقالعاده براي سيستمهاي بازي سطح پايين تبديل گردد.
پل شمالي
هسته گرافيكي بهوضوح به پهناي باند بالايي از گذرگاه حافظه نياز دارد. حتي خود AMD نيز به اين نكته اشاره ميكند كه استفاده از حافظه DDR3-1333 ميتواند عملكرد هسته گرافيكي مجتمع را بهطور چشمگيري كاهش دهد. با اينحال، پشتيباني از حافظه سريع بهعنوان خصوصيت اصلي پل شمالي در نظر گرفته نميشود. نكته بسيار جالبتر درباره اين پل شمالي، مسيرهاي داده جديد آن هستند كه عملكرد مولفههاي گرافيكي APU را بهينهسازي ميكنند. در كنار لينك سنتي مابين CPU و پل شمالي، Llano داراي دو اتصال گذرگاه اضافي مابين GPU و پل شمالي خود است.اتصال اول كه تحت عنوان Radeon Memory Bus شناخته ميشود، براي كاربردهاي گرافيكي عمومي مورد استفاده قرار ميگيرد. پهناي باند اين گذرگاه معادل 29,8 گيگابيت بر ثانيه است كه مشابه نرخ انتقال داده حافظههاي DDR3-1866 خواهد بود. درخواستهاي حافظهاي كه از اين گذرگاه عبور ميكنند داراي بالاترين اولويت هستند و كنترلر حافظه آنها را حتي پيش از درخواستهاي پردازنده پاسخ ميدهد.
پلتفرمهاي پشتيباني كننده از Llano
پردازندههاي Llano
اولين نكتهاي كه توجه شما را به خود جلب ميكند، اين است كه سرعتهاي كلاك Llano بهوضوح پايينتر از سطحي است كه پردازندههاي Athlon II و Phenom II به آن دست يافتهاند. اين نكته به معناي آن است كه سري Llano شامل پردازندههاي كندتري خواهد بود كه مزيت اصلي آنها عملكرد هستههاي x86 نيست، بلكه عملكرد هسته گرافيكيشان است. بنابراين ارتقا از يك پلتفرم AM3 به يك پلتفرم سوكت FM1 تنها زماني منطقي خواهد بود كه بهدنبال بازدهي انرژي بهتر باشيد، نه دستيابي به عملكرد بالاتر.
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb
/ج