انقلاب شبکه های ذخیره سازی اطلاعات و درک مزایای آن
نويسنده: مهدی خزاعی
●مقدمه:
به عنوان یک کاربر خانگی کنجکاو و اهل مطالعه، یک دانشجو، مدیر بازرگانی یک شرکت که از ابزارهای ارتباطی جدید IT برای پیشبرد و تسهیل هرچه بیشتر و مؤثرتر فعالیت های خود استفاده می کند، کارشناس فنی یک سازمان دولتی یا خصوصی که مشترک رایگان ماهنامه می باشد، مجله را باز می کنید. ابتدا آگهی های آن را تک تک ورق زده و از مشاهده محصولات جدید و جذابی مثل هاردهای اکسترنال با ظرفیت های ترابایتی، کارت های گرافیکی قدرتمند نسل جدید، دیتا پروژکتورهای خانگی جمع و جور و زیبا و ... لذت می برید. سرعت حیرت انگیز رشد و تحول فناوری اطلاعات و به تبع آن، میزان بالای اطلاعات موجود در پیام های بازرگانی این حوزه از صنعت، سبب گردیده تا بر خلاف برخورد معمول فرار از آگهی، خوانندگان، خود با هدف رصد اوضاع بازار و شناسایی محصولاتی با امکانات جدید، با میل و رغبت به مشاهده آگهی ها بپردازند. اما در این بین، آگهی هایی وجود دارند که شاید هیچگونه درکی از مفاهیم و واژه های بکار رفته در آن نداشته باشید. مثلاً آگهی هایی که در آنها از سرواژه ها و عباراتی ناآشنا همچون، SAN، Server Server Consolidation، Server Virtualization، JBOD، DAS، NAS و ... استفاده شده باشد.آیا این آگهی ها حاوی پیام مناسبی برای شما هستند؟ چگونه می توانید پیام آنها را رمزگشایی کنید. شاید بگویید، محصولات و خدمات این شرکت ها، صرفاً حوزه نیازهای شبکه های بزرگ مقیاس را در بر می گیرد و برای یک کاربر ساده، یک شرکت کوچک، یا حتی یک سازمان متوسط، محصول یا خدماتی قابل ارائه در بر نداشته باشند.
اما واقعیت چیز دیگری است. اطلاعات با آنچنان سرعتی رشد نموده است که دستگاه های مجزای ذخیره سازی اطلاعات مثل دیسک سخت، دیگر پاسخگوی نیازهای حتی کاربر خانگی هم نیستند. امروزه NASها وارد خانه ها شده اند.
شبکه های ذخیره سازی اطلاعات، اکنون مستقل از سرور و بصورت یک فناوری پایه مثل بانک اطلاعاتی یا شبکه های LAN در مرکز دیتا سنتر قرار دارند.
در این حوزه از مقالات قصد داریم با زبانی غیر فنی، دقیق و شیوا شما را قدم به قدم، ابتدا با مفاهیم پایه این حوزه از فناوری آشنا نماییم. فرض ما این است که خواننده هیچگونه آشنایی قبلی با شبکه و مفاهیم مرتبط با آن ندارد. اگر مقالات را با حوصله دنبال کنید، بزودی وارد حوزه معرفی و مقایسه محصولات موجود در بازار و شناساندن قابلیت ها و امکانات هریک از آنها خواهیم شد. سپس با استفاده از مقالات کارگاهی، سعی می کنیم خواننده را وارد گود نموده تا فناوری را عملاً و تجربه ای نزدیکتر به واقعیت، لمس نماید. سپس نیازهای هر رده از مصرف کنندگان را آنالیز نموده، توجیه اقتصادی آن را ارائه و به هر گروه، توصیه های لازم برای خرید محصول یا راه حل را خواهیم نمود. آشنایی با شرکت های ایرانی عرضه کننده خدمات و محصولات شبکه های ذخیره سازی اطلاعات و سرور، در دستور کار ماست.
مقدمه چینی کافیست. اکنون با ریختن یک فنجان چای، پوشیدن لباسی راحت و تأمین نور کافی برای مطالعه، آماده خواندن اولین بخش از این مجموعه مقالات شوید.
● انگیزه های بروز تحول در معماری دیتاسنتر
برای بالا بردن آستانه تحمل در برابر خرابی( fault tolerance)، دستگاه های ذخیره سازی، گاهی اوقات به دو سرور متصل می شوند. بگونه ای که در آن واحد، تنها یک سرور قادر به استفاده از دستگاه ذخیره سازی خواهد بود.
در هر دو مورد، سیستم ذخیره سازی، تنها در ارتباط با سروری که مستقیماً به آن متصل می باشد، در دسترس خواهد بود. سرورهای دیگر نمی توانند مستقیماً به داده ها دسترسی داشته باشند. آنها همیشه مجبورند از طریق سروری که مستقیماً به دستگاه ذخیره سازی متصل می باشد، به اطلاعات و فضای ذخیره سازی داخل آن دسترسی پیدا کنند.
در نتیجه، این نوع معماری سنتی، معماری « سرور- مرکزی» یا « سرور- محور» نامیده می شود. در این رویکرد، سرورها و دستگاه های ذخیره سازی، عموماً از طریق کابل های SCSI به یکدیگر متصل می شوند.
همانطور که در بالا ذکر شد، در معماری سرور- محور، دستگاه های ذخیره سازی داده، تنها در رابطه با یک یا دو سرور که به آن متصل هستند، وجود خارجی دارند. بنابراین، خرابی هر دوی این سرورها، دسترسی به داده ها را غیر ممکن می سازد. این مسئله برای اغلب شرکتهای امروزی غیر قابل پذیرش است. حداقل بعضی از داده های شرکت( برای مثال، فایل های بیماران در یک محیط بیمارستانی و یا سایت های وب شرکت های تجارت الکترونیک) می بایست دائماً و بدون وقفه در دسترس باشند.
علیرغم اینکه چگالی ذخیره سازی دیسک های سخت و نوارهای مغناطیسی، بواسطه پیشرفت های فنی، دائماً رو به افزایش است، اما نیاز به فضای ذخیره سازی، با سرعت بیشتری رشد می کند. در نتیجه ناگزیریم همواره دستگاههای ذخیره سازی بیشتری را به سرور متصل نماییم. این واقعیت ما را به این مشکل واقف می نماید که هر کامپیوتر، تنها تعداد محدودی کارتهای ورودی/ خروجی ( برای مثال کارتهای SCSI) را می تواند در خود جای دهد. بعلاوه، طول کابلهای SCSI به حداکثر 25 متر محدود می شود. این بدان معنا است که ظرفیت یا فضای ذخیره سازی که می توان با استفاده از فناوری های متعارف( با اتصال به سرور) تأمین نمود، کاملاً محدود می باشد. بنابراین فناوریهای سنتی، دیگر قادر به پاسخگویی تقاضای رو به رشد ظرفیت ذخیره سازی داده ها نیستند.
این حقیقت که در محیط های سرور-محور، سیستم storage، بطور استاتیکی به سرور متصل می شود، باعث می گردد که یک کامپیوتر نتواند به دستگاه ذخیره سازی متصل به کامپیوتر دیگر، دسترسی داشته باشد. بعبارت دیگر اگر یک کامپیوتر نیاز به فضای ذخیره سازی بیشتری داشته باشد، وجود فضای خالی در سیستم متصل به کامپیوتر دیگر، به وی کمکی نمی کند.
اشکال قابل طرح دیگر اینکه، در یک محیط LAN، عموماً دستگاه های ذخیره سازی، در سراسر یک ساختمان پراکنده هستند. این بدان خاطر است که اغلب کامپیوترهای جدید، بدون ملاحظات طراحی، در گوشه و کنار محیط شبکه LAN، نصب و مکرراً ارتقاء داده می شوند. از سوی دیگر ممکن است کامپیوترها، عمداً بواسطه کاهش ترافیک داده ای LAN، نزدیک کاربران استقرار یابند. بهرحال، نتیجه نهایی این خواهد بود که دستگاه های ذخیره سازی در تعداد زیادی اطاق، پراکنده گشته آن هم بگونه ای که در مقابل دسترسی غیر مجاز محافظت نگردیده و از تهویه مناسب نیز برخوردار نخواهند بود.معماری IT مبتنی بر سیستم های ذخیره سازی(Storage-Centric) و مزایای آن شبکه های ذخیره سازی قادرند مشکلات مطرح شده در مورد شبکه های « سرور- محور» را حل نمایند. علاوه بر این، شبکه های ذخیره سازی، وعده های جدیدی را برای مدیریت بهینه داده ها ارائه نمودند.
ایده حاکم بر شبکه های ذخیره سازی آن است که کابل SCSI، با یک شبکه( علاوه بر شبکه LAN موجود) که اصولاً برای مبادله داده ها بین کامپیوترها و دستگاههای ذخیره سازی طراحی می گردد، جایگزین می شود( شکل 3).
در مقابل با شبکه های سرور- محور، در شبکه های ذخیره سازی، دستگاه های ذخیره سازی بصورت کاملاً مستقل از هر کامپیوتر، عرض اندام می کنند. چندین سرور، مستقیماً و بدون نیاز به درگیر شدن سروری دیگر روی شبکه، می توانند به دستگاه ذخیره سازی واحدی متصل گردند. از اینرو شبکه های ذخیره سازی، در مرکز معماری IT قرار می گیرند؛ در این حالت، سرورها فقط وظیفه پردازش داده ها را بعهده می گیرند. بنابراین، معماری های IT مبتنی بر شبکه های ذخیره سازی، اصطلاحاً معماری Storage-centric نامیده می شوند.
شبکه Storage، باعث تمرکز و تجمیع دستگاه های ذخیره سازی می گردد. این امر از طریق جایگزین نمودن هارد دیسک های کوچک متصل به کامپیوترها، با یک زیر سیستم دیسک( Disk subsystem) بزرگ محقق می گردد. اخیراً ( در سال 2010) زیر سیستم های دیسک، دارای یک حداکثر ظرفیت ذخیره سازی تا یک پتا بایت (petabyte) هستند. شبکه ذخیره سازی، مشترکاً به همه کامپیوترها اجازه دسترسی به زیر سیستم دیسک را می دهد. بدینگونه ظرفیت آزاد زیر سیستم دیسک، به کامپیوتری که به آن نیاز دارد، بصورت کاملاً انعطاف پذیر اختصاص می یابد. درست به همین شکل، مجموعه های کوچک نوار مغناطیسی نیز می توانند جای خود را به یک tape library بزرگ بدهند.
امروزه شرکت های بیشتر و بیشتری در سراسر دنیا به معماری Storage-centric رو می آورند. این فناوری اکنون به عنصر اصلی دیتا سنترها و سیستم IT شرکت های بزرگ تبدیل شده است. اخیراً شرکتهای متوسط نیز بطور روز افزون، این نوع شبکه را مد نظر قرار می دهند.
در این حوزه از مقالات، قصد داریم مزایای شبکه های storage را به تصویر بکشیم. به منظور فراهم نمودن پیش درآمدی بر این موضوع، در این مقاله ابتدا سعی نمودیم تا خواننده را با تعدادی از مشکلات اصلی معماری سرور-مرکزی( server-centric) آشنا نموده و سپس با ذکر تعدادی از مزایای معماری Storage-centric ( از طریق ارتقاء یک application server)، به معرفی اجزاء و مؤلفه های این معماری انقلابی بپردازیم.
در سیستم های IT مدرن نیز معمولاً داده ها، روی هارد دیسک ها و نوارهای مغناطیسی ذخیره می گردند. اما مسلماً یک سیستم ذخیره سازی بزرگ و واحد، اقتصادی تر از چندین مورد کوچک تر و منفرد می باشد. این بدان معناست که دیسک های کوچک منفصل، بوسیله یک زیر سیستم دیسک بزرگ واحد، جایگزین می گردند. در مقابل با یک فایل سرور، یک زیر سیستم دیسک هوشمند(intelligent disk subsystem) را می توان بعنوان یک « سرور دیسک سخت» تلقی نمود؛ سایر سرورها می توانند از هارد دیسک های تحت مدیریت شبکه storage، درست همانند درایوهای دیسک محلی استفاده نمایند. ما در شماره بعدی مقاله درباره قابلیت های زیر سیستم های دیسک مدرن مثل instant copy و remote mirroring صحبت خواهیم نمود.
البته در شبکه های ذخیره سازی، فناوری سخت افزاری نوارهای مغناطیسی و tape libraryها تغییر چندانی نمی کند.
Fiber channel، بعنوان یک فناوری ارتباطی بالغ در حوزه storage، از چنان استحکامی برخوردار است که شبکه های ذخیره سازی را می توان مبتنی بر سیستم های باز( Unix، Windows، Novel Netware، MacOs، OS/400) و نیز کامپیوترهای mainframe پیاده سازی نمود.
جاییکه Fiber channel یک فناوری ارسال جدید را معرفی می کند، رقیب آن iSCSI، مبتنی بر TCP/IP و گیگابیت اترنت عمل می نماید. InfiniBand و FCOE Fiber channel روی اترنت، دو رویکرد جدید هستند که سعی در متمرکز نمودن همه ترافیک داده روی یک فناوری ارسال واحد را دارند. در ادامه این لایه از مقالات، در شماره های آتی، شماره را با این مباحث بطور دقیق و مؤثر آشنا خواهیم نمود. اما اکنون بهتر است کمی بیشتر با آناتومی سخت افزاری محیط های ذخیره سازی اطلاعات آشنا شویم.
زیر سیستم های دیسک هوشمند ( intelligentdisk subsystems) دیسک های سخت و نوارهای مغناطیسی، مهمترین محیط برای ذخیره سازی داده ها تلقی می شوند. هنگامیکه شبکه های ذخیره سازی معرفی شدند، دستگاه های متعدد ذخیره سازی کوچک موجود، با تعدادی سیستم های ذخیره سازی بزرگ جایگزین شدند( Storage Consolidation). زیر سیستم های دیسک بزرگ می توانند از چند صد گیگابایت تا ده ها پتابایت اطلاعات را ( وابسته به ظرفیت ذخیره سازی)در خود ذخیره نمایند. بعلاوه، آنها دارای قابلیت های زیادی همانند دسترس پذیری بالا( high availability)، قدرت عملکرد بالا( high performance)، remote mirroring، instant Copy و ... با قیمتی معقول می باشند. مدیریت تعدادی محدود از سیستم های ذخیره سازی، بطور قابل توجهی ساده تر و کم هزینه تر از مدیریت تعداد زیادی دیسک های سخت کوچک و جدا از هم می باشد.
● معماری حاکم بر زیر سیستم های دیسک هوشمند
در اغلب disk subsystemها، بین پورت های اتصال و دیسک های سخت، یک کنترلر وجود دارد. کنترلر با کمک تکنیکی بنام RAID، میزان دسترس پذیری داده و کارایی( performance) سیستم را به میزان قابل توجهی افزایش می دهد.کنترلر به منظور شتاب بخشیدن به فرایند خواندن/ نوشتن سرور روی دیسک، از یک حافظه کاشه استفاده می نماید.
disk subsystemها در همه اندازه ها موجود می باشند. زیر سیستم های دیسک کوچک، دارای یک یا دو پورت اتصال برای سرورها یا شبکه های ذخیره سازی، شش تا هشت دیسک سخت( وابسته به ظرفیت دیسک) و فضای ذخیره سازی چند ترابایتی می باشند. disk subsystemهای بزرگ، دارای چند ده پورت اتصال، برای سرورها و شبکه های ذخیره سازی، کنترلرهای اضافی و چندین کانال I/O هستند.
تعداد زیادی سرور از طریق یک پورت اتصال، می توانند به disk subsystem متصل گردند.
disk subsystemهای بزرگ، معمولاً تا یک پتابایت داده را در خود ذخیره نموده و بیش از یک تن وزن دارند.
شکل(5)، یک نمایش ساده شده از یک زیر سیستم دیسک را نمایش می دهد. در واقع معماری یک disk subsystem واقعی بسیار پیچیده تر از این شکل می باشد. اگرچه اجزای اصلی سیستم، همانهایی هستند که در شکل نمایش داده شده اند. شکل ساده شده(5)، مبنای کافی برای ادامه بحث ما روی این فناوری را ارائه می نماید.
اغلب disk subsystemها دارای این مزیت هستند که فضای خالی دیسک را می توان بصورت کاملاً انعطاف پذیر به هر سرور متصل به آن اختصاص داد. شکل(6)، دوباره به مثال شکل(2) باز می گردد. در شکل (2) تخصیص فضای بیشتر به سرور 2( حتی اگر این فضا روی سرورهای 1 و 3 موجود باشد)، ممکن نیست. در شکل (6)، در این مورد مشکلی نیست. همه سرورها یا مستقیماً و یا بطور غیر مستقیم، از طریق شبکه storage به زیر سیستم دیسک متصل می شوند. در این پیکربندی، می توان به هر سرور فضای خالی ذخیره سازی موجود را اختصاص داد. البته باید به این نکته توجه شود که ظرفیت خالی ذخیره سازی، هم به دیسکهای سخت از قبل نصب شده که هنوز استفاده نشده اند اطلاق می شود و هم اسلات های خالی که آمادگی پذیرش دیسک های سخت را دارند.
● دیسک های سخت و کانال های داخلی I/O
تکنیک های I/O استاندارد، همانند Fiber ,Channel، SCSI SATA و SAS( Serial Attached SCSI) و تا حدی SSA(Serial Storage Architecture) برای کانال های I/O داخلی، بین پورت های اتصال و کنترلر و نیز بین کنترلر و دیسک های سخت داخلی مورد استفاده قرار می گیرند. اگرچه گاهی اوقات، با تکنیک های I/O خاص شرکت سازنده نیز مواجه می شویم. جدای از تکنولوژی I/O مورد استفاده، کانالهای I/O را می توان با redundancy داخلی( بمنظور افزایش fault-tolerance زیر سیستم دیسک) طراحی نمود. حالت های مختلف موجود در ذیل معرفی می گردند:
●*اکتیو
●*اکتیو/ پسیو
●*اکتیو/ اکتیو( بدون اشتراک گذاری بار)
●*اکتیو/ اکتیو( با اشتراک گذاری بار)
کابل کشی اکتیو، ساده ترین و ارزان ترین روش بوده اما هیچگونه تمهیداتی برای مواجهه با خرابی ارائه نمی کند. کابل کشی اکتیو/ پسیو، حداقل نیازهای حفاظتی را در مورد بروز خرابی ارائه نموده در حالیکه کابل کشی اکتیو/اکتیو با قابلیت اشتراک گذاری بار، حداکثر استفاده را از سخت افزار مربوطه می نماید.
JBOD: فقط یک خوشه از دیسک های سخت اگر ما زیر سیستم های دیسک را نسبت به کنترلرهای آن با هم مقایسه کنیم، می توان آنها را به سه سطح تقسیم نمود:
1) بدون کنترلر
2) دارای کنترلر RAID
3) دارای کنترلر هوشمند با سرویسهای اضافی همچون instant copy و remote mirroring اگر زیر سیستم دیسک دارای کنترلر داخلی نباشد، صرفاً یک محفظه فیزیکی حاوی یک مجموعه دیسک( JBOD)، خواهد بود. در این مورد، دیسکهای سخت، همراه با اتصالات مربوط به کانالهای I/O و منبع تغذیه در داخل یک کیس مخصوص، یکجا جمع شده اند. بهرحال مدیریت یک JBOD، در مقایسه با تعدادی دیسک سخت جدا از هم، ساده تر می باشد. زیر سیستم های دیسک سخت JBOD متداول، دارای 8 یا 16 دیسک سخت می باشند. یک سرور متصل به JBOD، همه این دیسک های سخت را بعنوان دیسک های مستقل از هم تشخیص می دهد. بنابراین به 16 آدرس برای یک JBOD حاوی 16 هارد دیسک، نیاز داریم. در بعضی تکنیک های I/O همانند SCSI و Fiber channel، این امر می تواند به یک مانع، در آدرس دهی دیسک ها منجر شود.
در مقایسه با زیر سیستم های دیسک هوشمند، یک JBOD بطور اخص قادر به پشتیبانی از RAID یا سایر اشکال virtualization نیست. در صورت نیاز به این تکنیک، میتوان از قابلیت نرم افزاری روی دیسک یا یک محصول مستقل برای اینکار در شبکه storage استفاده نمود.
منبع: بزرگراه رایانه، شماره 129