آشنايي با سيستم فايل Google
مقدمه
خير،غلط حدس زديد. کامپيوترهايي که از سرويس هاي گوگل پشتيباني مي کنند، کامپيوترهاي بسيار قدرتمند و جديد که از تجهيزات زيادي استفاده مي کنند، نيستند. در واقع، آنها کامپيوترهاي نسبتاً ارزان قيمتي هستند که بر روي سيستم عامل لينوکس اجرا مي شوند. چگونه يکي از موثرترين کمپاني هاي فعال در زمينه وب به سخت افزارهاي ارزان قيمت متکي است؟ اين امر به واسطه سيستم فايل گوگل يا Google File System(GFS) که از توانمندي سرورهاي تقريباً قديمي، براي فائق آمدن بر ضعف هاي سخت افزاري استفاده مي کنند، محقق شده است. همه چيز به طراحي ارتباط پيدا مي کند.
گوگل از GFS براي سازمان دهي و کار با فايل هاي بسيار بزرگ استفاده مي کند تا بدين ترتيب به توسعه دهندگان برنامه هاي کاربردي اجازه دهد بتوانند به تحقيق و توسعه منابع مورد نياز خود بپردازند. GFS منحصر به گوگل است و قابل فروش نيست. اما مي تواند به عنوان مدلي براي سيستم هاي فايل مورد استفاده سازمان هايي با نيازهاي مشابه نيز عمل کند.
برخي از جزئيات GFS کماکان براي افراد بيرون از گوگل در حد يک راز باقي مانده است. به عنوان مثال، گوگل اعلام نمي کند که براي اجراي GFS از چند کامپيوتر بهره مي گيرد. دراسناد و مدارک رسمي گوگل
، اين کمپاني تنها اظهار نموده که " هزاران" کامپيوتر در اين سيستم به کار گرفته شده است اما عليرغم اين ميزان پرده پوشي ،گوگل مقدار زيادي از اطلاعات مربوط به ساختار و عملکرد GFS را به طور علني اعلام کرده است.
خوب،GFS دقيقاً چکار مي کند و چرا تا اين حد مهم است؟ در بخش بعدي مقاله ما به اين موضوع خواهيم پرداخت.
اصول سيستم فايل گوگل
به دليل اينکه اين شبکه بسيار عظيم است، مانيتورينگ و نگهداري آن يک چالش بزرگ به شمار مي رود. برنامه نويسان همزمان با توسعه GFS، تصميم گرفتند بخش اعظم وظائف مديريتي مورد نياز سيستم را به صورت خودکار درآورند تا اين سيستم قادر به ادامه کار باشد. اين، يکي از اصول اصلي autonomic computing، مفهومي که درآن کامپيوترها قادر هستند مشکلات را تشخيص دهند و بدون نياز به دخالت انسان آن را در زمان واقعي حل و فصل کنند به شمار مي رود.چالش پيش روي تيم توسعه دهندهGFS، فقط ايجاد يک سيستم خودکار نبود، بلکه آنها بايد اين سيستم را طوري طراحي مي کردند که بتواند در شبکه عظيمي از کامپيوترها نيز کار کند.
کليد اصلي تيم طراحي، مفهوم ساده سازي بود. آن ها به اين نتيجه رسيدند که با بزرگ و پيچيده تر شدن سيستم ها، مشکلات نيز بيش از پيش افزايش پيدا مي کند. کنترل يک روش ساده، آسان تر است حتي هنگامي که سيستم بسيار عظيم باشد. براساس اين نظريه، تيم GFS تصميم گرفتند که کاربران به دستورات پايه اي مربوط به کار با فايل دسترسي پيدا کنند. اين دستورات شامل فراميني مثل write،read، create،open و close مي شود. اين تيم همچنين مجموعه اي از فرامين تخصصي نظير appendوsnapshot را نيز در بين ساير دستورات قرار داد. آنها فرامين تخصصي را براساس نيازهاي گوگل ايجاد کردند. append به خدمات گيرنده ها اجازه مي دهد اطلاعات مورد نظر خود را بدون بازنويسي بر روي داده هاي نوشته شده قبلي به فايل هاي موجود اضافه کنند. snapshot دستوري است که يک کپي سريع از محتواي کامپيوتر ايجاد مي کند.
Append در مقابل Rewrite
فايلهايي که در سيستم GFS وجود دارد به بزرگ شدن متمايل هستند و معمولاً حجم آنها به چندين گيگابايت مي رسد. دسترسي و ايجاد تغيير در فايلهايي به اين بزرگي به پهناي باند بسيار زيادي نياز دارد. پهناي باند، ظرفيت يک سيستم براي انتقال داده ها از يک مکان به يک مکان ديگر است. GFS، با خرد کردن فايل ها به قطعات 64 مگابايتي بر اين مشکل فائق مي آيد. هر قطعه، يک شماره مشخصه 64 بيتي به نام chunk handle دريافت مي کند. در حالي که GFS مي تواند فايل هاي کوچکتر را پردازش کند، توسعه دهندگان آن، اين سيستم را براي اين نوع کارها بهينه نکرده اند. وقتي همه قطعات داراي اندازه اي مشترک باشند، GFS کار تخصيص منابع را به راحتي انجام مي دهد. درک اين نکته که کدام کامپيوتر در سيستم به نزديکي ظرفيت خود رسيده و يا کدام کامپيوتر بلااستفاده است کار ساده اي است. همچنين انتقال قطعات از يک منبع به منبع ديگر به منظور برقراري تعادل در بار کاري سيستم نيز تسهيل مي شود.
طراحي واقعي GFS چگونه است؟ براي درک اين نکته، به خواندن ادامه مقاله ادامه دهيد.
ساختار سيستم فايل گوگل
در زبان GFS، واژه خدمات گيرنده به هر نوع هويتي که يک درخواست فايل را انجام مي دهد اشاره دارد. درخواست ها مي توانند شامل بازيابي و دست کاري فايلهاي موجود يا ايجاد فايل هاي جديد بر روي سيستم باشند. خدمات گيرنده ها مي توانند ساير کامپيوترها يا برنامه هاي کامپيوتري باشند. وظائف مربوط به masterشامل نگهداري يک لاگ عملياتي که رد فعاليت هاي کلاستر اصلي را نگه مي دارد مي شود. لاگ عملياتي در به حداقل رساندن تداخل ها کمک مي کند. اگر سرورهاي اصلي از کار بيفتد، يک سرور جايگزين که بر عملکرد لاگ عملياتي نظارت دارد مي تواند جايگزين آن شود. سرور اصلي همچنين رد فوق داده يا metadata را که اطلاعاتي است که قطعات را توصيف مي کند نگه مي دارد . فوق داده به سرور اصلي مي گويد که کدام قطعات به کدام فايل ها تعلق دارد . در فرآيند راه اندازي، سرور اصلي تمام chunkserver هاي موجود در آن کلاستر را poll مي کند.chunkserver ها با گفتن محتواي موجودي ها به سرور اصلي، پاسخ مي دهند. از اين لحظه به بعد، سرور اصلي رد مکان قطعات درون کلاستر را دنبال مي کند.
در هر زمان فقط يک سرور اصلي فعال براي هر کلاستر وجود دارد( اگرچه هر کلاستر داراي چندين کپي از سرور اصلي است تا در هنگام از کار افتادن سخت افزار مورد استفاده قرار گيرد). اين ممکن است يک گلوگاه به نظر برسد.بعد از همه اين کارهااگرتنها يک کامپيوتر وظيفه هماهنگ نمودن کلاستري متشکل ازهزاران کامپيوتر را به عهده بگيرد آيا اين موضوع نمي تواند سبب ايجاد اشکال درترافيک داده ها شود؟ GFS با کوچک نگاه داشتن پيغام هايي که سرور دريافت و ارسال مي کند بر اين مشکل فائق مي آيد. در حقيقت سرور اصلي، کاري به اداره کردن داده هاي فايل ندارد و اين کار را به عهده chunkservers مي گذارد.
chunkserverها،اسب کاري GPS به شمار مي روند. آنها مسئوليت ذخيره سازي قطعات 64 بيتي فايلها را به عهده دارند. chunkserver ها قطعات را به سرور اصلي ارسال نمي کنند. در عوض، آنها در خواست براي قطعات را مستقيماً به خدمات گيرنده ارسال مي کنند.GFS ، هر قطعه را چندين بار کپي مي کند و آن ها را در chunkserverهاي مختلف ذخيره مي نمايد. هر کپي ، replica نام دارد. به طور پيش فرض، GFS سه replica براي هر قطعه ايجاد مي کند اما کاربران مي توانند اين تنظيمات را تغييردهند و بسته به نياز خود، replica هاي کمتري ايجاد کنند.
اين عناصر در يک فرآيند روتين چگونه با هم کار مي کنند؟ به اين سوال در بخش بعدي مقاله پاسخ داده شده است.
استفاده از سيستم فايل گوگل
درخواست هاي نوشتن(write) کمي پيچيده تر هستند. خدمات گيرنده هنوز به درخواست از سرور اصلي که با مشخص نمودن مکان replica هاي اوليه و ثانويه به اين درخواست پاسخ مي دهد نياز دارد. خدمات گيرنده، اين اطلاعات را در داخل يک حافظه موقتي(cache) ذخيره مي کند. با اين روش، اگر خدمات گيرنده بعداً نياز به ارجاع به همان replica پيدا کند، مي تواند سرور اصلي را دور بزند و ناديده بگيرد. اگر replicaي اوليه از دسترس خارج شود و يا تغيير يابد، خدمات گيرنده قبل از اينکه با يک chunkserver تماس بگيرد مجدداً با سرور مشورت مي کند. سپس خدمات گيرنده داده هاي نوشتن را به تمام replica ها ارسال مي کند و اين کار را با نزديک ترين replica آغاز و با دورترين آن به پايان مي برد. فرقي نمي کند که نزديک ترين replica، اوليه يا ثانويه باشد. گوگل، اين تحويل داده ها را با يک خط لوله(pipeline) مقايسه کرده است.
وقتي replicaها داده ها را دريافت کردند، replicaي اوليه شماره سريال هاي پشت سر هم را به هر تغيير تخصيص مي دهد. تغييرات، mutation نام دارند. شماره سريال ها در مورد ترتيب هر mutation به replicaها دستور مي دهند. سپس replicaي اوليه، تغييرات يا mutationها را به شکل مرتب و پشت هم به داده هاي خود اعمال مي کند و سپس يک درخواست خواندن را به replicaهاي ثانويه که از همان فرآيند مشابه تبعيت مي کند ارسال مي نمايد.اگر همه چيز به همان شکلي که بايد،پيش برود، تمام replicaهاي موجود در يک کلاستر از داده هاي جديد استفاده و آن را لحاظ مي کنند. Replicaهاي ثانويه زماني که فرآيند برنامه کاربردي به اتمام رسيد، به replicaي اوليه گزارش مي دهند.
در همين زمان، replicaي اوليه نيز به خدمات گيرنده گزارش مي دهد. اگر فرآيند موفقيت آميز بوده باشد، کار در همين جا به اتمام مي رسد. در غير اين صورت، replicaي ثانويه موضوع را به اطلاع خدمات گيرنده مي رساند. به عنوان مثال، اگر يکي از replicaهاي ثانويه در يک mutation خاص قادر به روزآمد شدن نشود، replicaي ثانويه اين را به خدمات گيرنده اطلاع مي دهد و مجدداً سعي مي کند mutation را چندين بار ديگر انجام دهد. اگر replicaي ثانويه نتواند روزآمد شود، replicaي اوليه به replicaي ثانويه دستور مي دهد براي فرآيند نوشتن، کار را از ابتدا آغاز کند. اگر اين کار جواب ندهد، سرور اصلي اين replica را به عنوان garbage در نظر مي گيرد. GFS چه کار ديگري انجام مي دهد و سرور اصلي با اين garbage چه مي کند؟ براي يافتن پاسخ اين سوال ها، ادامه مقاله را مطالعه کنيد.
سايرعملکردهاي سيستم فايل گوگل
توسعه دهندگان GFS به منظور غلبه بر غير قابل اطمينان بودن موروثي اجزاي منفرد، عملکردها را در داخل خود سيستم قرار دارند. اين عملکردها شامل تکثير قطعات و سرور اصلي، يک فرآيند بازيابي جرياني شده، ايجاد تعادل مجدد، از بين بردن garbage و checksumming مي شود.
در حالي که تنها يک سرور اصلي فعال در هر کلاستر GFS وجود دارد، کپي هايي از سرور اصلي بر روي کامپيوترهاي ديگر وجود دارد. برخي از اين کپي ها، که shadow masters نام دارد، سرويس هاي محدودي را حتي در زماني که سرور اصلي اوليه فعال است فراهم مي کنند. اين سرورها محدود به درخواست هاي read هستند زيرا آن درخواست ها به هر حال داده ها را تغيير نمي دهند. سرورهاي اصلي shadow، هميشه با اندکي تاخير در پشت سرور اصلي اوليه قرار مي گيرند اما اين تاخير معمولاً به اندازه کسري از ثانيه است. replicaهاي سرور اصلي، تماس با سرور اصلي اوليه را حفظ مي کنند و لاگ عملکرد را مانيتور مي کنند و در عين حال به منظور نگه داشتن رد داده ها، chunkserverها را poll مي کنند. اگر سرور اصلي اوليه از کار بيفتد و نتواند دوباره راه اندازي شود، يک سرور اصلي ثانويه مي تواند جاي آن را بگيرد.
GFS، به منظور اطمينان از اين که داده ها حتي در صورت از کار افتادن سخت افزار در دسترس قرار دارند، قطعات را تکثير مي کند و replicaها را بر روي ماشين هاي مختلفي در رک هاي گوناگون ذخيره مي نمايد. با اين روش، اگر کل يک رک نيز از کار بيفتد، داده ها هنوز هم به شکلي قابل دسترس بر روي يک کامپيوتر ديگر وجود خواهند داشت. GFS از شناسه هاي منحصر به فرد قطعات به منظور شناسايي هر replica استفاده مي کند. اگر يکي از handleهاي replica با chunk handle مطابقت نداشته باشد، سرور اصلي يک replicaي جديد را ايجاد مي کند و آن را به يک chunkserver اختصاص مي دهد.
سرور اصلي همچنين کلاسترها را به صورت يک مجموعه مانيتور مي کند و به طور نوبه اي بار کاري را با شيفت کردن قطعات از يک chunkserver به chunkserver ديگر متعادل مي کند. تمام chunkserverها نزديک به ظرفيت کامل خود کار مي کنند اما هيچ گاه به ظرفيت کامل نمي رسند. سرور اصلي نيز قطعات را مانيتور مي کند و تائيد مي کند که هر replica، در حال حاضر مورد استفاده قرار دارد. اگر يک replica با شماره شناسايي قطعه هماهنگ نباشد، سرور اصلي آن را به عنوان يک replicaي به بن بست رسيده يا به درد نخور در نظر مي گيرد. اين replica تبديل به يک garbage مي شود. پس از گذشت 3 روز، سرور اصلي مي تواند اين قطعه chunk را حذف کند. اين ،اتخاذ يک روش ايمني است زيرا کاربران مي توانند قبل از اينکه قطعه به طور دائم حذف شود آن را چک کنند تا از حذف هاي ناخواسته جلوگيري به عمل آورند.
به منظور جلوگيري از خراب شدن داده ها، GFS از سيستمي به نام checksumming استفاده مي کند. سيستم، هريک از قطعات 64 مگابايتي را به بلاک هاي 64 کيلوبايتي خرد مي کند. هر بلاک درون يک قطعه داراي checksum 32 بيتي مخصوص به خودش است که نوعي ازاثرانگشت به شمار مي رود. سرور اصلي، قطعات را با نگاه کردن به checksumها مانيتور مي کند. اگر checksum يک replica با checksum موجود درحافظه سرور اصلي مطابقت نداشته باشد، سرور اصلي replica را حذف مي کند و يک replicaي جديد ايجاد مي کند و آن را جايگزين مي کند. گوگل در GFS خود از چه نوع سخت افزاري استفاده مي کند؟ ادامه مقاله را مطالعه کنيد.
سخت افزار سيستم فايل گوگل
تجهيزات تست شامل يک سرور اصلي، دو replicaي اصلي، 16 خدمات گيرنده و chunkserver 16 مي شود. تمام اين تجهيزات از سخت افزاري مشابه با مشخصات يکسان استفاده مي کردند و همه آنها سيستم عامل لينوکس را اجرا مي کردند. هريک از کامپيوترها داراي دو پردازنده، 1/4 گيگاهرتز پنتيوم، 2/3 گيگابايت رم و دو ديسک سخت 80 گيگابايتي بودند. در حال حاضر، فروشندگان زيادي هستند که کامپيوترهايي ارائه مي کنند که قدرت آنها دو برابر بيشتر از تجهيزاتي است که گوگل در تست هاي خود از آنها بهره گرفته است. توسعه دهندگان گوگل اثبات کردند که GFS با اين تجهيزات متوسط، به شکلي موثر کار مي کند.
شبکه اي که اين کامپيوترها را به هم متصل مي کرد از يک اتصال اترنت full-duplex 100 Mbps و دو سوئيچ شبکه Hewlett Packard 2524 تشکيل شده بود. توسعه دهندگان GFS، 16 کامپيوتر خدمات گيرنده را به يک سوئيچ و 19 کامپيوتر ديگر را به سوئيچ ديگر متصل کرده بودند. آنها دو سوئيچ را با استفاده از يک اتصال 1Gbps به يکديگر لينک کرده بودند.
گوگل مي تواند با ناديده گرفتن جديدترين تکنولوژي هاي موجود در بازار، قطعات و اجزايي را بخرد که بسيار براي اين کمپاني به صرفه است . ساختار GFS به شکلي است که افزودن کامپيوترهاي ديگر در هر زمان به آن کار ساده اي است. اگر ظرفيت يک کلاستر شروع به تکميل شدن بکند، گوگل مي تواند سخت افزارهاي ارزان قيمت جديدي را به سيستم اضافه کند و بار کاري را متعادل نمايد. اگر حافظه يک سرور اصلي تکافو نکند، گوگل مي تواند سرور اصلي را به حافظه بيشتر تجهيز کند. سيستم کاملاً مقياس پذير است. گوگل چگونه تصميم گرفت از چنين سيستمي استفاده کند؟ برخي از افراد سياست استخدام و به کار گيري گوگل را در اين امر سهيم مي دانند. گوگل به در اختيار گرفتن دانشجويان فارغ التحصيل نخبه در زمينه علوم کامپيوتري و در اختيار گذاشتن منابع و فضاي کافي که آنها براي تجربه کردن سيستم هايي نظير GFS به آن نياز دارند شهرت دارد. سايرين مي گويند اين نکته حاصل ذهنيت " با استفاده از چيزهايي که در اختيار داري کاري را که مي تواني انجام بدهي، انجام بده" که بسياري از توسعه دهندگان سيستم هاي کامپيوتري به آن اعتقاد دارند نشات مي گيرد. دست آخر اين که، گوگل احتمالاً GFS را به اين دليل به کار گرفته که مي خواهد فرآيندهايي را اداره کند که به اين کمپاني کمک مي کنند نقش رهبري در دنياي اطلاعات را مثل سابق در دست داشته باشد.
منبع:نشريه بزرگراه رايانه، شماره 124
/ن