ترجمه و تألیف: حمید وثیق زاده انصاری
منبع:راسخون
منبع:راسخون
از سلامت و محیط زیست گرفته تا ورزش، آمار شناسان پرده از اطلاعاتی بر میدارند که در غیر این صورت در میان کوهی از دادهها مدفون باقی میماندند.
یونیس کسپدس (که در این جا نشان داده شده است) اوکلند اتلتیکس را به بازی پلی آف لیگ برتر بیس بال در سال 2012 هدایت کرد. قبل از آغاز فصل، تیم اتلتیکس با امضای قراردادی هنگفت کسپدس را به خدمت گرفت حتی با وجود این که وی هرگز حتی یک نوبت نیز در لیگ بیس بال ایالات متحدهی آمریکا بازی نکرده بود. تازه علاوه بر این تیمهای دیگر نیز وی را خطری بزرگ برای خود محسوب مینمودند. اما فرهان زیدی یک راهنمای آماری تصمیم خود را بر مبنای "اعداد و ارقام" اتخاذ نمود.
این یکی از مجموعه دورههای موجود در علم، فناوری، مهندسی و ریاضیات است که با حمایت بنیاد نورتروپ گرامان امکان پذیر شده است.
زمانی که لی آن هایک اولین پست شغلی خود را در مؤسسهی اسمیتسونین واقع در واشینگتن دی سی به دست آورد، ابداً انتظار این را نداشت که تمامی دورهی کاری خود را در آن جا به سر برد. او تازه موفق به کسب مدرک دکترای خود در رشتهی آمار شده بود. او به یاد دارد که زمانی تصور میکرد کار کردن در یکی از موزهها و یا مراکز تحقیقاتی اسمیتسونین کار بسیار جالبی خواهد بود. پس، "من فقط یک نامه برای آنها نوشته و ارسال کردم و گفتم، "اگر بخواهید خاک روی فیلهای شما را پاک میکنم!"".
اکنون، پس از گذشت 35 سال هایک در موزهی ملی تاریخ طبیعت مشغول به فعالیت است. هایک در پست سر آمار شناس ریاضیاتی هیچ گونه غبار روبیای را انجام نمیدهد. (با این وجود او هر زمان که بخواهد به دیدن هنری فیل پرشدهی این موزه میرود.) هایک به مانند نوعی کار آگاه به کاوش اعداد خامی که داده خوانده میشوند میپردازد که به وسیلهی صدها متخصص اسمیتسونین که در حال انجام تحقیقاتی پیش رو در عرصهی گستردهای از زمینههای مختلف هستند به هم ریخته شدهاند.
آمار شناسانی به مانند هایک در تشخیص الگوها در دادهها دارای تخصص هستند. برخی از آنها در جهت قابل مدیریت ساختن اطلاعات فعالیت مینمایند. برخی دیگر نیز ممکن است از آنها در جهت انجام پیش بینی بهره جویند. درست به همین مهمی کار آنها امکان بررسی واقعیت را برای دیگر دانشمندان فراهم آورده و میسر میسازد. آمار شناسان الگوهایی را تشخیص میدهند که ممکن است به نظر آید در آنجا وجود دارند اما احتمالاً به علتی که "پارازیت" خوانده میشود ــ نا خواسته و گوناگونی تصادفی در اطلاعات هستند.
ممکن است دانشمندانی که هایک با آنها کار میکند متخصصان برجستهی دنیا در موضوعی خاص باشند. اما باز هم ممکن است این دانشمندان متوجه بهترین روش برای تجزیهی و تحلیل اطلاعاتی که جمع آوری مینمایند نشوند. هایک به شوخی میگوید "نظریه خوش رفتار است و با تربیت، اما اطلاعات هرگز این گونه نیستند".
جنیفر جت
اغلب برداشت غلطی از نقش یک آمار شناس وجود دارد. افراد بسیاری این تصور را دارند که آمار شناسان تنها کوهی از اعداد را انبار میکنند. اما در حقیقت کار واقعی آنها تبدیل اطلاعاتی که دیگران جمع آوری کردهاند به صورت اطلاعات است. به عنوان نمونه آزمونهای آزمایشگاهی انجام شده بر روی خون پاندای وحشی دادههایی را بیرون میدهند. آمار شناسان میتوانند از این دادهها برای پاسخ به پرسشها بهره جویند. یکی از این سؤالات میتواند به این گونه باشد که آیا واکسنهای به کار رفته بر روی بدن پانداها واقعاً در جهت پیش گیری از بروز بیماریها، اقدامی میکنند یا نه. دام پزشکان میتوانند از این اطلاعات برای بهتر نمودن مراقبت از پاندا استفاده نمایند.
ما در این جا با سه آمار شناسی آشنا میشویم که زندگی خود را صرف بالا و پایین کردن اعداد و ارقام نمودهاند تا پاسخ گوی سؤالات سخت باشند. روندهایی را که آنها کشف مینمایند به جنبههای گوناگون جهان ما معنی میبخشد، از هنر و حیوانات گرفته تا مغز انسان و بیس بال.
یک روز لیشا گلینسمن شیمی دان ارشد گالری ملی با طرح سؤالی به نزد هایک آمد. آیا این امکان وجود دارد تا از دستور العملهای مختلف تهیهی فلز برنز برای کمک به متخصصان در جهت تشخیص این مطلب که کدام یک از هنرمندان هر یک از مدالهای بدون علامت را ساخته است است بهره جسته شود؟ هایک با خود فکر کرد که چه سؤال جالبی. از این رو وی تصمیم به جستجوی جواب این سؤال گرفت.
گالری ملی تکریم هنر، واشینگتن
آمار شناسان یاد میگیرند تا اطلاعات را به چند طریق مختلف مورد تجزیه و تحلیل قرار دهند. سادهترین این روشها استفاده از آمار توصیفی است. در این روش آنها اطلاعاتی را دریافت مینمایند و سپس آنها را به طور ریاضیاتی شرح میدهند. به عنوان نمونه ممکن است آمار شناسان میانهی (مقدار متوسط) آن و واریانس (اندازهی این که آیا تمام اطلاعات نزدیک به میانه هستند و یا این که به طور گسترده پراکنده شدهاند) را اندازه گیری نمایند.
هایک با استفاده از آمار توصیفی دریافت که هر مدال برنزی از یکی از هفت و یا هشت آلیاژ مختلف (یا مخلوطی از فلزهای مختلف) ساخته شدهاند. به عنوان نمونه هر آلیاژ حاوی درصد متوسط مختلفی از مس، قلع و روی است. بزرگترین شگفتی: هیچ یک از این آلیاژها دستور العمل انحصاری فقط یک هنرمند نبودند. به همان شکلی که ممکن بود یک مجسمه ساز بسته به موضوعی که باید بر روی آن کار میکرد از میان چندین نوع سنگ یکی را انتخاب نماید، هر برنز کاری هم از چندین نوع آلیاژ بهره میبرد.
هایک اظهار میدارد که این اکتشاف "دقیقاً مسیر پروژه را عوض کرد". این موضوع نشان داد که برنز در ایتالیای دورهی رنسانس یک محصول خاص منحصر به فرد نبوده است که به وسیله هر کارگاهی به شیوهی خاص خود تهیه شود. در عوض انواع بسیاری از برنزهای مختلف وجود دارند. هنرمندان برای اهداف متفاوت خود از دستور العملهای متفاوتی استفاده مینمودند.
سالیان درازی است که دانشمندان چینی در حال واکسینه نمودن پانداهای بومی خود در برابر بیماریهای شایع در میان سگها و دیگر حیوانات خانگی بودهاند. در حقیقت این متخصصان از واکسنهایی استفاده نمودند که برای سگها ساخته شده بودند. برخی از دام پزشکان چینی نگران این موضوع بودند که ممکن است واکسنهای سگها به همان خوبی از وجود پانداها محافظت ننمایند.
برای بررسی این مورد این دام پزشکان اطلاعات موجود در نمونه خونها را برای هایک ارسال نمودند. این دام پزشکان در یک دورهی شش ساله خون 19 پاندا را در چین جمع آوری نمودند. هایک فوراً الگویی مشکل ساز را کشف نمود.
ابی وود، باغ وحش ملی اسمیسونیان
بدن به عنوان بخشی از عکس العمل دفاعی خود تولید پادتن مینماید. پادتنها ویروسها و دیگر مواد خارجی موجود در خون را خنثی کرده، دنبال نموده و از بین میبرند. انجام عمل واکسیناسون باید سطح پادتنهای بدن پاندا را بالا ببرد. این عمل سطح ایمنی بدن این خرسها را در برابر ویروس بالا خواهد برد و خطر ابتلای آنها را به بیماری کاهش خواهد داد.
هم چنین واکسیناسیون باید پایدار باشد و نتایجی یک سان را در هر سال ایجاد کند. اما هایک متوجه شد که سطح پادتنهای بدن پاندا به طرز چشم گیری از سالی به سال دیگر دچار تغییر میشد. یک جای کار باید دچار ایراد باشد!
این امر کاملاً واضح و روشن نبود که آیا این تغییرات واقعی بودند و یا این که واکسنها دچار مشکل بودند. نوسانات تصادفی در خون پاندا ممکن است موجب شوند تا سطح پادتنهای بدن این حیوان در یک سال بالا رود و در سال دیگر دچار افت شود. اگر واکسن در این ماجرا مقصر نباشد آن گاه این احتمال میرفت که دانشمندان پول زیادی را صرف تلاش برای حل مشکلی نمایند که اصلاً و ابداً وجود خارجی نداشت.
اما آزمونهای ریاضیاتی هایک تردید اندکی بر جای گذاشتند. وی تغییراتی را در ایمنی بدن این حیوانات مشاهده نمود که بیش اندازه بزرگ و سیستماتیک بودند تا بتوان آنها را تنها بر حسب تصادف خواند. کار وی آن چه را که هم کاران دام پزشک او بدان شک برده بودند تأیید نمود: تولید کنندگان واکسن در چین محصولاتی با ثبات را تولید نمیکردند. کیفیت واکسن در برخی از سالها پایین بود. پانداها در این سالها از میزان حفاظت خوب و مناسبی در برابر بیماری برخوردار نبودند.
این امر نشان میدهد که چرا آمار به مانند کار کار آگاهان است. آمار توصیفی الگویی را کشف مینماید که غیر عادی است. آمار استنباطی مجرم و خطا کار را گیر میاندازد (و یا این که از باز داشت نمودن ناظری بی گناه جلو گیری مینماید). هیک این گونه شرح میدهد که "انجام این کار همیشه نیازی به ریاضیات پیش رفته ندارد". "اما این کار به صرف زمان بسیار زیادی در مطالعه و دانش نیاز دارد تا به یک مشکل نظاره کنید و بگویید، "من میتوانم این مشکل را حل کنم. نمیدانم چگونه، اما میدانم که میتوانم از پس آن بر آیم"".
تخصص کافو نوعی از اسکن نمودن مغز به نام "تصویر برداری تشدید مغناطیسی تابعی" ــ یا به اختصار fMRI است. برخلاف پرتوهای ایکس که تنها ساختار مغز را نشان میدهند این تصاویر رنگی ایجاد شده به وسیله fMRI مغز را به هنگام فعالیت نشان میدهند. به خصوص عصب شناسان دوست دارند تا بفهمند که کدام یک از بخشهای مغز به هنگامی که فر دبه انجام عملی خاص میپردازد روشن میگردند (و کدام یک نمیشوند). این کار به آنها کمک مینماید تا ارتباط بین بخشهای مختلف مغز را ترسیم نمایند.
اما اسکن بخشهای مختلف مغز با نگاشتهایی رنگی آغاز نمیگردند. آنها با تصاویری خاکستری، نا آشکار و گاهی اوقات پر از سوراخ ــ به مانند پنیر سوئیسی شروع میشود. در این مرحلهی ابتدایی نیز حتی ممکن است عصب شناس هم قادر به متمایز ساختن نواحی به واقع فعال و غیر فعال نگردد. این کار کافو است که این دسته از تصاویر fMRI را به شکل تصاویری واضح و آشکار در آورد تا قابل فهم برای پزشکان قرار گیرند. گذشته از این وی از این تصاویر برای کار روی برخی از آمارهای پیش بینی بهره میجوید. او از این تصاویر در جست و جوی نا بهنجاریهایی که امکان دارد به خطرهایی برای بیماری اشاره داشته باشند (مانند فلج چندگانه و یا بیماری آلزایمر) استفاده مینماید.
کافو در دانشکدهی بلومبرگ سلامت عمومی دانشگاه جان هاپکینز در بالتیمور به فعالیت میپردازد. وی در آن جا به جدا سازی سیگنالهای مغزی واقعی موجود در تصاویر fMRI از پارازیتهای بی معنی میپردازد. آمار ابزاری که وی برای پاک نمودن این "پارازیت" گیج کننده نیاز دارد را فراهم میآورد.
با این وجود بهره گیری از تصاویر fMRI تا حدودی ما را دچار چالش مینماید. معمولاً دانشمندان یک کمیت را (که ما آن را x میخوانیم) به کمیتی دیگر (که ما آن راy میخوانیم) مرتبط میسازند. به عنوان نمونه این که فرد با چه سرعتی یک توپ را پرتاب مینماید (x) مسافتی که آن طی خواهد نمود (y) را تعیین مینماید. اما چه کاری را میتوان به انجام رسانید وقتی که مقادیر داده شده برای x و y نه عدد بلکه تصویر هستند؟
تا کنون بهترین راه کار، تبدیل نمودن تصاویر به عدد و رقم بوده است. انجام این کار اعداد و ارقام بسیاری را ایجاد میکند. به یاد این گفتهی قدیمی میافتیم که میگوید: یک تصویر به هزاران کلمه میارزد. اما با یک اسکن سادهی fMRI این امکان وجود دارد که یک تصویر به صدها هزار عدد و رقم تبدیل شود. آمار شناسان بایستی ریاضیات را در ذهن خود متصور دارند تا این اطلاعات را به شیوههایی که چیزی معنی دار را در اختیار دانشمندان قرار دهند فشرده و پردازش نمایند.
در کمال تعجب کافو به هنگامی که اولین بار پا به دانشگاه گذاشت هرگز انتظار این را نداشت که در زمینهی زیست شناسی و آمار به فعالیت بپردازد. او این گونه به یاد میآورد که "من درس خود را در رشتهی هنر آغاز نمودم". اما او به تلاش خود ادامه داد و در کلاسهای هنر خود نمراتی متوسط را به دست آورد. در این اثناء هم چنین به حضور در کلاسهای ریاضیات پرداخت ــ و کار خود را کاملاً خوب به انجام رساند. در نهایت وی رشتهی خود را از هنر به ریاضیات تغییر داد.
بعدها فرصتی برای انجام پارهای تحقیقات در دانشگاه فلوریدا کافو را قانع گرداند تا وارد زمینهای به نام زیست آمار وارد شود. این رشته از ریاضیات، برای یافتن روند اطلاعات زیست شیمی بهره میگیرد. این عملیات ممکن است شامل عدد و رقمهایی شود که به تشخیص این مطلب که چه کسی مریض میشود و یا این که یک روش درمانی به چه مقدار در درمان افراد مؤثر است کمک مینماید.
مؤسسهی ملی سلامت
کافو تا زمانی که به فعالیت در دانشگاه جان هاپکینز نپرداخته بود اطلاعات چندانی در بارهی مغز در دست نداشت. وی اظهار میدارد که در علم امروز این امر آن چنان مشکلی که به نظر میرسد نیست. گروههای بسیاری از افراد در تحقیقات بر روی مغز فعالیت دارند. هیچ کدام از آنها در همهی بخشهای این تحقیقات دارای تخصص نیستند. کافو بیان میکند که "ما یک عصب شناس، یک دکتر پزشک، یک مهندس و یک آمار شناس داریم، افرادی فنی که میدانند چگونه اسکنر را به کار اندازند و از ریاضیات کار بردی بهره گیرند". "بهترین راه برد این است که به خوبی با مؤلفههای خود آشنا باشید".
کافو در سال 2011 و در سن 38 سالگی موفق به دریافت جایزهی دورهی آغازین ریاست جمهوری برای دانشمندان و مهندسان گردید. وی و دیگر برندگان جوایز دعوت نامهای به کاخ سفید را دریافت نمودند. کافو دریافت که او تنها "آمار شناس" موجود در میان این برندگان است. با این حال وی به سرعت دریافت که بخش بزرگی از دیگر برندگان نیز از آمار بهره جسته بودند.
کافو توضیح میدهد که "شما ممکن است با فرد دیگری ملاقات نمایید که عنوانش "روان شناس" یا "جامعه شناس" و یا "متخصص بیماریهای واگیر دار" باشد اما کار آنها 100 درصد با آمار مربوط به آن حوزه سر و کار دارد". وی اظهار میدارد که این درس برای دانش آموزان چنین است: "اگر شما بخواهید در دنیای علم قدم بر دارید باید به انجام آمار بپردازید ــ اهمیتی ندارد چه رشتهای".
در اوایل قرن بیستم تیم اوکلند اتلتیکس بدل به یکی از اولین تیمهایی گشت که آزادانه از محاسبات ریاضی برای برآورد نمودن ارزش هر یک از بازی کنان بیس بال بهره برد. مدیر عامل این تیم بیلی بین بود. در آن زمان تیم اتلتیکس از پول چندانی برای پرداخت دست مزد بازی کنان خود برخوردار نبود. اما با این وجود این تیم از روندی موفقیت آمیز برخوردار بود. و این امر به خاطر شناسایی افراد مستعدی بود که تیمهای دیگر آنها را نا دیده میگرفتند ــ یعنی بازی کنان خوبی که ارزان قیمت در میآمدند.
مانیبال، کتابی که در سال 2003 به چاپ رسید (و در سال 2011 تبدیل به فیلمی با همین عنوان گردید)، داستان پس پردهی موفقیت این تیم را روایت میکرد. زیدی که در آن هنگام دانش جوی فارغ التحصیل اقتصاد رفتاری بود این کتاب را مطالعه کرد و آن را به عنوان یک "الهام" دریافت. وی همواره یکی از طرف دارن ورزش بیس بال بود. با این وجود وی تصور مینمود که داشتن یک دورهی ورزش در این رشته برای فردی مثل او غیر قابل تصور است (که آخرین بار در یک لیگ کوچک به بازی پرداخته بود). او اظهار میدارد که مانیبال " نشان داد که افرادی که از سوابق ورزشی معمولیای برخوردار هستند میتوانند فرصتی برای پرداختن به این رشتهی ورزشی داشته باشند".
چنین فرصتی برای او حتی زودتر از آن چه تصورش را داشت پیش آمد.
مایکل زاگاریس، اوکلند اتلتیکس
تیم اتلتیکس جدی و مصمم بودند تا نیروی قهرمانی را با نیروی تفکر تکمیل نمایند. از این رو این تیم سال 2004 را صرف انجام تبلیغات برای به دست آوردن یک مدیر عملیات کرد. بیش از 1،000 کاندید برای احراز این پست، درخواست نمودند. زیدی این پست را به دست آورد.
زیدی اظهار میکند که "هنگامی که بیلی ]بین[ با من تماس گرفت تا پیشنهاد این کار را به من بدهد چنان هیجان زده شده بودم که یک کارت راهنما برداشتم و شمارهی موبایل خود را بر روی آن نوشتم. "من هنوز هم آن کارت را بر روی تابلوی اعلانات درون دفتر خود نگه داشتهام. من این کارت را در آن بالا نگه میدارم چرا که این آرزویی است که به واقعیت پیوسته است". حتی زمانی که در یک مسیر جادهای از هر هفت بازی تنها در دو تای آنها برنده میشویم "من به خانه بر میگردم و به آن کارت نگاه میکنم. این کار به خاطر من میآورد که هر روز حضور در این پست یک هدیه محسوب میشود".
در این صورت زیدی به خواست خود رسیده است. تجزیه و تحلیلهای آماری وی از ریسکی که تیم اوکلند اتلتیکس در سال 2012 به عمل آورد حمایت میکرد. در این هنگام بود که این تیم قرار دادی بزرگ را به یک مهاجر بی نام و نشان کوبایی به نام یونس کسپدس پیشنهاد نمود. کسپدی به تیم اوکلند اتلتیکس پیوست و بدل به یکی از بزرگترین ستارههای این سال شد و تیم خود را تا بازی پلی آف هدایت کرد.
زیدی به نشریهی اخبار علمی برای دانش آموزان گفت که به عنوان نمونه "ما تلاش داریم تا بیشتر از کسب نتایج بر روی مهارتها تمرکز داشته باشیم". این بدین معنی است که وی چندان توجهی را به معیارهای خاص قدیمی مانند متوسط توپ زنی ندارد. او اشاره میکند که "متوسط توپ زنی یک نتیجه است".
روشهای زیدی مرتباً رو به تغییر هستند. وی در توضیح چگونگی نحوهی شناسایی نمودن توپ زنهای لیگ کوچکتر این گونه اظهار میدارد که "شاخص اصلی ما میزان حذف شدنها از بازی بود". اکنون وی دیگر تنها بر تعداد دفعات حذف شدن از بازی تمرکز نمینماید. در عوض زیدی به تجزیه و تحلیل تعداد پرتابهایی که برای حذف هر بازی کن توپ زن انجام میپذیرند میپردازد.
زیدی این گونه شرح میدهد که "برخی از پرتاب کنندگان بر توپ زنان برتری دارند و آنها را با سه چهار پرتاب از دور بازی حذف مینمایند." برخی دیگر ممکن است چندین پرتاب را از دست بدهند، مرتکب چند خطا شوند و سپس آنها را از دور بازی حذف نمایند". وی در حال حاضر بر این باور است که حذف شدن از دور بازی در طی 10 پرتاب عاملی خوب برای تعیین موفقیت یک پرتاب کننده نیست ــ حداقل در لیگهای بزرگ.
متخصصان به خصوص در دنیای تجارت تجزیه و تحلیل روندهای پنهان در مقادیر زیادی از اطلاعات را با اصطلاح آنالیتیکس تعریف مینمایند. در مدت این نه سالی که زیدی به تیم اوکلند اتلتیکس پیوسته است، علم تجزیه و تحلیل جای گاه خود را در بازی بیس بال نگه داشته است. وی بیان میکند که "در دفتر جلوی هر تیمی فردی وجود دارد که مشغول انجام تجزیه و تحلیلهای آماری است". این کار در دیگر ورزشها نیز مورد قبول واقع گردیده است. MIT، جایی است که زیدی در آن جا به دانشگاه رفت در حال حاظر همه ساله کنفرانسهای بزرگی را دربارهی تجزیه و تحلیلهای ورزشی برگزار مینماید.
زیدی همواره در تلاش است تا به خود یاد آوری نماید که بهره بردن از محاسبات ریاضی برای شناسایی نمودن روندهای معنی دار (به مانند تعداد دفعات حذف از بازی در سه پرتاب در برابر 10 پرتاب) نیازمند بسیار ساده نمودن هر آن چیزی است که در دنیای واقعی اتفاق میافتد. وی بیان میدارد که از این رو این کار متواضعانه به نظر میرسد. "من تصور میکنم که مردم بیشتر مشتاق هستند تا به هنگامی که میبینند شما اندکی ادویه چاشنی کار خود میکنید به حرفهایتان گوش کنند".
اکنون وقتی که هم کلاسیهای شما ریاضیات و آمار را به کناری میگذارند و از شما میپرسند که این درسها به چه دردی میخورند شما میتوانید در پاسخ به آنها بگویید: آنها به مردم از همهی اقشار جامعه (و پانداها) کمک مینمایند. کار آگاههای اطلاعات در پس پرده به فعالیت میپردازند تا هر کاری که ما به انجام میرسانیم را اندکی بهتر نمایند.
این یکی از مجموعه دورههای موجود در علم، فناوری، مهندسی و ریاضیات است که با حمایت بنیاد نورتروپ گرامان امکان پذیر شده است.
زمانی که لی آن هایک اولین پست شغلی خود را در مؤسسهی اسمیتسونین واقع در واشینگتن دی سی به دست آورد، ابداً انتظار این را نداشت که تمامی دورهی کاری خود را در آن جا به سر برد. او تازه موفق به کسب مدرک دکترای خود در رشتهی آمار شده بود. او به یاد دارد که زمانی تصور میکرد کار کردن در یکی از موزهها و یا مراکز تحقیقاتی اسمیتسونین کار بسیار جالبی خواهد بود. پس، "من فقط یک نامه برای آنها نوشته و ارسال کردم و گفتم، "اگر بخواهید خاک روی فیلهای شما را پاک میکنم!"".
اکنون، پس از گذشت 35 سال هایک در موزهی ملی تاریخ طبیعت مشغول به فعالیت است. هایک در پست سر آمار شناس ریاضیاتی هیچ گونه غبار روبیای را انجام نمیدهد. (با این وجود او هر زمان که بخواهد به دیدن هنری فیل پرشدهی این موزه میرود.) هایک به مانند نوعی کار آگاه به کاوش اعداد خامی که داده خوانده میشوند میپردازد که به وسیلهی صدها متخصص اسمیتسونین که در حال انجام تحقیقاتی پیش رو در عرصهی گستردهای از زمینههای مختلف هستند به هم ریخته شدهاند.
آمار شناسانی به مانند هایک در تشخیص الگوها در دادهها دارای تخصص هستند. برخی از آنها در جهت قابل مدیریت ساختن اطلاعات فعالیت مینمایند. برخی دیگر نیز ممکن است از آنها در جهت انجام پیش بینی بهره جویند. درست به همین مهمی کار آنها امکان بررسی واقعیت را برای دیگر دانشمندان فراهم آورده و میسر میسازد. آمار شناسان الگوهایی را تشخیص میدهند که ممکن است به نظر آید در آنجا وجود دارند اما احتمالاً به علتی که "پارازیت" خوانده میشود ــ نا خواسته و گوناگونی تصادفی در اطلاعات هستند.
ممکن است دانشمندانی که هایک با آنها کار میکند متخصصان برجستهی دنیا در موضوعی خاص باشند. اما باز هم ممکن است این دانشمندان متوجه بهترین روش برای تجزیهی و تحلیل اطلاعاتی که جمع آوری مینمایند نشوند. هایک به شوخی میگوید "نظریه خوش رفتار است و با تربیت، اما اطلاعات هرگز این گونه نیستند".
جنیفر جت
ما در این جا با سه آمار شناسی آشنا میشویم که زندگی خود را صرف بالا و پایین کردن اعداد و ارقام نمودهاند تا پاسخ گوی سؤالات سخت باشند. روندهایی را که آنها کشف مینمایند به جنبههای گوناگون جهان ما معنی میبخشد، از هنر و حیوانات گرفته تا مغز انسان و بیس بال.
"من میتوانم آن را حل کنم!"
هر چند گالری ملی هنر بخشی از مؤسسهی اسمیتسونین نیست اما این گالری یکی از چندین موزهای است که در طول یک زمین پارک در واشینگتن دی سی که به نام بازار شناخته میشود کشیده شدهاند. گالری ملی دارای یکی از بزرگترین مجموعه مدالهای تصویری بر جای مانده از عهد رنسانس ایتالیایی است. این عهد دورهای هنری است که از سال 1350 تا سال 1600 ادامه داشت.یک روز لیشا گلینسمن شیمی دان ارشد گالری ملی با طرح سؤالی به نزد هایک آمد. آیا این امکان وجود دارد تا از دستور العملهای مختلف تهیهی فلز برنز برای کمک به متخصصان در جهت تشخیص این مطلب که کدام یک از هنرمندان هر یک از مدالهای بدون علامت را ساخته است است بهره جسته شود؟ هایک با خود فکر کرد که چه سؤال جالبی. از این رو وی تصمیم به جستجوی جواب این سؤال گرفت.
گالری ملی تکریم هنر، واشینگتن
هایک با استفاده از آمار توصیفی دریافت که هر مدال برنزی از یکی از هفت و یا هشت آلیاژ مختلف (یا مخلوطی از فلزهای مختلف) ساخته شدهاند. به عنوان نمونه هر آلیاژ حاوی درصد متوسط مختلفی از مس، قلع و روی است. بزرگترین شگفتی: هیچ یک از این آلیاژها دستور العمل انحصاری فقط یک هنرمند نبودند. به همان شکلی که ممکن بود یک مجسمه ساز بسته به موضوعی که باید بر روی آن کار میکرد از میان چندین نوع سنگ یکی را انتخاب نماید، هر برنز کاری هم از چندین نوع آلیاژ بهره میبرد.
هایک اظهار میدارد که این اکتشاف "دقیقاً مسیر پروژه را عوض کرد". این موضوع نشان داد که برنز در ایتالیای دورهی رنسانس یک محصول خاص منحصر به فرد نبوده است که به وسیله هر کارگاهی به شیوهی خاص خود تهیه شود. در عوض انواع بسیاری از برنزهای مختلف وجود دارند. هنرمندان برای اهداف متفاوت خود از دستور العملهای متفاوتی استفاده مینمودند.
آمار پاندا
نوع دوم آمار گیری آمار استنباطی خوانده میشود. این آمار معمولاً شامل "آزمونهای معنی دار بودن" میشود. این آزمونهای ریاضیاتی سعی در این امر دارند تا تعیین نمایند که آیا یک الگوی مشخص واقعی است و یا احتمالاً بر حسب شانس اتفاق افتاده است. پروژهای که هایک بر روی آن کار کرد و شامل پانداهای بزرگ میشود نمونهای خوب را به دست ما میدهد.سالیان درازی است که دانشمندان چینی در حال واکسینه نمودن پانداهای بومی خود در برابر بیماریهای شایع در میان سگها و دیگر حیوانات خانگی بودهاند. در حقیقت این متخصصان از واکسنهایی استفاده نمودند که برای سگها ساخته شده بودند. برخی از دام پزشکان چینی نگران این موضوع بودند که ممکن است واکسنهای سگها به همان خوبی از وجود پانداها محافظت ننمایند.
برای بررسی این مورد این دام پزشکان اطلاعات موجود در نمونه خونها را برای هایک ارسال نمودند. این دام پزشکان در یک دورهی شش ساله خون 19 پاندا را در چین جمع آوری نمودند. هایک فوراً الگویی مشکل ساز را کشف نمود.
ابی وود، باغ وحش ملی اسمیسونیان
هم چنین واکسیناسیون باید پایدار باشد و نتایجی یک سان را در هر سال ایجاد کند. اما هایک متوجه شد که سطح پادتنهای بدن پاندا به طرز چشم گیری از سالی به سال دیگر دچار تغییر میشد. یک جای کار باید دچار ایراد باشد!
این امر کاملاً واضح و روشن نبود که آیا این تغییرات واقعی بودند و یا این که واکسنها دچار مشکل بودند. نوسانات تصادفی در خون پاندا ممکن است موجب شوند تا سطح پادتنهای بدن این حیوان در یک سال بالا رود و در سال دیگر دچار افت شود. اگر واکسن در این ماجرا مقصر نباشد آن گاه این احتمال میرفت که دانشمندان پول زیادی را صرف تلاش برای حل مشکلی نمایند که اصلاً و ابداً وجود خارجی نداشت.
اما آزمونهای ریاضیاتی هایک تردید اندکی بر جای گذاشتند. وی تغییراتی را در ایمنی بدن این حیوانات مشاهده نمود که بیش اندازه بزرگ و سیستماتیک بودند تا بتوان آنها را تنها بر حسب تصادف خواند. کار وی آن چه را که هم کاران دام پزشک او بدان شک برده بودند تأیید نمود: تولید کنندگان واکسن در چین محصولاتی با ثبات را تولید نمیکردند. کیفیت واکسن در برخی از سالها پایین بود. پانداها در این سالها از میزان حفاظت خوب و مناسبی در برابر بیماری برخوردار نبودند.
این امر نشان میدهد که چرا آمار به مانند کار کار آگاهان است. آمار توصیفی الگویی را کشف مینماید که غیر عادی است. آمار استنباطی مجرم و خطا کار را گیر میاندازد (و یا این که از باز داشت نمودن ناظری بی گناه جلو گیری مینماید). هیک این گونه شرح میدهد که "انجام این کار همیشه نیازی به ریاضیات پیش رفته ندارد". "اما این کار به صرف زمان بسیار زیادی در مطالعه و دانش نیاز دارد تا به یک مشکل نظاره کنید و بگویید، "من میتوانم این مشکل را حل کنم. نمیدانم چگونه، اما میدانم که میتوانم از پس آن بر آیم"".
آمار بر روی مغز
شاید شما تصور دارید که برایان کافودارای اعداد و ارقامی بر روی مغز باشد. یک خروار از انها.تخصص کافو نوعی از اسکن نمودن مغز به نام "تصویر برداری تشدید مغناطیسی تابعی" ــ یا به اختصار fMRI است. برخلاف پرتوهای ایکس که تنها ساختار مغز را نشان میدهند این تصاویر رنگی ایجاد شده به وسیله fMRI مغز را به هنگام فعالیت نشان میدهند. به خصوص عصب شناسان دوست دارند تا بفهمند که کدام یک از بخشهای مغز به هنگامی که فر دبه انجام عملی خاص میپردازد روشن میگردند (و کدام یک نمیشوند). این کار به آنها کمک مینماید تا ارتباط بین بخشهای مختلف مغز را ترسیم نمایند.
اهدایی برایان کافوی
کافو در دانشکدهی بلومبرگ سلامت عمومی دانشگاه جان هاپکینز در بالتیمور به فعالیت میپردازد. وی در آن جا به جدا سازی سیگنالهای مغزی واقعی موجود در تصاویر fMRI از پارازیتهای بی معنی میپردازد. آمار ابزاری که وی برای پاک نمودن این "پارازیت" گیج کننده نیاز دارد را فراهم میآورد.
با این وجود بهره گیری از تصاویر fMRI تا حدودی ما را دچار چالش مینماید. معمولاً دانشمندان یک کمیت را (که ما آن را x میخوانیم) به کمیتی دیگر (که ما آن راy میخوانیم) مرتبط میسازند. به عنوان نمونه این که فرد با چه سرعتی یک توپ را پرتاب مینماید (x) مسافتی که آن طی خواهد نمود (y) را تعیین مینماید. اما چه کاری را میتوان به انجام رسانید وقتی که مقادیر داده شده برای x و y نه عدد بلکه تصویر هستند؟
تا کنون بهترین راه کار، تبدیل نمودن تصاویر به عدد و رقم بوده است. انجام این کار اعداد و ارقام بسیاری را ایجاد میکند. به یاد این گفتهی قدیمی میافتیم که میگوید: یک تصویر به هزاران کلمه میارزد. اما با یک اسکن سادهی fMRI این امکان وجود دارد که یک تصویر به صدها هزار عدد و رقم تبدیل شود. آمار شناسان بایستی ریاضیات را در ذهن خود متصور دارند تا این اطلاعات را به شیوههایی که چیزی معنی دار را در اختیار دانشمندان قرار دهند فشرده و پردازش نمایند.
در کمال تعجب کافو به هنگامی که اولین بار پا به دانشگاه گذاشت هرگز انتظار این را نداشت که در زمینهی زیست شناسی و آمار به فعالیت بپردازد. او این گونه به یاد میآورد که "من درس خود را در رشتهی هنر آغاز نمودم". اما او به تلاش خود ادامه داد و در کلاسهای هنر خود نمراتی متوسط را به دست آورد. در این اثناء هم چنین به حضور در کلاسهای ریاضیات پرداخت ــ و کار خود را کاملاً خوب به انجام رساند. در نهایت وی رشتهی خود را از هنر به ریاضیات تغییر داد.
بعدها فرصتی برای انجام پارهای تحقیقات در دانشگاه فلوریدا کافو را قانع گرداند تا وارد زمینهای به نام زیست آمار وارد شود. این رشته از ریاضیات، برای یافتن روند اطلاعات زیست شیمی بهره میگیرد. این عملیات ممکن است شامل عدد و رقمهایی شود که به تشخیص این مطلب که چه کسی مریض میشود و یا این که یک روش درمانی به چه مقدار در درمان افراد مؤثر است کمک مینماید.
مؤسسهی ملی سلامت
کافو در سال 2011 و در سن 38 سالگی موفق به دریافت جایزهی دورهی آغازین ریاست جمهوری برای دانشمندان و مهندسان گردید. وی و دیگر برندگان جوایز دعوت نامهای به کاخ سفید را دریافت نمودند. کافو دریافت که او تنها "آمار شناس" موجود در میان این برندگان است. با این حال وی به سرعت دریافت که بخش بزرگی از دیگر برندگان نیز از آمار بهره جسته بودند.
کافو توضیح میدهد که "شما ممکن است با فرد دیگری ملاقات نمایید که عنوانش "روان شناس" یا "جامعه شناس" و یا "متخصص بیماریهای واگیر دار" باشد اما کار آنها 100 درصد با آمار مربوط به آن حوزه سر و کار دارد". وی اظهار میدارد که این درس برای دانش آموزان چنین است: "اگر شما بخواهید در دنیای علم قدم بر دارید باید به انجام آمار بپردازید ــ اهمیتی ندارد چه رشتهای".
مانیبال: همهی آن مربوط به اعداد است
قرن بیست و یکم عصری جدید را به بیس بال عرضه داشته است. این قرن عصری است که به اندازهی صدای آرام کامپیوترها با صدای ترق چوب چوگان نیز شناخته میشود. زمان و روزهایی که در آنها تصمیمهای مهم بر پایهی حدسیات و سنتها گرفته میشدند گذشته است. تیمها اقدام به اخذ تصمیمات خود به صورت علمی کردهاند. و به نحو فزایندهای تصمیمات خود را بر مبنای اطلاعات قرار میدهند. هیچ کس بهتر از فرهان زیدی نمایانگر این عصر جدید نیست. وی مدیر عملیات بیس بال برای تیم اتلتیکس، یک تیم لیگ برتری در شهر اوکلند ایالت کالیفرنیا، است.در اوایل قرن بیستم تیم اوکلند اتلتیکس بدل به یکی از اولین تیمهایی گشت که آزادانه از محاسبات ریاضی برای برآورد نمودن ارزش هر یک از بازی کنان بیس بال بهره برد. مدیر عامل این تیم بیلی بین بود. در آن زمان تیم اتلتیکس از پول چندانی برای پرداخت دست مزد بازی کنان خود برخوردار نبود. اما با این وجود این تیم از روندی موفقیت آمیز برخوردار بود. و این امر به خاطر شناسایی افراد مستعدی بود که تیمهای دیگر آنها را نا دیده میگرفتند ــ یعنی بازی کنان خوبی که ارزان قیمت در میآمدند.
مانیبال، کتابی که در سال 2003 به چاپ رسید (و در سال 2011 تبدیل به فیلمی با همین عنوان گردید)، داستان پس پردهی موفقیت این تیم را روایت میکرد. زیدی که در آن هنگام دانش جوی فارغ التحصیل اقتصاد رفتاری بود این کتاب را مطالعه کرد و آن را به عنوان یک "الهام" دریافت. وی همواره یکی از طرف دارن ورزش بیس بال بود. با این وجود وی تصور مینمود که داشتن یک دورهی ورزش در این رشته برای فردی مثل او غیر قابل تصور است (که آخرین بار در یک لیگ کوچک به بازی پرداخته بود). او اظهار میدارد که مانیبال " نشان داد که افرادی که از سوابق ورزشی معمولیای برخوردار هستند میتوانند فرصتی برای پرداختن به این رشتهی ورزشی داشته باشند".
چنین فرصتی برای او حتی زودتر از آن چه تصورش را داشت پیش آمد.
مایکل زاگاریس، اوکلند اتلتیکس
زیدی اظهار میکند که "هنگامی که بیلی ]بین[ با من تماس گرفت تا پیشنهاد این کار را به من بدهد چنان هیجان زده شده بودم که یک کارت راهنما برداشتم و شمارهی موبایل خود را بر روی آن نوشتم. "من هنوز هم آن کارت را بر روی تابلوی اعلانات درون دفتر خود نگه داشتهام. من این کارت را در آن بالا نگه میدارم چرا که این آرزویی است که به واقعیت پیوسته است". حتی زمانی که در یک مسیر جادهای از هر هفت بازی تنها در دو تای آنها برنده میشویم "من به خانه بر میگردم و به آن کارت نگاه میکنم. این کار به خاطر من میآورد که هر روز حضور در این پست یک هدیه محسوب میشود".
در این صورت زیدی به خواست خود رسیده است. تجزیه و تحلیلهای آماری وی از ریسکی که تیم اوکلند اتلتیکس در سال 2012 به عمل آورد حمایت میکرد. در این هنگام بود که این تیم قرار دادی بزرگ را به یک مهاجر بی نام و نشان کوبایی به نام یونس کسپدس پیشنهاد نمود. کسپدی به تیم اوکلند اتلتیکس پیوست و بدل به یکی از بزرگترین ستارههای این سال شد و تیم خود را تا بازی پلی آف هدایت کرد.
"علم تجزیه و تحلیل" در بیس بال
زیدی به شیوههای بزرگ و کوچک در این تیم مشارکت مینماید. او حریفان پیش روی را شناسایی مینماید. سپس وی با بهره گیری از تجزیه و تحلیلهای آماری اماکن و نحوهی قرار گیری بازی کنان انتهای زمین و توپ گیرها را در برابر توپ زنهای مختلف پیشنهاد میدهد. وی هم چنین بازی کنان سیستم لیگ کوچکتر را مورد ارزیابی قرار میدهد. هیچ روشی برای اطمینان یافتن از این که کدام تیم تبدیل به تیم لیگ برتری موفق خواهد شد وجود ندارد. با این وجود آمارها پرده از برخی الگوها بر داشتهاند که برای هوا داران و حتی مربیها نیز آشکار نخواهند بود.زیدی به نشریهی اخبار علمی برای دانش آموزان گفت که به عنوان نمونه "ما تلاش داریم تا بیشتر از کسب نتایج بر روی مهارتها تمرکز داشته باشیم". این بدین معنی است که وی چندان توجهی را به معیارهای خاص قدیمی مانند متوسط توپ زنی ندارد. او اشاره میکند که "متوسط توپ زنی یک نتیجه است".
روشهای زیدی مرتباً رو به تغییر هستند. وی در توضیح چگونگی نحوهی شناسایی نمودن توپ زنهای لیگ کوچکتر این گونه اظهار میدارد که "شاخص اصلی ما میزان حذف شدنها از بازی بود". اکنون وی دیگر تنها بر تعداد دفعات حذف شدن از بازی تمرکز نمینماید. در عوض زیدی به تجزیه و تحلیل تعداد پرتابهایی که برای حذف هر بازی کن توپ زن انجام میپذیرند میپردازد.
زیدی این گونه شرح میدهد که "برخی از پرتاب کنندگان بر توپ زنان برتری دارند و آنها را با سه چهار پرتاب از دور بازی حذف مینمایند." برخی دیگر ممکن است چندین پرتاب را از دست بدهند، مرتکب چند خطا شوند و سپس آنها را از دور بازی حذف نمایند". وی در حال حاضر بر این باور است که حذف شدن از دور بازی در طی 10 پرتاب عاملی خوب برای تعیین موفقیت یک پرتاب کننده نیست ــ حداقل در لیگهای بزرگ.
متخصصان به خصوص در دنیای تجارت تجزیه و تحلیل روندهای پنهان در مقادیر زیادی از اطلاعات را با اصطلاح آنالیتیکس تعریف مینمایند. در مدت این نه سالی که زیدی به تیم اوکلند اتلتیکس پیوسته است، علم تجزیه و تحلیل جای گاه خود را در بازی بیس بال نگه داشته است. وی بیان میکند که "در دفتر جلوی هر تیمی فردی وجود دارد که مشغول انجام تجزیه و تحلیلهای آماری است". این کار در دیگر ورزشها نیز مورد قبول واقع گردیده است. MIT، جایی است که زیدی در آن جا به دانشگاه رفت در حال حاظر همه ساله کنفرانسهای بزرگی را دربارهی تجزیه و تحلیلهای ورزشی برگزار مینماید.
زیدی همواره در تلاش است تا به خود یاد آوری نماید که بهره بردن از محاسبات ریاضی برای شناسایی نمودن روندهای معنی دار (به مانند تعداد دفعات حذف از بازی در سه پرتاب در برابر 10 پرتاب) نیازمند بسیار ساده نمودن هر آن چیزی است که در دنیای واقعی اتفاق میافتد. وی بیان میدارد که از این رو این کار متواضعانه به نظر میرسد. "من تصور میکنم که مردم بیشتر مشتاق هستند تا به هنگامی که میبینند شما اندکی ادویه چاشنی کار خود میکنید به حرفهایتان گوش کنند".
اکنون وقتی که هم کلاسیهای شما ریاضیات و آمار را به کناری میگذارند و از شما میپرسند که این درسها به چه دردی میخورند شما میتوانید در پاسخ به آنها بگویید: آنها به مردم از همهی اقشار جامعه (و پانداها) کمک مینمایند. کار آگاههای اطلاعات در پس پرده به فعالیت میپردازند تا هر کاری که ما به انجام میرسانیم را اندکی بهتر نمایند.
/ج