نویسندگان: یان کریستنسن، هاگ واگنر و سباستین هالیدی
مترجمان: ابوالقاسم بشیری، جمشید مطهری و رحیم میردریکوندی
مترجمان: ابوالقاسم بشیری، جمشید مطهری و رحیم میردریکوندی
نکات کلیدی
ساخت گرایی:
دیدگاهی که معتقد است ادراک ها از احساس های ابتدایی ساخته می شوند، ساخت گرایی نام دارد. تلاش هایی که تاکنون برای کشف و فهرست بندی احساس های ابتدایی انجام شده، غیر عملی بودن این امر را نشان داده است؛ ولی شکل جدید ساخت گرایی که بر تجزیه و تحلیل ویژگی های دیداری استوار است، هنوز تأثیرگذار می باشد.گشتالت:
نظریه پردازان گشتالت معتقد بودند که ادارکِ شکل، نخستین ادراک است و نمی توان آن را به عناصر کوچک تر کاهش داد. اصول سازمان ادراکی این نظریه پردازان، امروزه نیز مفید هستند؛ هر چند روشن شد که مکانیزم های عصب شناختی ای که گمان می رفت زیربنای این اصول را تشکیل می دهند، اشتباه بوده است.تحلیل ویژگی:
تحلیل ویژگی، عبارت است از شکلی از پردازش اطلاعات که به وسیله ی آن، تصویر شبکیه ای با به کارگیری سلول های اختصاصی یا گروهی از سلول ها که برای این منظور تکامل یافته اند، به مؤلفه های اساسی تجزیه می شود. یکی از نقاط ضعف این اندیشه آن است که ثابت شده تعیین دقیق ماهیت این مؤلفه ها (یا ویژگی ها) مشکل است. در هر صورت، این امر با توفیق در سیستم های ماشینی بازشناسیِ بینایی که مجموعه ی ویژگی ها می توانند با دقت مشخص شوند، به کار برده شده است.بی نظمی:
بی نظمی یک سیستم، بازشناسی خاصی است که تحلیل ویژگی را به عنوان مرحله ی اول خود به کار می برد و مراحل بعدی را که سیستم بازشناسی را تشکیل می دهد، به وجود می آورد. مرحله ی نهایی، از ویژگی فرآیند تصمیم گیری برخوردار است و در نتیجه، سیستم ممکن است در صورت ابهام یا نامرغوب بودن شواهد حسی، مرتکب اشتباه شود.نظریه های مبتنی بر مدل:
از نظریه های الگو و نمونه ی نخستین، هر دو به عنوان نظریه های مبتنی بر مدل یاد می شود، زیرا این نظریه ها بازشناسی را فرآیندی می دانند که در آن تصویر شبکیه ای با بازنمایی ها یا مدل های اشیای ذخیره شده، مقایسه می شود. هیچ کدام از این سیستم ها نمی تواند به طور رضایت بخش بازشناسی اشیای نو را تبیین کند.نظریه های محاسبه ای:
نظریه ی محاسبه ای «مار» به لزوم تعیین ماهیت فرآیندهای محاسبه ای و تحلیلی موجود در تحلیل تصویر و شناسایی شیء می پردازد. این نظریه را می توان دقیق ترین نسخه ی رویکرد پردازش اطلاعات به حس بینایی دانست.نظریه های مبتنی بر مؤلفه:
نظریه های مبتنی بر مؤلفه ها، شناسایی اشیاء را برحسب شکل های هندسی بنیادی - به جای ویژگی های نخستین تبیین - می کند. این شکل ها یا تصاویر را می توان برای ساختن تعداد زیادی از پیش نمونه های اشیاء به کار برد و بدین وسیله سیستم می تواند به بازشناسی اشیای نو بپردازد.ساخت گرایی (1)
ساخت گرایی در سال های نخست قرن بیستم ارائه شد. این نظریه بر این فرض بنیادی مبتنی است که تجربه روانی، از ترکیب عناصر ساده پدید می آید، درست همان طور که ترکیبات شیمیایی از عناصر اولیه ساخته می شوند. طبق این نظریه گمان می رفت که شکل ادراک شده، از احساس های ابتدایی ساخته می شود و فرآیند تشخیص این احساس ها به کمک روش «درون نگری تحلیلی» تحقق می یابد. در این زمان مشاهده گران به منظور پرداختن به ویژگی های بی واسطه و اولیه ی یک شیء و گزارش آن بدون توجه به تمام جوانب دیگر آموزش می دیدند؛ در نتیجه مثلاً شخصی که به یک جعبه کوچک نگاه می کرد، می توانست حاشیه ها و گوشه ها، سایه ها، تبدیل رنگ ها به همدیگر و غیره را گزارش کند؛ ولی این مشاهده گران می بایست درون و محتوای جعبه، یعنی برای مثال غلات صبحانه را نادیده بگیرند. پس از چند سال استفاده از این روش، فهرستی تقریباً از چهل هزار احساس ابتدایی که به نظر می رسد تعداد بسیار زیادی باشد، به دست آمد. به علاوه اغلب، بین اطلاعاتی که اشخاص مختلف ارائه می کردند، تفاوت های زیادی وجود داشت. همین امر نشان می داد که این روش نقایصی دارد. با وجود این، اندیشه های اصل ساخت گرایی تاکنون همچنان تأثیرگذار باقی مانده اند.گشتالت
روان شناسان گشتالت، دیدگاه دیگری در مقابل ساخت گرایی مطرح کردند. آن ها معتقد بودند که بخش های طبیعی ادراک، عبارت است از شکل و قالب، نه احساس ها که نقش پایه دارند. بر همین اساس آن ها اظهار می کردند که همیشه نماهای دیداری، بر حسب ساده ترین و استوارترین شکل های ممکن (قانون طرح گرائی (2)) ادراک می شوند. اصول سازمان ادراکی گشتالتی نیز شرح می دهد که چگونه ما به ارتباط بین عناصر میدان ادراکی - نه خود عناصر - واکنش نشان می دهیم. مهم ترین اصول ادراکی این نظریه در ذیل آمده است (همچنین به شکل 1 نگاه کنید).1. اصل مجاورت (3)
(شکل c-a) 1)): احتمال این که عناصر به هم نزدیک تر به صورت یک واحد متعلق به هم ادراک شوند، بیشتر است. در شکل (a) ما ردیف هایی از عناصر را می بینیم؛ چون که فاصله ها در ردیف های افقی نسبت به فاصله ها در ردیف های عمودی کمتر می باشد. در شکل (b) این سازمان محو می شود؛ چرا که فاصله ها در ردیف های افقی و عمودی، برابر هستند، و در شکل (c) برعکس، عناصر به شکل ستونی دیده می شوند؛ چون در این جا فاصله ها در ردیف های عمودی کمترند؛2. اصل تقارن (4)
(شکل 1 - d): عناصری که از بخش های متقارن تشکیل می شوند، بیشتر از عناصر غیر متقارن به صورت یک واحد متعلق به هم ادراک می شوند؛ چنان که در کادر طرف چپ، ما الگوهای سفیدی را بر روی زمینه ی سیاه می بینیم و تقریباً دیدن الگوهای سیاه بر روی زمینه ی سفید به مدت بیش از چند ثانیه، غیرممکن است. در کادر سمت راست، عکس این مطلب صادق است. این امر نشان می دهد که الگوی ثابت کادر را تقارن خط ها تعیین می کنند نه رنگ ها؛3. اصل پیوستگی مناسب (5)
(شکل e - 1): عناصر بدان جهت در یک گروه قرار می گیرند تا حتی المقدور خطوط صاف و بدون گسستگی را پدید آورند. در این تصویر، نقاطی مشاهده می کنیم که دو خط یکنواخت را تشکیل می دهند و یکدیگر را قطع می کنند. به صورت های دیگر نیز می توان این پدیده را تفسیر کرد؛ ولی به آسانی ادراک نمی شوند؛4. اصل شباهت (6)
(شکل f - 1): عناصری که شبیه به همدیگر هستند، بیشتر به عنوان یک واحد متعلق به همان شکل دیده می شوند. چنان که مشاهده می کنید، در این تصویر برای ما دیدن دو مثلث از دیدن ستاره ی شش پر راحت تر است؛5. اصل بستن (7)
(شکل g - 1): در ساختار ادراکی ما عناصر به گونه ای با یکدیگر گروه بندی می شوند که شکل های کامل تر یا بسته تر را آسان می کنند. در این تصویر، سه شکل مجزا وجود دارد؛ ولی اصول پیوستگی مناسب و بستن، ادراک قرار گرفتن یک میله پشت سر میله ی دیگر را تسهیل می کند.الگوهای سازمانی مشابه در حس شنوایی، به ویژه در ادراک آهنگ ها دیده می شوند. نت هایی که در زیر و بمی، نزدیک به یکدیگر هستند، بخش هایی از یک آهنگ ادراک می شوند (نمونه ای از قانون مجاورت) و جدایی بین شکل و زمینه نیز، همان تمایز بین آهنگ و نواختن های همراه آن می باشد.
همین طور هنگامی که چندین وسیله موسیقی به طور هم زمان نواخته می شوند، ما گرایش داریم آن هایی را که صدای مشابهی دارند، در بخش های یکسان گروه بندی کنیم که نمونه ای از قانون شباهت است. همچنین یک رشته آهنگ هایی که در یک جهت هستند، معمولاً به بخشی از همان آهنگ ادراک شوند حتی موقعی که به عنوان بخشی از رشته ی متفاوت نواخته شوند. این نمونه ای از قانون پیوستگی مناسب است (شکل 2).
در برخی موارد در چگونگی تمایز شکل - زمینه، ابهام وجود دارد. مکتب گشتالت در این زمینه می گوید یک محرک می تواند بیش از یک ادراک خاص را پدید آورد. آن ها بدین وسیله این نکته را ثابت کرده اند که کارکرد یک کل را نمی توان به وسیله تک تک عناصر آن تعیین کرد (شکل 3).
روان شناسان گشتالت برای برخی مثال های ادارک شکل، تفسیرهای خوبی ارائه کرده اند و بسیاری از توضیحات آن ها قانع کننده بوده است؛ ولی تبیین هایی را که ارائه داده اند، به مراتب کمتر مفید می باشد؛ زیرا این تبیین ها بر اصل «هم ریخت بینی (8)» مبتنی بوده اند. این اصل بیانگر آن است که بین فرآیند سازمانی ادراک و سازمان فعالیت الکتریکی مغز، مطابقت وجود دارد؛ ولی تلاش هایی که برای فراهم کردن شواهد تجربی برای این اصل انجام شده، با شکست روبه رو گردیده است.
شکل 3. یک محرک وارون پذیر شکل زمینه که قابلیت آن را دارد که به شکل دو چهره ی روبه روی هم و همچنین یک گلدان دیده شود.
تحلیل ویژگی های اشیاء
ما می توانیم شکل ها را به منزله مناطق تصویری در نظر بگیریم که بر روی شبکیه منعکس می شوند و هر کدام خطوط ویژه ای دارند. هر کدام از این مناطق؛ گستره ی فضایی، بافت، رنگ، سایه، و ویژگی های دیگری را دارند. ما می توانیم این کیفیات را ویژگی های مناطق بنامیم که ما را در تشخیص اشیاء از یکدیگر قادر می سازند.گاهی چنین تشخیصی تنها به تعداد کمی از ویژگی ها نیاز دارد؛ مثلاً فرق گذاشتن بین سگ و گوسفند، و گاهی به ویژگی های نسبتاً بیشتری نیاز دارد. باید توجه داشت که افتراق ادراکی به شناخت قبلی از اشیاء مورد نظر بستگی ندارد. اکنون می توان فرض ساخت گرایان را که در گذشته در قالب احساس ها بیان شد، بر حسب ویژگی های اشیاء بیان کرد و مجموعه ای از کارهای تجربی که به شناسایی تعداد نسبتاً کمی از ویژگی های بنیادی که شامل رنگ، روشنی، جهت، طول، انحناها، پایان خطوط، محل تقاطع، و بسته شدن خطوط می شود را می توان ذکر کرد. این رویکرد از یکی از مشکلات عمده در مورد درون نگری تحلیلی به دور است؛ چرا که ویژگی های اشیاء برخلاف استنباط از گزارش های کلامی، مستقیماً قابل مشاهده هستند. با وجود این، مجموعه ی ویژگی هایی که از تجربه خاصی به دست می آیند، تا اندازه ای به نوع فعالیتی که به کار رفته بستگی دارد؛ بنابراین هنوز ممکن است در کل مجموعه ویژگی ها تجدید نظر کرد. وقتی ویژگی های بینایی این گونه وصف می شوند، این احتمال وجود دارد که بتوان آن ها را به منبعشان در میدان های دریافتی سلول ها در مسیر بینایی نیز نسبت داد.
این نوع پردازش، پردازش از پایین به بالا (9) (یا برخاسته از داده ها) نامیده می شود؛ چون که اطلاعات ورودی طبق قوانینی که بر اساس ساختار مسیرهای حسی تعیین می شوند، پردازش می گردند. پردازش هدایت شده به وسیله ی داده ها، هنوز ویژگی ها و الگوهای موجود در دورن داد حسی را تحلیل و ثبت می کند، و احتمالاً به جزئیات موضعی یک شیء بیش از جزئیات کلی آن می پردازد؛ ولی در برخی اوقات جزئیات کلی با سهولت بیشتری نسبت به جزئیات موضعی بازشناسی می شوند (شکل 4). شواهدی وجود دارد که مشاهده گران به طور ارادی می توانند توجهشان را از جنبه های کلی یک تصویر به جنبه های موضعی آن و برعکس تغییر دهند.
گاهی شناسایی اشیاء با تحلیل ویژگی شروعی شود؛ ولی در آن پردازش بالا به پایین (یا هدایت شده به وسیله مفهوم) به کار می رود. در این روش ما از تجربه و دانش قبلی خود درباره ی جهان اطرافمان برای شناسایی استفاده می کنیم. پردازش هدایت شده به وسیله ی مفهوم، یکپارچه کردن ویژگی ها را در اشیای ادراکی بر عهده دارد که غالباً با انتظارات محتمل در یک موقعیت خاص، هم زمان است. بافت، یک عامل خیلی مهم در فرآیند شناسایی می باشد؛ مثلاً اشیایی که به سرعت به افراد ارائه می شوند، در بافت های آشنا نسبت به بافت های ناآشنا با سهولت بیشتر بازشناسی می شوند، و گاهی ادراک اشیای مبهم را تنها بافت آن ها تعیین می کند (شکل 5).
نظریه ی بی نظمی (10)
نظریه بی نظمی سلفریج (11) در شناسایی، بر عنصر استخراج ویژگی ها تأکید می کند. هر مرحله در این فرآیند، به کمک «عواملی» با وظایف مشخص تأمین می شود. عامل های تصویر، پیام خارجی را ثبت می کنند و آن را به عامل های ویژگی انتقال می دهند. هر کدام از این عامل ها، ویژگی مخصوص به خود را درون تصویر جست و جو می کنند و تنها با یافتن آن، واکنش نشان می دهند. در سطح بعدی، عامل های شناختی به واکنش های عامل های ویژگی نگاه می کنند؛ زیرا آن ها نیز به نوبه ی خود، باید تنها در صورت شناسایی ترکیب خاصی از ویژگی ها واکنش نشان دهند. عامل های شناختی زمانی که این امر اتفاق بیفتد، با شور و شوق عکس العمل نشان می دهند؛ ولی زمانی هم که چیزی مشابه الگویشان نشان داده شود، فعالیت کمی نشان می دهند. عملکرد به دست آمده که خصوصیت بی نظمی دارد، به وسیله ی عامل تصمیم گیرنده که باید تعیین کند کدام یک از عامل های شناختی بیشترین فعالیت را نشان داده اند، تفسیر می شود. عضو تصمیم گیرنده ممکن است زمانی که چندین عضو شناختی الگوهای فعالیت مشابهی را نشان می دهند، اشتباهاتی بکند و در نتیجه به اشتباه در شناسایی منجر شود. تاکنون مدل های بی نظمی را در ماشین هایی به کار برده اند که می توانند حروف چاپی را تشخیص دهند؛ نظیر ماشین هایی که برای شناسایی چک های بانکی به کار می روند.نظریه های مبتنی بر مدل
نظریه های مبتنی بر مدل به جای ویژگی های اشیاء بر شناخت ادراکیِ مفهومی و مفصل انسان از جهان متکی هستند. نظریه ی الگو (مقایسه) بر این عقیده پایه گذاری شده است که افراد تصویر دریافتی را با نمودهای ذخیره شده در حافظه (الگوها (12)) که از قابلیت درجه بندی بر حسب اندازه و چرخاندن برای هماهنگی با جهت مورد نظر برخوردارند، مقایسه می کنند. بر اساس این نظریه مقایسه های متوالی انجام می شود تا همتای مربوط به دست آید. از این روش برای طراحی روبات هایی استفاده می شود که می توانند اشیاء را شناسایی کنند و با استفاده از درون داد دوربینی ویدئویی در آن ها دخل و تصرف نمایند. با وجود این، مدل الگو نمی تواند اشیای جدید را شناسایی کند؛ همچنین این نظریه به مسأله ی چگونگی به وجود آمدن الگوها در مرحله اول نمی پردازد. البته روبات ها، برای به دست آوردن الگوها به کمک انسان ها نیاز دارند. نظریه های نمونه، نخستین دسته ای دیگر از نظریه های الگو هستند. این نظریه ها - برخلاف نظریه الگو - بر این باورند که بازنمایی ذخیره شده، یک تصویر نیست؛ بلکه مجموعه ای از ویژگی هاست که فرآیند شناسایی انعطاف پذیرتری را ممکن می سازد؛ در نتیجه نظریه ی الگو به چندین تصویر صندلی (از جمله تصویر صندلی های دسته دار و بدون دسته) به منظور شناسایی مطمئن تر تمام صندلی ها نیاز خواهد داشت؛ ولی سیستم نمونه ی نخستین، صرفاً یک مجموعه ویژگی های تعیین کننده را لازم دارد. چنین امری این احتمال منطقی را در پی دارد که بعضی از اشیاء ممکن است به عنوان صندلی لحاظ شوند؛ در حالی که برای آن ها چنین مقصودی به معنای دقیق کلمه در میان نبوده است. با وجود این، بر اساس این نظریه ها نیز، شناسایی اشیای جدید مشکل آفرین باقی مانده است.نظریه های محاسبه ای
با نفوذترین نظریه در میان نظریه های محاسبه ای، نظریه ی «دیوید مار (13)» می باشد. دیوید مار در کارهای خود بر لزوم درک ساختار تصویر بصری تأکید می کند. موضوعی که معمولاً نظریه های دیگر - به جز گیبسون - از آن غفلت ورزیده اند. نظریه مار، بازشناسی شیء را بر اساس سه سطح پردازش، تبیین می کند. هر کدام از این سه سطح به عنوان محاسباتی در نظر گرفته می شوند که بر روی تصویر بینایی انجام می شوند. سطح اول، عبارت است از محاسبه ی طرح اولیه که در آن ویژگی های اساسیِ تصویر بر حسب روشنی، کناره ها، و نواحی که تغییرات بارزی در شدت روشنایی وجود دارد، تبیین می شوند.این امور، برای تعیین موقعیت حاشیه ها و حدّ و مرزها که آن ها نیز اطلاعاتی درباره ی شکل و جهت دربر دارند، حیاتی هستند؛ در نتیجه طرح اولیه، برای ساختن طرح 2/5 بُعدی به کار می رود. این طرح در واقع، تفسیری از ارتباطات عمق و جهت بین سطوح تصویر از نگاه مشاهده گر می باشد. ما به این تصویر برای هدایت فعالیت ها (نظیر حرکت در محیط اطرافمان) نیاز داریم. سرانجام، طرح 2/5 بُعدی برای ساختن بازنمایی سه بُعدی که از نگاه مشاهده گر مستقل است، به کار می رود. در این مرحله ما می توانیم توصیف های اشیاء را ذخیره کنیم و بعدها آن ها را برای شناسایی به کار ببریم (به پایین مراجعه شود).
پژوهش های مبتنی بر این رویکرد، با فعالیت در زمینه ی هوش مصنوعی و علم رایانه به طور طبیعی پیوند دارند. با وجود این، یکی از پیامدهای مهم تر آن برای روان شناسی این بود نشان داده شد بازشناسی شیء، بسیار پیچیده تر از آن است که زمانی تصوّر می شد.
نظریه های مبتنی بر مؤلفه (14)
نظریه های مبتنی بر مؤلفه، از گونه ای توسعه در رویکرد محاسبه ای حاصل می شود و نشانگر تلاشی است که به مسأله ی بازشناسی اشیاء - و ویژه اشیای جدید - بدون تکیه بر مجموعه ی ویژگی هایی که به صورت قراردادی تعریف شده اند، می پردازد. در این زمینه «بایدر من» معتقد بود که انسان می تواند مجموعه ای از عناصر هندسی ابتدایی را مشخص کند که با چرخاندن و بزرگ و کوچک کردن آن می توان نمونه های نخستین اشیا را ساخت. نمونه هایی از این نمادها (یا تصاویر) هندسی (15) و اشیایی که می تواند از آن ها ساخته شود، در شکل 6 نشان داده شده اند. تعداد نسبتاً کمی از تصاویر (حدود 36 تصویر) می تواند تعداد بسیار زیادی از اشیاء را به وجود آورد.شکل 6. انتخاب چهار تصویر و نمونه هایی از اشیای پیش نمونه که می توان از آن ها ساخت.
پی نوشت ها :
1. Structuralism.
2. law of pragnanz.
3. proximity.
4. symmetry.
5. good contian.
6. similarity.
7. clasure.
8. isomorphism.
9. bottom - up.
10. pandempnium.
11. selfridg.
12. template.
13. David marr.
14. cpmponent.
15. geometric.
کریستنسن، یان و هاگ واگنر و سباستین هالیدی؛ (1385)، روان شناسی عمومی، گروه مترجمان، قم، مرکز انتشارات مؤسسه آموزشی و پژوهشی امام خمینی (رحمه الله)، چاپ اول