ابرداده: مفاهیم و کاربردها
ابرداده: مفاهیم و کاربردها
کامپیوتر علمی
مفهوم ابرداده
دلایل گسترش ابرداده
اهمیت و كاربرد ابرداده
۱-تسهیل جستجو و بازیابی منابع اطلاعاتی شبكه اینترنت
۲-نظم بخشیدن به منابع اطلاعاتی موجود در اینترنت
۳-توصیف پایگاههای اطلاعاتی، تصاویر دیجیتالی،(۱۳) فایلهای صوتی و سایر منابع غیر متنی شبكه
۴-تحلیل محتوا و نمایهسازی و سازماندهی انواع منابع اطلاعاتی شبكه
۵-تطبیق، اشتراك و یكپارچهسازی منابع اطلاعاتی ناهمگن شبكه اینترنت
۶-فراهمآوردن زمینه استفاده مجدد از انواع اطلاعات توزیع شده در محیط شبكه از طریق مستند سازی محتوای اطلاعات.۷-ایجاد امكان برای دسترسی كاربران شبكه به اطلاعات دقیق و مرتبط
۸-مدیریت برحجم گستردهای از اطلاعات شبكه اینترنت
عناصر و اجزای تشكیل دهنده ابرداده
ب) عناصری كه با مالكیت منبع در ارتباط میباشند: نظیر مؤلف یا پدید آورنده، همكار، حقوق
ج) عناصری كه در اصل به ظاهر فیزیكی منبع مربوط هستند، مثل تاریخ، شكل یا قالب، (۱۴) مشخص كننده یا شناسه گر(۱۵)
نحوه تولید و ایجاد ابرداده
۱-كدگذاری همزمان عناصر ابردادهای در منابع از طریق استانداردهایی چون زبان نشانهگذاری فرامتن(۱۶)، زبان نشانهگذاری گسترش پذیر (۱۷)و زبان نشانهگذاری استاندارد عمومی(۱۸) توسط پدیدآورندگان وب در جریان ایجاد صفحات وب(۱۹)
۲-كدگذاری غیر همزمان بعد از ایجاد صفحات وب و یا به عبارتی دیگر ایجاد پایگاه اطلاعاتی از ركوردهای ابرداده أی كه این پایگاه جدا از منابع الكترونیكی و با استفاده از نظامهای مدیریت پایگاه اطلاعاتی طراحی میشود و این امر میتواند بعد از ایجاد صفحات وب توسط متخصصان فهرستنویسی و كتابداران انجام بگیرد.
در حقیقت ابرداده را میتوان در حین خلق یك منبع یا پس از تولید و اشاعه منبع به عنوان بخشی از فرایند فهرستنویسی انجام داد.متخصصان عقیده دارند كه روش اول یعنی ایجاد ابرداده همزمان با تولید منبع الویت داشته و با صرفهترین روش میباشد. زیرا با رشد و گسترش فوقالعاده و شتابناك منابع الكترونیكی، فهرستنویسی منابع الكترونیكی پس از خلق و تولید آن امری سنگین ، هزینهبر و زمان بر خواهد بود. بنابراین بهتر است كه ابرداده هر منبعی در همان مرحله اول یعنی در زمان ایجاد صفحات وب تولید شود.
نمونه یك ركورد ابردادهای
<HEAD>
<TITLE> The Library of Congress</TITLE>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-۸۸۵۹-۱">
<BASE HREF="http://www.loc.gov/homepage/">
<META NAME= "description" CONTENT="Home page of the Library of Congress, Washington, D.C. The Library of Congress is the nation;s oldest federal cultural institution, and it serves as the research arm of Congress. It is also the largest library in the world, with more than ۱۲۰ million items on approximately ۵۳۰ miles of bookshelves. The collections include more than ۱۸ million books, ۲.۵ million recordings, ۱۲ million photographs, ۴.۵ million maps, and ۵۴ million manuscripts.">
<META NAME= "keywords" CONTENT= "library of congress, home page , catalog, copyright office, american memory, global gateway, exhibitions, america;s library, thomas, national digital preservation program, wise guide, the library today, researchers, librarians, teachers, blind, today in history">
<META HTTP-EQUIV="expires" CONTENT="Wed, ۲۶ Feb ۱۹۹۷ ۰۸:۲۱:۵۷ GMT">
<SCRIPT TYPE="text/javascript">
انواع طرحهای ابردادهای
بیشتر این تلاشها در جهت تدوین یك استاندارد بینالمللی برای توصیف منابع اینترنتی و عناصر لازم برای این منظور و شناسایی مسائل مرتبط با ابرداده معطوف بوده است. لذا با توجه به ضرورت ، دلایل و انگیزههای مختلف شكلگیری انواع قالبهای ابرداده أی برای طیف وسیعی از منابع اطلاعاتی الكترونیكی موجود در اینترنت ، استفاده از استاندارد و الگویی كه بتواند از انسجام و جامعیت بیشتری برخوردار بوده و سهولت تولید ركوردهای ابردادهای را تضمین كند از اهمیت خاصی برخوردار است.به همین جهت تا كنون طرحها و استانداردهای ابردادهای متعددی طراحی و تدوین شدهاست كه از معروفترین انها میتوان به طرحهای ابردادهای ذیل اشاره كرد.
۱- طرح ابر دادهای دابلین كور Dublin core
تاریخچه توسعه و شكلگیری قالب ایردادهای دابلین كور
این عناصر اولیه عبارت بودند از:
۱-موضوع - عنوان
۳- مولف یا پدیدآورنده
۴-ناشر
۵- سایر همكاران
۶-تاریخ
۷-نوع منبع
۸-شكل یا قالب
۹-شناسه گر یا مشخص كننده
۱۰ـ URL)) ارتباط یا رابطه با سایر منابع
۱۱- منبع اصلی
۱۲-زبان
۱۳-پوشش
در آوریل سال ۱۹۹۶ دومین كارگاه دابلینكور توسط اوسیالسی و اداره شبكهسازی كتابداری و اطلاعرسانی انگلستان(۲۴)در دانشگاه وارویك انگلستان تشكیل شد . برآیند این كارگاه پیشنهاد ساختار نمونهأی برای عناصر دابلینكور و رهنمودها و چهارچوبی برای تولید ابرداده بود كه به چهارچوب وارویك(۵۲) معروف شد .
در سپتامبر سال ۱۹۹۶ ائئلاف اطلاعات شبكهأی (۶۲)و اوسیالسی سومین كارگاه ابردادهأی دابلینكور را برگزار كردند. دستاورد عمده این كارگاه توسعه و گسترش ۱۳ عنصر ابردادهای به ۱۵ عنصر و بازنگری و تجدید نظر در مورد عناصر برای توصیف منابع غیر متنی شبكه بود.
مجموعه عناصر قالب ابردادهای دابلینكور
۲-قالب ابردادهای خدمات مكانیاب اطلاعات دولتی
این قالب ابردادهای توسط دولت فداران آمریكا و به منظور ارائهٔ ابزاری برای مكانیابی اطلاعات مناسب نهادها و ادارات دولتی در سال ۱۹۹۴ شكل گرفت. ساختار این قالب به واسطهٔ تأثیرپذیری آن از قالب مارك و استانداردZ ۳۹/۵۰ نسبتا پیچیده است. اگرچه كوردهای این قالب میتواند توسط افراد آموزش ندیده تهیه شود، اما قالب آن امكان تهیه ركوردهای پیچیده وغنی را فراهم میسازد. تأثیرپذیری این قالب از مارك(۲۷) امكان یكپارچهسازی مارك با قالب خدمات مكانیابی اطلاعات دولتی را میسر میسازد. عناصر توصیفی اصلی در قالب ابردادهای خدمات مكانیاب اطلاعات دولتی از: شامل عنوان، مؤلف، تاریخ نشر، محل نشر، چكیده، برنامهٔ اداره، توصیف منبع میباشد. برای توصیف موضوعی در قالب گزینههایی چون نمایهٔ موضوعی كنترل شده، اصطلاحنامهٔ موضوعی، اصطلاحات موضوعی كنترل نشده، اصطلاحات كنترل شده و نمایهٔ موضوعی محلی وجود دارد.عناصر دادهای این قالب برای ارائه اطلاعات تماس عبارتاند از: نام تماس، سازمان تماس، آدرس خیابان تماس، شهر، ایالت، كد پستی، كشور، آدرس شبكه، ساعات كار، تلفن نمابر.
عناصر دادهای مدیریتی در قالب مكانیابی اطلاعات دولتی عبارتاند از:تاریخ اخرین اصلاحات، تاریخ بازنگری ركورد، پدیدآورندهٔ اثر، شناسگر كنترل، شناسگر اصلی كنترل، منبع ركورد و شمارهٔ طرح.عناصر دادهای برای توصیف منبع اطلاعات و یا ركوردها عبارتند از: هدف، دسترس پذیری شامل نام توزیعكننده، سازمان توزیع كننده، آدرس خیابان توزیعكننده، شهر توزیعكننده، ایالت و استان توزیعكننده، كدپستی و كشور توزیعكننده، آدرس شبكهای توزیعكننده، ساعات كار توزیعكننده، تلفن و نمابر توزیعكننده، منابع دادهها و ركوردها.
عناصر دادهای قالب مكان یابی اطلاعات دولتی برای شرایط دسترسی و محدودیتهای قانونی ركوردها عبارتاند از: دسترسپذیری شامل فرایند سفارش(اطلاعات سفارش، هزینه، اطلاعات هزینه)
محدودیتهای دسترسی شامل محدودیتهای كلی دسترسی، كنترل اشاعه توسط پدیدآورندهٔ منبع، كنترل ردهبندی امنیتی، مدت زمان دسترسپذیری، (زمان دسترسپذیری)
۳- قالب ابرداده طرح كدگذاری متن
رهنمودهای طرح كدگذاری متن در سال ۱۹۹۴ در نتیجه یك طرح تحقیقاتی بینالمللی كه در سال ۱۹۸۷ آغاز شده بود، منتشر شد. هدف اصلی از این طرح تعیین مجموعهای از رهنمودهای كلی برای نمایش منابع متنی الكترونیكی به گونهای است كه محققان هر رشته قادر به تبادل و استفادهٔ مجدد از منابع مستقل از نرمافزار، سخت افزار و عرصهٔ كاربرد باشند. سه نهاد انجمن رایانه و علوم انسانی، انجمن زبانشناسی و رایانه و انجمن كاربرد رایانه برای متون ادبی و زبانشناسی مسئول طراحی و توسعه طرح كدگذاری متن بوده اند. سطح دشواری تولید سرعنوانهای۲۸ طرح كدگذاری متن بستگی به میزان اطلاعات جزئی وارد شده در سر عنوانهای این طرح و انطباق محتوا با قواعدی چون قواعد انگلو آمریكن دارد.طرح كدگذاری متن بر اساس زبان استاندارد نشانهگذاری عمومی(SGML) توسعه یافته است و ویژگیهای متن بر اساس این زبان توصیف میشود.
مجموعه عناصر طرح كدگذاری متن
۱-مجموعهٔ هسته: عناصری كه در مورد همهٔ منابع كار برد دارد.
۲-مجموعه پایه: عناصر دادهای كه برای دستهٔ خاصی از اسناد و مدارك مانند شعر، نثر و یا نمایشنامه كاربرد دارد.
۳-مجموعه ضمیمه: عناصر داده ای مناسب برای توصیف جزئی و یا خاص منابع مختلف.
۴-مجموعه كمكی: عناصری با نقشهای خاص
هر یك از سرعنوانهای طرح كدگذاری متن دارای عناصر توصیفی به صورت مجموعه ای از نشانه
(۲۹)است كه شامل چهار جزء اصلی است. این اجزاء عبارتاند از:
۱-عنصر توصیف فایل(File Description)
توصیف فایل شامل عناصری چون شرح عنوان، شرح ویرایش، گسترهٔ شرح انتشار، شرح فروست (۳۰)یادداشت و شرح منبع میشود.
۲-عنصر توصیف كدگذاری(Encoding Discription)
۳-توصیف پروفایل(Profile Description)
۴-توصیف بازنگری(Revision Description)
قالب ابردادهای طرح كدگذاری متن همچون قالب مارك به توصیف هویتهای فیزیكی گرایش دارد و هیچگونه ملاحظهای در مورد رهنمودهای توصیف خدمات را در بر ندارد. همچنین برای توصیف اطلاعات مربوط به مكانیابی در سرعنوانهای آن اجزایی پیشبینی نشدهاست.برای شمارههای راهنما و یا ادرس الكترونیكی نیز امكانی فراهم نمیآورد.در طرح كدگذاری متن هیچ تمهیدی برای تعیین سرشناسه(۳۱صورت نگرفته است و همچنین قالب نام اشخاص نیز توصیف نشدهاست. در این قالب ابردادهای، ملاحظات مدیریت چون اطلاعات آدرس پایانه میزبان(۲۳) نیز در نظر گرفته نشده است. از جمله دیگر مشكلات این الگوی ابردادهای فقدان پروتكلهای اینترنتی(۳۳) برای جستجو و بازیابی سرعنوانهای طرح كدگذاری متن است. در حال حاضر این قالب بیشتر برای آرشیوهای علوم انسانی كاربرد دارد.
یادداشتها
1. .search engines
2. meta data
3. Elements
4. World wide web
5. Description
6. Navigative
7. Catalougs
8. Web browser
9. Internet explorer
10. Net scaps
11. Users
12. Accessable
13. Digital lmages
14. Format
15. Indentifer
16. Hyper text mark up languge ( html )
17. Extensible mark up languge ( xml )
18. Standardized Generalized Mark up languge ( SGml )
19. Web pages
20. Online computer liberary center . (oclc ) : www.oclc.org
21. Core
22. Networked Resourced
23. Dubline core meta data element set
24. United kingdom office of library and information Networking ( ukoln ) : www.Ukoln.Ac.Uk
25. Warwick Fram work
26. Coalition for Networked Information ( CNI )
27. Machinnc Readable cataloging (marc )
28. Headers
29. Tag
30. Series
31. Main Entry
32. Host
33. Internet protocols
۱.Digital Libraris : meta data Resources. Available at:www.Ifla.org/II/metadata.htm
۲.cataloging: metadata. Available at:www.Itcompany.Com/Inforetiever/Cat-meta.htm . ۳.metadata.Available at: www.bubl.ac.uk/link/m/metadata.htm
۴.List of metadata intiatives.Availible at: www.personal.umich/edu/juheim/alcts/bibacces.htm . ۵.cataloging and meta data Resources.Available at: http://slis.cua.edu/ihy/catmeta.htm
۶.Links to meta data web peges. Available at: http://orc.dev.oclc.org:/metamarda-
۱-شیری، علیاصغر. ابردادهها و تأثیر آن بر فهرستهای ماشینخوان. فهرستهای رایانهای: مجموع مقالات همایش كاربرد و توسعهٔ فهرستهای رایانهای در كتابخانههای ایران. (۲۷ و ۲۸ آبان ۱۳۷۸) به كوشش رحمتالله فتاحی. –مشهد: دانشگاه فردوسی مشهد؛ تهران؛ مركز اطلاعرسانی و خدمات علمی جهاد سازندگی، ۱۳۷۹. ص ۱۲۶-۱۳۷ ۲. Digital libraries: Metadata Resources.[ online] available at: < www.Ifla.org/II/Metadata.htm >[ Accessed in ۲۱ may ۲۰۰۳] ۳.Heery Rachel. Review of metadata formats.]on line[ available at:< www.ukoln.ac.uk/metadata/review> [accessed in ۱۵ APR ۲۰۰۳] ۴.Dubline core meta data initiative overview at:< www.dublinecore.org/overview >[Accessed in ۲۵ NOV ۲۰۰۳] ۵.Dublin core meta data Element set.] online[ available at: < www.dublinecore.org/document/dces > [Accessed in ۲۵ NOV ۲۰۰۳] ۶.Global Information loacator service (GILS). ] online[ Available at : < http://www.gils.net/Index.html >[ Accessed in ۱۲ oct ۲۰۰۳] ۷.Text encoding Initivative ) TEL ( [ online] Available at: www.tei–c.org/guidelines۲/Index.html Accessed In] ۲۱ NOV ۲۰۰۳[ ۸.What is metadata? [ online] Available at:< www.alexandria.Ucsb.edu/public-documents/metadata>[Accessed In ۱۷NOV ۲۰۰۳ ] ۹- meta data why should we care. ] online[ Available at:< http://content.lib.washington.edu/METADATA>[Accessed in ۲۳ oct ۲۰۰۰۳ ]. تألیف : سید حسین محمدی كارشناس كتابداری دانشگاه علامه طباطبایی
نما مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران
ارسال توسط كاربر محترم : sayesar
{{Fullname}} {{Creationdate}}
{{Body}}