الميتاداتا وتوصيف المصادر الإلكترونيَّة
معيار دبلن كور نموذجًا
“ما من عبقريّ وصل إلا وقف على أكتاف غيره ليرى أبعد”. هي مقولة فلسفيَّة تبيّن ارتهان الإبداع العلميّ والفنيّ للمكاسب الفكريّة السابقة، وتظهر أهمية الخبرات والتجارب المتراكمة، في سبيل بناء معرفة جديدة، والوصول إلى المبتكر الجديد بعد عدة تجارب شخصية. يقترن الوصول إلى المعرفة بالاعتماد على معارف السابقين، ويرتبط بالقيام بتجارب شخصية مع وجود المعلومات في سياق محدد، فالماضي حاضر دائمًا في الإبداع لا ليعيقه، بل ليحفّزه على التجديد.
إنّ اقتران تحقيق المعرفة بالاعتماد على معارف السّابقين، يعزّز أهمية تنظيمها وإدارتها، وهو دور تواصل المكتبات ومراكز المعلومات القيام به. عملت المكتبات على تنظيم المعرفة منذ نشأتها، وارتبطت هذه المهمّة بدورها في تحقيق وصول المستفيدين إلى المعارف التي تختزنها. أصبحت المساعدة الظرفية التي تقدمها المكتبات ومراكز المعلومات للمستفيدين، مهمّتها الرئيسية، مع إنشاء ميلفيل ديوي مكتبًا للخدمة المرجعية في العام 1950 في جامعة كولومبيا في الولايات المتحدة الأميركيّة.
استخدمت المكتبات ومراكز المعلومات عدة أساليب تنظيمية، واعتمدت على معايير عالمية لوصف مصادرها. ذكرت عدة بيانات وصفية عن كل مصدر في بطاقات ورقية، ونظَّمت أساليب مختلفة لضمان الوصول إليها. عملت المعايير الوصفية على متابعة التطورات الحاصلة في بيئة إنتاج المعلومات وبثها وإتاحتها، فطُوِّر معيار مارك 21 كطريقة لتحويل الفهرس من الورقي إلى الإلكتروني، ولضمان تبادل التسجيلات الببليوغرافية بين مؤسسات المعلومات، إلا أنَّ التطورات في بيئة المعلومات تحدث بوتيرة متسارعة جدًا، كذلك نجد أن كمية المعارف المنتجة والمتاحة عبر شبكة الإنترنت تجعل من الصعب على مؤسسات المعلومات وحدها القيام بمهام التنظيم والحفظ والإتاحة. لذلك، تمّ تطوير معايير أرشيفية توافق طبيعية المصادر الجديدة، وخصوصًا المصادر الإلكترونية وتلك المتاحة عبر الشبكة. تهدف هذه المعايير إلى ضمان توصيف المصادر بأسهل الطرق الممكنة، لضمان الهدف الأساس للمعرفة، أي الوصول إليها واستخدامها في سياق آخر مختلف، لتحقيق معرفة شخصية جديدة.
نقدّم في هذه المقالة تعريفًا بقواعد تنظيم المعلومات المتاحة عبر شبكة الإنترنت، ونتطرق إلى تعريف الميتاداتا أو ما وراء البيانات. لا يمكننا التقديم لأية معايير وصفية أو تصميمات الميتاداتا من دون تعريف الميتاداتا، وذكر طبيعتها وأهميتها، وخصوصًا بالنسبة إلى بيئة تكنولوجيا المعلومات وطبيعة إنتاج المعلومات وبثها وإتاحتها في القرن الحادي والعشرين. ونستعرض تاليًا أحد أهم تصميمات الميتاداتا وأوسعها انتشارًا وتطبيقًا ضمن مؤسّسات المعلومات، وهو معيار دبلن كور Dublin Core Metadata.
ماهية الميتاداتا
تُعرف الميتاداتا أو ما وراء البيانات بأنها معلومات مهيكلة أو منظّمة تصف الوثيقة أو مصدر المعلومات وتشرحها وتحددها، ما يجعلها قابلة للاسترجاع والاستخدام لاحقًا عند الحاجة إليها. يُعبّر عن الميتاداتا غالبًا بأنها بيانات عن البيانات، أو معلومات عن المعلومات. يختلف استخدام الميتاداتا باختلاف سياقاتها العملية أو التطبيقية، إذ يستخدمها البعض للتعريف إلى المعلومات المقروءة آليًا، بينما يربطها آخرون بوصف المصادر الإلكترونية المتاحة في شبكة الإنترنت. في مجتمع المكتبات والمعلومات، تُعطى الميتاداتا تعريفًا مرتبطًا بكلّ النظم والقواعد والمعايير المرتبطة بفهرسة أنواع الوثائق ومصادر المعلومات كافّة، فقواعد الفهرسة المقروءة آليًا (مارك 21)، وقواعد الفهرسة الإنكلو-أميركية، وحاليًا قواعد وصف المصادر وإتاحتها “وام” (RDA, Resource description and access)، تشكّل معايير تطبيقية لوصف أنواع المصادر كافة بهيكلية محددة. تسمح هذه القواعد بتوحيد عمل المفهرسين، من خلال ضمان توحيد أساليب وصف مصادر المعلومات والتعريف بها.
يمكننا الحديث عن ثلاثة أنواع أساسية من الميتاداتا:
-
- الميتاداتا الوصفية Descriptive metadata: تصف الوثيقة أو المصدر لغاية مرتبطة بالوصول والإتاحة والتحديد اللاحق، وهي تتضمن عناصر رئيسية، أبرزها العنوان والمؤلف ومجموعة من الكلمات المفتاحية، إضافةً إلى مستخلص موضوعي عن المصدر قيد الوصف.
- الميتاداتا البنيوية Structural metadata: تبيّن كيفية تنظيم المصدر بحدّ ذاته، وكيفية ترتيب الصفحات وتنظيم الفصول، فهي ترتبط بالتنظيم الداخلي لمصدر المعلومات.
- الميتاداتا الإدارية Administrative metadata: تتضمّن بيانات مهمة لإدارة المصدر، كتاريخ الإنشاء، والطريقة التي تم بها ذلك، ونوع الملف، ومعلومات تقنية أخرى، إضافةً إلى كيفية الإتاحة وطريقة الوصول إلى المصدر. يبرز هنا نوعان رئيسيان من الميتاداتا – يصبّان أيضًا تحت مظلة الميتاداتا الإدارية – وهما: الميتاداتا المرتبطة بإدارة الحقوق والملكية الفكرية، والميتاداتا المرتبطة بطريقة الحفظ. وتُسجل في الأخيرة كامل البيانات المرتبطة بطريقة حفظ المصدر ومدّتها.
- قابليَّة التبادل والعمل المشترك بين نظم المعلومات Interoperability: إنَّ توصيف المصدر من خلال إضافة الميتاداتا إليه، يسمح بفهم المصدر من قبل الآلة والإنسان معًا، بما يضمن قابليّة العمل المشترك interoperability. وتُعرّف بأنها قابلية نُظُم متعدّدة ذات معدّات وتطبيقات مختلفة على تبادل المعلومات بأقلّ نسبة خسائر في المضمون والوظيفة.
- التحديد الرقميّ Digital identification: تتضمَّن معظم مخطّطات الميتاداتا عناصر تعريفية، منها الأرقام القياسيّة المستخدمة من أجل التعريف الموحّد للعمل أو الشيء الذي تشير إليه الميتاداتا. يمكن تعريف موقع المصدر الرقمي من خلال الرابط المحدد لاسم الملفّ URL, Uniform Resource Locator، أو تعريفات أخرى أكثر استمراريّة مثل PURL) Persistent URL)، أو محدد المصدر الرقميّ DOI, Digital Object Identifier.
تُعرّف الميتاداتا المصادر الموصوفة باختلاف مستوى الوصف، سواء كانت تصف المجموعة أو التجميعة aggregation، أو تصف المصدر بعينه resource itself، أو تصف جزءًا من المصدر، كتوصيف صورة في مقال مثلًا. كذلك، تغطّي الميتاداتا طبيعة المصدر الموصوف، وتسجّل كلّ بياناته التعريفية بالتفصيل، فتتعزّز أهميّتها لكونها:
- تتيح الوصول إلى مصدر المعلومات، من خلال تقديم إمكانية البحث عن عنوان المصدر أو مؤلّفه أو موضوعه. إنَّ إضافة هذه البيانات إلى المصدر، تساهم في تعريفها وتحديدها، وتسهّل الوصول إليها فيما بعد.
- تساهم في تنظيم المصادر الإلكترونية؛ ففي ظلّ زيادة أعداد المصادر الإلكترونية، وخصوصًا زيادة الصفحات عبر شبكة الإنترنت، أصبحت إضافة الميتاداتا إليها ذات أهمية كبيرة، لأنها تسمح بجمع الصفحات المتشابهة من حيث الموضوع والمضمون أو الجمهور المستهدف ومتغيرات أخرى.
- تُستخدم لأرشفة المصادر وحفظها، فتعتبر المصادر الإلكترونية سريعة العطب، إذ تختلف دورة حياتها تمامًا عن المصادر الورقية، فالتغيرات التكنولوجية المتسارعة في بيئة تكنولوجيا المعلومات، بقدر ما تقدم الكثير من الفرص، تنطوي على العديد من التحديات والمخاطر. يبرز التحدي الأكبر في ضمان قابلية التشغيل لكلّ المصادر التي خُلقت في هذه البيئة، إذ إنَّها قد تفقد آلة أو وسيلة تشغيلها، وبالتالي تفقد إمكانية الوصول إلى المعلومات التي تتضمّنها. تعمل مؤسَّسات المعلومات على نقل هذه البيانات من شكل ماديّ قابل للموت، إلى شكل آخر أكثر حداثةً، لضمان الحفاظ على المعلومات الموجودة. تكمن وظيفة الميتاداتا هنا في تسجيل جميع البيانات المرتبطة بطريقة الحفظ ووسائله المفترضة، وتسمح بتتبّع ممارسات الحفظ المختلفة لأنواع المصادر كافّة.
تصميمات الميتاداتا ومجموعات عناصرها: معيار دبلن كور نموذجًا
تُبنى تصميمات مختلفة للميتاداتا، تبعًا لاختلاف البيئة التي تطبّق فيها، واختلاف مستخدميها. لعلّ من أبرزها، معيار دبلن كور المطبّق على المصادر الإلكترونيّة. طُرح هذا المعيار إثر نقاشات تمّت في ورشة العمل التي نظّمتها OCLC) Online Computer Library Center)، والمركز الوطني لتطبيقات الحوسبة الفائقة (National Center For Supercomputing Applications, NCSA)، وأخذ اسمه من الولاية التي أقيمت فيها ورشة العمل، وهي دبلن (أوهايو) في الولايات المتّحدة الأميركيّة. تتولّى مبادرة دبلن كور (Dublin Core Metadata Initiative, DCMI) العمل على تحديث المعيار وتطويره بشكل دوريّ ومستمر، بما يتناسب مع طبيعة مصادر المعلومات والتحديثات التكنولوجية التي تطالها. يكمن الهدف الأساس من هذا المعيار في تحديد مجموعة من العناصر كي تستخدم عند توصيف مصادر المعلومات الإلكترونيّة وصفحات الويب. تضمّن المعيار في صيغته الأولية ثلاثة عشر عنصرًا وصفيًا، ثم أضيف إليه عنصران آخران، ليصبح مؤلفًا من خمسة عشر عنصرًا هي التالية: العنوان Title، المؤلّف Creator، الموضوع Subject، الوصف الماديّ Description، المؤلّف المشارك Contributor، التاريخ Date، النوع Type، الشّكل المادي Format، المعرّف أو المحدّد Identifier، المصدر Source، اللغة Language، العلاقة Relation، التغطية Coverage، والحقوق Rights.
إنَّ تركيبة معيار دبلن كور تبيّن البساطة والوضوح، وبالتالي تضمّن سهولة تطبيقه على المصادر الموصوفة، سواء من قبل اختصاصيي المعلومات أو غيرهم. وعند مراجعة الممارسات التطبيقية لهذا المعيار في مؤسَّسات مختلفة، يبرز لدينا اتجاهان مختلفان في التطبيق، يعرّف الأول بأنّه تطبيق “دبلن كور البسيط” أو غير المعرّف Unqualified Dublin Core، بينما يرتبط الثاني بتعريف الحقول الموصوفة، ويعرف عنه بـ “دبلن كور المعرّف” Qualified Dublin Core.
إنَّ اتباع الاتجاه الأول، أي تطبيق دبلن كور البسيط، يتمّ من خلال إضافة بيانات بسيطة بطبيعتها إلى العناصر الخمسة عشرة المؤلفة له، من دون إضافة أية محددات أو ربطها بعلاقات مع عناصر أخرى، بينما يستوجب اعتماد الاتجاه الثاني جهدًا ووقتًا ودقة أكبر، بحيث يتمّ تعريف كلّ عنصر من العناصر من خلال ربطه بعلاقات بواسطة المحددات، أو إعطاء قيم تفصيليّة له، فاسم المؤلف ينتقل من كونه قيمة جامدة إلى قيمة متحركة وفاعلة، عندما يشير إلى وسيلة للاتصال به، فيحيلنا إلى عنوان بريده الإلكتروني مثلًا. تاريخ العمل مثال جيّد على حالتنا هذه، فالتاريخ يمكن أن يقسم إلى تاريخ الإنشاء وتاريخ التعديل وغيرهما، فيتّخذ عندها قيمًا متغيرة بتغيّر طبيعة العمل على الوثيقة واختلاف منشئيها. وبذلك، تكون الميتاداتا أكثر دقةً وتحديدًا.
إنّ عناصر دبلن كور كافّة هي عناصر اختيارية وليست إجبارية، وقد يتم ترتيبها بأية صيغة، إذ لا تخضع لترتيب محدّد وأوحد. وعلى الرغم من أنَّ هذا المعيار يوصي باستخدام مصطلحات مقننة في حقول محددة، كاستخدام مصطلحات موضوعية من قوائم رؤوس موضوعات مقننة عند التعبير عن موضوع المصدر الموصوف، تبقى هذه الممارسة غير إجبارية، بل هي سياسة خاصة تطبّقها المؤسَّسة الأرشيفيَّة. إنَّ استخدام المصطلحات المقننة يبقى أكثر تفضيلًا، لأنه يضمن توحيد العمل واستخدام شكل واحد مقنن بدل أشكال متعددة غير مقننة. لذلك، تم إنشاء مجموعات عمل لمناقشة أهميّة إنشاء ملفات استناديّة خاصة لبعض الحقول والعناصر التي يتضمّنها معيار دبلن كور.
إنَّ سهولة تطبيق معيار دبلن كور وبساطته وسلاسته، وسّعت من دائرة المؤسّسات التي تطبّقه على مصادرها، فنجده مطبقًا من قبل الباحثين، وهواة جمع الوثائق، وهواة جمع الموسيقى، وأمناء المتاحف، وغيرهم الكثير ممن يبغون تنظيم أرشيفهم ومصادر معلوماتهم. نجد مئات المشاريع التي تسعى إلى تنظيم التراث الثقافي وحفظه باستخدام هذا المعيار لفهرسة المصادر لديها. يمكن الوصول إلى جميع هذه المشاريع من خلال روابط إلكترونية متاحة في موقع معيار دبلن كور في شبكة الإنترنت DCMI Website. وإثر تطبيق المعيار عالميًا، عملت مبادرة ميتاداتا دبلن كور Dublin Core Metadata Initiative على تحديث العناصر بشكل مستمر، وتُعرّف نفسها بأنّها تُعنى بتوسيع دائرة تطبيق معايير الميتاداتا وتطوير مصطلحاتها المتخصّصة.
____________________
المراجع:
-
جيجين، جريشتن وآخرون، ترجمة أماني محمد عبد العزيز محمد، نحو نموذج مفاهيمي للوصف الأرشيفي: تقرير مبدئي من مجموعة الخبراء المعنيين بالوصف الأرشيفي، التابعة للمجلس الدولي للأرشيف، 2013.
-
عبد العزيز، أماني محمد، المعايير الدولية للوصف الأرشيفي: دراسة نظرية وتطبيقية، القاهرة، دار الفكر العربي، 2016.
-
Dublin Core Metadata Initiative, official website. Available at: http://dublincore.org/.
-
Miller, Eric (2014). Dublin Core Metadata Initiative : past, now and future. Presented at Dublin Core international conference DC-2014. Available at: https://www.youtube.com/watch? v=s7HKiyXYvYk.
-
National Information Standards Organization, NISO (2004). Understanding metadata.
__________________________________________________________________________________________________________________________________________________________
لتحميل المقال بصيغة PDF: الميتاداتا وتوصيف المصادر الإلكترونيَّة
___________________________________________________________________________________________________________________________________________________________
اقرأ أيضًا:
- المستودعات الرقميَّة: حافظة للذاكرة الأكاديمية ومنصَّة لنشر الأبحاث العلميَّة
- دور المشاع الإبداعي في إتاحة المعرفة
- أرشيف مركز الإسكندريَّة: حلم يبحث عن الاكتمال
- الساجات تستطيع كشف الكثير من الألغاز في التراث البحريني
- البيانات الضّخمة إعصارٌ يحتوي العالم
- الأرشيف السّمعي البصريّ : حفظ الذاكرة الجماعيّة
- اتّحاد مؤسَّسات ذاكرة الوطن تجربة نيوزيلاندا نموذجًا
- قطاع اللام: اتّحاد مؤسَّسات ذاكرة الوطن
- أرشيف الويب.. حفظ ذاكرة الإنترنت
- تشريعات الأرشيف العربي بين الفراغ القانوني والتأثير السياسي
- التوقيع الرقمي .. نموذج للتحول من الورق إلى الإلكترونيات
- السجلات الوطنية في بريطانيا.. مفتوحة أمام العامة
- كيف تُصان الذاكرة من الإلغاء المتعمد؟
- الأرشيف الوطنيّ الأميركيّ حارس لتاريخ شعبٍ وبلد
- آلية التّصوير المصغر : أساليب حفظ المصغرات الفيلمية
- كيف يصنع الأرشيف التّاريخ؟
- المجلس الدولي للأرشيف
- التّدمير الممنهج والمنظم لأرشيف المحفوظات في جزر القمر (1975-2001)
- حق الوصول إلى المعلومات: بين مصالح الأنظمة وأحلام الشّعوب..
- آلية التّصوير المُصَغر وإسهاماتها في عالم الأرشيف والمحفوظات
- الأرشيف القومي الكندي
- المخطوطات العربية والعجمية في الكاميرون .. شاهد على تاريخ البلاد