海貝談貝數位│不可不知的貝殼數位化知識 (六) ─ 後設資料與資料庫建置知多少
在貝殼數位化作業中,後設資料與資料庫建置是執行數位化工作重要的最後一哩路。想知道何謂後設資料,後設資料與資料庫建置的關係嗎?今日海貝原創即將帶大家輕鬆進入後設資料的世界~
本文將分別針對何謂後設資料、後設資料參考規範以及後設資料與資料庫建置三個部分與大家分享:
何謂後設資料(Metadata)
關於什麼是後設資料,我們可以從基本定義、常用中譯詞、用途與目的這三個方面來了解:(一)基本定義
Metadata的基本定義出自OCLC(國際圖書館電腦中心)與NCSA(美國國家超級計算應用中心)所主辦的「Metadata Workshop」研討會中。會中將Metadata定義為「描述資料的資料」(Data about data)。
(二)常用中譯詞
Metadata的常用中譯詞主要有元資料、元數據、超資料、詮釋資料及後設資料這五種,在數位典藏領域則採用「後設資料」一詞。
(三)用途與目的
- 後設資料用來描述每個數位典藏品的內涵與特徵,以便數位典藏品能夠在數位化環境或系統中,達到有效率且精確的檢索、呈現與管理。並能順利和其它單位進行資源的互通與共享。
- 後設資料是一組結構化與標準化的背景資料,主要包括描述性、結構性與管理性等三大類型:1) 描述性 ─ 描述了用於發現與辨別意義的資源。它可以包括如標題、摘要、作者和關鍵字等元素。
2) 結構性 ─ 有關於資料容器的元資料,指示如何整理其中複合的物件。例如頁面依甚麼排序方式組成章節。
3) 管理性 ─ 用於管理資源的資訊,例如資料產生的時間和方式、檔案種類和其它技術資訊,以及誰有權限存取它。 - 學術研究上將後設資料的規劃與實施視為數位典藏工程中最基礎的資訊建設工作。
後設資料參考規範
由於後設資料欄位規劃方向,主要是以建立通用、標準化及符合國際標準之資料庫系統為目標,因此在數位典藏國家型科技計畫中,成立了「數位典藏計畫後設資料工作組」,負責有關後設資料方面的推動與規劃 。
根據中央研究院後設資料工作組之分析,將後設資料的應用分為三大類:
(一)整合性
以公眾檢索為導向,以Dublin Core為代表。(二)學科導向
依據所支援的社群、學科為導向,目前有博物館、檔案館、善本、考古、語言/語料庫、地理空間資訊、影音/多媒體、數位學習、生物多樣性等九大類。(三)權威控制
以「學科導向」為主,「權威控制」為輔,建立於人、事、時、地、物五大主軸間交錯的互動關係,以達到不同知識層次後設資料的分析與詮釋。
由於貝類標本屬於學科導向中的生物多樣性類別,因此中央研究院台灣貝類資料庫透過後設資料小組的協助規劃後,研擬出《貝類後設資料需求規格書V2.0》,而相關後設資料的表單則分為物種名錄、物種生物資訊、標本資料、文獻資料及媒體資料等五種。此外,生態學研究也將地理資訊系統(Geographic Information System,GIS)的技術導入,因此在後設資料欄位加註貝類採集地的經緯度,經過GIS軟體的運算後,便能透過地圖圖像的呈現了解各生物的生態環境和地理分布情形。
後設資料與資料庫建置
關於後設資料如何規劃,以下有三點建議:
- 主要除了本土需求外,建議採用符合國際標準之格式,以期能達到國際接軌達成資料交流之目的。
- 後設資料在查詢功能的資料呈現,決定於後設資料規劃的欄位及欄位內的資料內容。因此資料庫的檢索功能愈詳細,對使用者則能提供愈多的資訊,對辨識資料也愈有幫助。
- 建議規劃後設資料欄位時,事先就資料庫未來檢索功能、資料呈現等兩方面進行了解,才能使必要的欄位無所遺漏。
關於後設資料與資料庫的建置重點,分為下列五點分享:
(一)需求評估與內涵分析
- 需求評估必須由後設資料分析專業人員,瞭解其計畫屬性、後設資料範圍以及現有系統資訊後,再採用「後設資料標準評選模式」,歸納適用的後設資料類型。
- 善用後設資料工作表單,進行更精密的分析,以完善主題計畫的後設資料需求。
- 後設資料工作表單包括元素需求表單、著錄規範、資料查詢與呈現需求等。
(二)研擬後設資料功能需求
- 後設資料需求書設計之目的,是為了成為主題計畫、後設資料分析及系統開發三方的溝通橋梁,促使不同專業領域之人員達成共識,評估後設資料發展的可能性。
- 透過後設資料需求書,有利於主題計畫決定該採用何種系統,考慮自行發展或是採合作發展的方式完成系統之建置。
- 後設資料需求書的相關功能,主要有下列四點:
1) 提供主題計畫確認後設資料需求
2) 作為後設資料工作組與系統設計人員之間的溝通依據
3) 作為主題計畫修正後設資料系統和功能的依據
4) 作為參考規範(Best Practice)及後設資料標準對照機制的基礎
(三)後設資料系統開發與測試
- 系統開發的任務在於開發符合需求書的後設資料系統與工具,為了促使有效的系統設計,主題計畫、後設資料分析及系統發展者之間的成員,在開發期間應該持續交流與討論意見。
- 系統雛型完成後,主題計畫與後設資料分析人員雙方,必須回覆系統測試與評估的結果,提供系統人員參考與修正。
(四)資料庫開發與測試
- 資料庫的建置主要為數位典藏品和後設資料提供系統整合與資料呈現的功能。
- 資料庫需求書的研擬建議根據未來網頁檢索功能、目標、預期效益等方面來進行。
- 資料庫的建置必須透過主題計畫、後設資料及資料庫開發三方參與人員之間的溝通與協調,開發出符合需求書的資料庫系統,再透過不斷的測試與修改,才能夠穩定資料庫的各項功能。
- 最後建議安排專人進行資料庫維護作業,定期進行資料更新與網站維護工作,以保障資料庫內容的穩定與安全。
- 建置資料庫系統時,須考量未來使用的負載量與擴充性。
(五)後設資料作業評估
- 為了提升後設資料機制的服務品質,完成後設資料與資料庫的開發工作之後,必須根據主題計畫的需求,進行後設資料整體實施程序及效益評估。
- 評估的重點包含了後設資料紀錄的品質、檢索效力與精確度。並且確認是否有再次實施某一程序的必要性。
總結
綜合以上分享,後設資料與資料庫建置是個專業複雜的技術,後設資料的規劃、執行和資料庫建置,關係著數位化專案的運用效益。希望今日分享可以對於貝殼數位典藏有興趣的初學者帶來微薄的幫助。歡迎投入貝殼數位典藏的行列中,盡情享受貝殼生活。(文章來源 / 齊‧博客 Chi-Blog)
【參考連結】
留言
張貼留言