Bagit Checksum for Digital Preservation

From Noolaham Foundation
Jump to navigation Jump to search

Title:
Bagit Checksum for Digital Preservation

Document Type:
Standard Operating Procedure

Security Classification:
Technology, Digital Preservation

Department:
NF Technology

Author (s):
Natkeeran
Parathan

Approved By:

Version:
Version 1.0: March 2020

நோக்கம் (Purpose of the Document)

நூலக நிறுவனத்தில் மின்வருடப்பட்டு காப்புப்படிக்குத் தயார் நிலையில் உள்ள ஆவணகங்களுக்கு நீண்ட கால உத்தரவாதத்தை அளிக்கும் முகமாக Library Of Congress ஆல் உருவாக்கப்பட்ட Bagit மென்பொருளைப் பயன்படுத்தி நூலக நிறுவனத்தின் பணியோட்டத்திற்கு ஏற்றவகையில் எழுதப்பட்ட தானியங்கி script இதுவாகும்.


Audience: இந்த script, Digital Preservation ல் பங்குவகிப்போருக்கும் நூலக ஆவணகக் காப்புப்படிகள் தொடர்பான செயற்பாடுகளில் ஈடுபடுவோருக்கு பயனுள்ளதாக அமையும்.

Prerequisites

  • Python 3
  • Bagit
  • Pandas

Script ஐ கையாளும் முறை

இவ் script கள் 3 பிரிவுகளாகப் பிரிக்கப்பட்டுள்ளது:

  • Bagit ஐ பயன்படுத்தி காப்புப்படி எடுக்கப்பட்ட கோப்புகளுக்கு checksum எண்ணிக்கையை பெற்றுக்கொள்ள வேண்டும்
  • Bagit மூலம் உருவாக்கப்பட்ட கோப்புகளையும், ஆவணங்களையும் Zip கோப்புகளாக மாற்றி வன்தட்டுகளில் காப்புப்படிகள் எடுக்க வேண்டும்.
  • மூன்றாவது script எமக்குத் தேவையான நேரங்களில் காப்புப்படி எடுக்கப்பட்ட கோப்புக்களின் தரத்தினை (அழிவடைந்துள்ளதா இல்லையா என) அறிந்து கொள்ள உருவாக்கப்பட்டுள்ளது. இறுதியில் ஒவ்வொரு ஆவணக்கங்களும் எவ்வாறு உள்ளன என்பதை CSV கோப்பில் தரம் சரிபார்க்கப்பட்ட திகதியுடன் தரும்.

Script ஐ கையாளும் முறை

Step 1:
Bag செய்யும் script ஐ run செய்தல்.

Step 2:
Zip செய்யும் script ஐ run செய்தல்

Step 3 [Optional]:
தேவையான நேரங்களில் ஆவணங்களின் தன்மையை validate செய்ய validation script ஐ run செய்யலாம்.

Reference