Difference between revisions of "Aavanaham Backup Process"

From Noolaham Foundation
Jump to navigation Jump to search
Line 1: Line 1:
ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை
+
===ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை===
 
+
அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும் என்றால் கீழ் வரும் செயன்முறையை மேற்கொண்டு பெற முடியும்.
அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும்.
 
  
 
இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing)
 
இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing)
  
பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள object களை மாத்திரமே நாம் தரவிறக்கி காப்புப்படி எடுக்க வேண்டும். எனவே collection களை நீக்க வேண்டும். )
+
பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள objects களை மாத்திரமே நாம் தரவிறக்கி காப்புப்படி எடுக்க வேண்டும். எனவே collection களை நீக்க வேண்டும். ). Islandora வினுடைய கட்டமைப்பில் ஒவ்வொரு Collections களுக்குள்ளும் Objects இருக்கும்
 
 
Server ல் இடப்பற்றாக்குறை காரணமாக ஒரு நேரத்தில் 250 வரையான ஆவணகங்களை காப்புப்படி எடுத்தல் சிறந்த முறையாகும்.. எனவே CSV கோப்பினை சிறு சிறு பகுதிகளாக உருவாக்க வேண்டும். இதற்கு பைத்தான் மொழியில் எழுதப்பட்ட நிரலாக்கம் உள்ளது. அதனை run செய்வதன் மூலம் சிறு சிறு CSV கோப்புகளாக பெரிய CSV கோப்ப்பினை மாற்ற முடியும்.
 
 
 
பின்னர் சிறிதாக்கப்பட்ட CSV கோப்புகளை scp ஐ பயன்படுத்தி ஆவணகம் server ல் பிரதி (copy) எடுக்க வேண்டும்.
 
 
 
பின்னர் server ல் '''/var/www/html''' folder உள் உள்ள bagit.py என்ற பைத்தான் script ல் சிறிதாக்கப்பட்ட CSV கோப்பு உள்ள path ஐ சரியாக கொடுத்து அவ் script ஐ run செய்ய வேண்டும்.
 
  
அது Server ல் /home/bags என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும். பின்னர் /home/bags ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு Python script உள்ளது. அவ் Script ஐ /home/bags க்குள் இட்டு run செய்ய வேண்டும்.
+
*Server ல் இடப்பற்றாக்குறை காரணமாக ஒரு நேரத்தில் 250 வரையான ஆவணகங்களை காப்புப்படி எடுத்தல் சிறந்த முறையாகும். எனவே CSV கோப்பினை சிறு சிறு பகுதிகளாக உருவாக்க வேண்டும். இதற்கு பைத்தான் மொழியில் எழுதப்பட்ட நிரலாக்கம் உள்ளது. அதனை run செய்வதன் மூலம் சிறு சிறு CSV கோப்புகளாக பெரிய CSV கோப்பிலிருந்து மாற்ற முடியும்.
 +
**பின்னர் சிறிதாக்கப்பட்ட CSV கோப்புகளை [https://haydenjames.io/linux-securely-copy-files-using-scp/ scp] ஐ பயன்படுத்தி ஆவணகம் server ல் பிரதி (copy) செய்தல் வேண்டும்.
 +
* பின்னர் server ல் '''/var/www/html''' folder உள் உள்ள '''[https://github.com/noolahamfoundation/digitization-pipeline/blob/master/aavanaham_automations/bagit.py bagit.py]''' என்ற பைத்தான் script ல் சிறிதாக்கப்பட்ட CSV கோப்பின் serverல்  உள்ள path ஐ சரியாக கொடுத்து அவ் script ஐ run செய்ய வேண்டும்.
 +
** அது Server ல் '''/home/bags''' என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும்.  
 +
* பின்னர் '''/home/bags''' ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு [https://github.com/noolahamfoundation/digitization-pipeline/blob/master/aavanaham_automations/zipBagsFoldersinAavanaham.py Python script] உள்ளது. அவ் Script ஐ '''/home/bags''' folder க்குள் copy செய்து run செய்ய வேண்டும்.
  
 
அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும்.
 
அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும்.
  
 
[[Category:Technology]]
 
[[Category:Technology]]

Revision as of 07:20, 12 January 2021

ஆவணகம் காப்புப்படி எடுக்கும் செயன்முறை

அண்மையில் அல்லது இதுவரை காலமும் தரவேற்றப்பட்ட ஆவணக பதிவுகளின் மீதரவுத் தாளினை பெற வேண்டும் என்றால் கீழ் வரும் செயன்முறையை மேற்கொண்டு பெற முடியும்.

இது போன்ற உதாரணம் (https://docs.google.com/spreadsheets/d/1ZLl2LVl87rKwENuLim95HX67dDWRTHtAOD3FU14bS2Y/edit?usp=sharing)

பின்னர் அத் தரவுத்தாளில் உள்ள collection என முடிகின்ற row களை நீக்க வேண்டும். (காரணம்: collection களுக்குள் உள்ள objects களை மாத்திரமே நாம் தரவிறக்கி காப்புப்படி எடுக்க வேண்டும். எனவே collection களை நீக்க வேண்டும். ). Islandora வினுடைய கட்டமைப்பில் ஒவ்வொரு Collections களுக்குள்ளும் Objects இருக்கும்

  • Server ல் இடப்பற்றாக்குறை காரணமாக ஒரு நேரத்தில் 250 வரையான ஆவணகங்களை காப்புப்படி எடுத்தல் சிறந்த முறையாகும். எனவே CSV கோப்பினை சிறு சிறு பகுதிகளாக உருவாக்க வேண்டும். இதற்கு பைத்தான் மொழியில் எழுதப்பட்ட நிரலாக்கம் உள்ளது. அதனை run செய்வதன் மூலம் சிறு சிறு CSV கோப்புகளாக பெரிய CSV கோப்பிலிருந்து மாற்ற முடியும்.
    • பின்னர் சிறிதாக்கப்பட்ட CSV கோப்புகளை scp ஐ பயன்படுத்தி ஆவணகம் server ல் பிரதி (copy) செய்தல் வேண்டும்.
  • பின்னர் server ல் /var/www/html folder உள் உள்ள bagit.py என்ற பைத்தான் script ல் சிறிதாக்கப்பட்ட CSV கோப்பின் serverல் உள்ள path ஐ சரியாக கொடுத்து அவ் script ஐ run செய்ய வேண்டும்.
    • அது Server ல் /home/bags என்ற கோப்பினுள் Bag செய்யப்பட்டு Folder களாக சேமிக்கப்பட்டிருக்கும்.
  • பின்னர் /home/bags ல் உள்ள Folder களை ZIP கோப்புகளாக மாற்ற வேண்டும். அதற்கும் ஒரு Python script உள்ளது. அவ் Script ஐ /home/bags folder க்குள் copy செய்து run செய்ய வேண்டும்.

அந்த bags folder க்குள் ZIP கோப்புகள் உருவாக்கப்பட்டிருப்பதை காணமுடியும்.