E-book creation Documentation

From Noolaham Foundation
Revision as of 22:01, 27 July 2020 by Parathan (talk | contribs) (Created page with "'''மின்னூல் உருவாக்க வழிகாட்டி - நூலக நிறுவனம்''' நூல் ஒன்றின் இலத்த...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

மின்னூல் உருவாக்க வழிகாட்டி - நூலக நிறுவனம்

நூல் ஒன்றின் இலத்திரனியல் வடிவம் மின்னூல் ஆகும் நூலகத்தில் மின்வருடி (scanner), புகைப்படக் கருவிகளால் மின்வருடப்பட்டு எண்ணிமப்படுத்தப்படும் ஆவணங்கள் TIF கோப்புகளாக சேமிக்கப்பட்டு சரிபார்க்கப்பட்டு பின் PDF கோப்புகளாக ஒன்றிணைக்கப்பட்டு வலைத்தளத்தில் பதிவேற்றப்படுகிறது. நூலகத்தில் எண்ணிமப்படுத்தும் ஆவணங்கள் தற்போது PDF (Portable Document Format) வடிவில் மட்டுமே காணப்படுகிறது. ஆகவே அவற்றை வெவ்வேறு மின்னூல் வடிவங்களிலும் உருமாற்றிப் பெற்றுக்கொள்ள இச் செயல்திட்டம் உபயோகமானதாகும்..

மின்னூல் உருவாக்கத்தின் பயன்கள்

சிறிய இடத்தையே பெற்றுக் கொள்ளும் (Small Size) குறிச் சொற்கள் மூலம் தேவையான விடயங்களை தேடிப் பெற்றுக்கொள்ள முடியும். - (இவ் முறையானது தற்போதைய நூலகத்தில் உருவாக்கப்படும் PDF களில் செயல்படுத்த முடியாது) இவ்வாறாக உருவாக்கப்படும் மின்நூல்கள் பின்னர் பல்வேறுபட்ட மின்னூல் வகைகள் (format) களுக்கு மாற்றிக்கொள்ள (convert) முடியும். உ+ம்:- Amazon Kindle கருவிகளுக்கு ஏற்ற mobi format, epub format

மின்னூலை உருவாக்கும் வழிமுறைகள்

கணியம் அறக்கட்டளையின் ஸ்ரீனிவாசன் அவர்களால் தொகுக்கப்பட்ட கீழ்வரும் காணொளிகள் விளக்கத்தின் மூலம் மின்னூல் உருவாக்கம் பற்றி அறிந்து கொள்ள முடியும்.

P* andoc மென்பொருள்மூலம்உருவாக்கிக்கொள்ள: https://www.youtube.com/watch?v=DeD6hXrVukA

மின்னூல் ஆக்கத்தில் தமிழ் எழுத்துணரி (Tamil OCR) ன் தேவைப்பாடு

மேலே காணப்பட்ட காணொளி விளக்கத்தின் படி மின்னூலாக்கத்திற்கு நூலின் எழுத்துக் கோப்பு (Text file) தேவைப்படுகின்றது. ஆகவே, மின்வருடப்படும் கோப்புக்கள் TIF லிருந்து எழுத்துக் கோப்புக்களாக மாற்றப்பட வேண்டும். இதற்கு Tesseract4 எனும் தமிழ் எழுத்துணரி பயன்படும். இது ஒவ்வொரு TIF கோப்புக்களில் காணப்படும் எழுத்துக்களையும் ஒரு Text file ஆக மாற்றித் தரும். பின்னர் அவ் Text file களை Office மென்பொருளைப் பயன்படுத்தி மின்னூல் உருவாக்கப்படும். இதற்கு Windows அல்லது Ubuntu இயங்கு தளங்களை பயன்படுத்தலாம். Ubuntu பாவனை அதிகம் வரவேற்கப்படுகிறது. Tesseract4 ஐ பயன்படுத்தி எழுத்துக்கு கோப்புகளை உருவாக்குவதற்கான தானியங்கி script எழுதப்பட்டுள்ளது. அதனைப் பயன்படுத்தி Text கோப்புகளைப் பெற்றுக்கொள்ள முடியும்.

குறிப்பு: Tesseract4 மூலம் உருவாக்கப்படும் எழுத்துக்களின் துல்லிய வீதம் (accuracy rate) 80% -98% வரை காணப்படுகிறது. முதற்கட்டமாக 10 மின்னூல்களை manual முறையில் உருவாக்கி அதற்கான பயிற்சிகளை மேற்கொண்டு தொடர்ந்து செயல்படுத்துவதற்கான கலந்துரையாடல்களில் ஈடுபடுவதற்கு திட்டமிடப்பட்டுள்ளது

Reference