E-book creation Documentation
மின்னூல் உருவாக்க வழிகாட்டி - நூலக நிறுவனம்
நூல் ஒன்றின் இலத்திரனியல் வடிவம் மின்னூல் ஆகும் நூலகத்தில் மின்வருடி (scanner), புகைப்படக் கருவிகளால் மின்வருடப்பட்டு எண்ணிமப்படுத்தப்படும் ஆவணங்கள் TIF கோப்புகளாக சேமிக்கப்பட்டு சரிபார்க்கப்பட்டு பின் PDF கோப்புகளாக ஒன்றிணைக்கப்பட்டு வலைத்தளத்தில் பதிவேற்றப்படுகிறது. நூலகத்தில் எண்ணிமப்படுத்தும் ஆவணங்கள் தற்போது PDF (Portable Document Format) வடிவில் மட்டுமே காணப்படுகிறது. ஆகவே அவற்றை வெவ்வேறு மின்னூல் வடிவங்களிலும் உருமாற்றிப் பெற்றுக்கொள்ள இச் செயல்திட்டம் உபயோகமானதாகும்..
Contents
மின்னூல் உருவாக்கத்தின் பயன்கள்
சிறிய இடத்தையே பெற்றுக் கொள்ளும் (Small Size) குறிச் சொற்கள் மூலம் தேவையான விடயங்களை தேடிப் பெற்றுக்கொள்ள முடியும். - (இவ் முறையானது தற்போதைய நூலகத்தில் உருவாக்கப்படும் PDF களில் செயல்படுத்த முடியாது) இவ்வாறாக உருவாக்கப்படும் மின்நூல்கள் பின்னர் பல்வேறுபட்ட மின்னூல் வகைகள் (format) களுக்கு மாற்றிக்கொள்ள (convert) முடியும். உ+ம்:- Amazon Kindle கருவிகளுக்கு ஏற்ற mobi format, epub format
மின்னூலை உருவாக்கும் வழிமுறைகள்
கணியம் அறக்கட்டளையின் ஸ்ரீனிவாசன் அவர்களால் தொகுக்கப்பட்ட கீழ்வரும் காணொளிகள் விளக்கத்தின் மூலம் மின்னூல் உருவாக்கம் பற்றி அறிந்து கொள்ள முடியும்.
- Manual முறையில் மின்நூல் உருவாக்கும் முறை: https://www.youtube.com/watch?v=0CGGtgoiH-0
- தானியக்க முறையில் உருவாக்கிக்கொள்வதற்கு: https://www.youtube.com/watch?v=WHHF8eP_UyY
P* andoc மென்பொருள்மூலம்உருவாக்கிக்கொள்ள: https://www.youtube.com/watch?v=DeD6hXrVukA
மின்னூல் ஆக்கத்தில் தமிழ் எழுத்துணரி (Tamil OCR) ன் தேவைப்பாடு
மேலே காணப்பட்ட காணொளி விளக்கத்தின் படி மின்னூலாக்கத்திற்கு நூலின் எழுத்துக் கோப்பு (Text file) தேவைப்படுகின்றது. ஆகவே, மின்வருடப்படும் கோப்புக்கள் TIF லிருந்து எழுத்துக் கோப்புக்களாக மாற்றப்பட வேண்டும். இதற்கு Tesseract4 எனும் தமிழ் எழுத்துணரி பயன்படும். இது ஒவ்வொரு TIF கோப்புக்களில் காணப்படும் எழுத்துக்களையும் ஒரு Text file ஆக மாற்றித் தரும். பின்னர் அவ் Text file களை Office மென்பொருளைப் பயன்படுத்தி மின்னூல் உருவாக்கப்படும். இதற்கு Windows அல்லது Ubuntu இயங்கு தளங்களை பயன்படுத்தலாம். Ubuntu பாவனை அதிகம் வரவேற்கப்படுகிறது. Tesseract4 ஐ பயன்படுத்தி எழுத்துக்கு கோப்புகளை உருவாக்குவதற்கான தானியங்கி script எழுதப்பட்டுள்ளது. அதனைப் பயன்படுத்தி Text கோப்புகளைப் பெற்றுக்கொள்ள முடியும்.
குறிப்பு: Tesseract4 மூலம் உருவாக்கப்படும் எழுத்துக்களின் துல்லிய வீதம் (accuracy rate) 80% -98% வரை காணப்படுகிறது. முதற்கட்டமாக 10 மின்னூல்களை manual முறையில் உருவாக்கி அதற்கான பயிற்சிகளை மேற்கொண்டு தொடர்ந்து செயல்படுத்துவதற்கான கலந்துரையாடல்களில் ஈடுபடுவதற்கு திட்டமிடப்பட்டுள்ளது
Reference
- Tesseract4 Github இணைப்பு: https://github.com/tesseract-ocr/tesseract
- கணியம் அறக்கட்டளை - ஸ்ரீனிவாசன் (tshrinivasan@gmail.com)