ಕಾಗದದಲ್ಲಿ ಮುದ್ರಿತ ಅಕ್ಷರಗಳನ್ನು
ಕಂಪ್ಯೂಟರ್ ಪಠ್ಯಗಳನ್ನಾಗಿಸುವ ತಂತ್ರಜ್ಞಾನವನ್ನು “ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ - ಓಸಿಆರ್” ತಂತ್ರಜ್ಞಾನ ಎಂದು ಕರೆಯಲಾಗಿದೆ.
ಮುದ್ರಿತ ಮಾಹಿತಿಗಳನ್ನು ವಿದ್ಯುನ್ಮಾನ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸಲು ಟೈಪಿಂಗ್ ಮಾಡಲಾಗುತ್ತಿದೆ. ಸಾವಿರಾರು
ಪುಟಗಳ ಮುದ್ರಿತ ಮಾಹಿತಿಗಳನ್ನು ಟೈಪ್ಮಾಡುವಲ್ಲಿನ ಕಾಲ, ಶ್ರಮಗಳನ್ನು ನಿವಾರಿಸುವಲ್ಲಿ
ಓಸಿಆರ್ ತಂತ್ರಜ್ಞಾನವು ಮುಖ್ಯವಾದ ಪಾತ್ರವನ್ನು ವಹಿಸುತ್ತಿದೆ. ಇಂಗ್ಲಿಷ್ನ ಮುದ್ರಿತ ಪುಟದ ಛಾಯಾಚಿತ್ರವನ್ನು
ಸ್ಕ್ಯಾನಿಂಗ್ ಮೂಲಕ ಪಡೆದು ಅದನ್ನು ಲಿಪಿಯನ್ನಾಗಿ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಜ್ಞಾನವನ್ನು ‘ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಾಗ್ನಿಷನ್’ ಎನ್ನಲಾಗಿದೆ. ಕನ್ನಡದ ಮುದ್ರಿತ
ಲಿಪಿಯನ್ನೂ ಸಹ ವಿದ್ಯುನ್ಮಾನ ಲಿಪಿಯನ್ನಾಗಿ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಜ್ಞಾನದ ಅಗತ್ಯವಿದೆ. ಕನ್ನಡದ ಉತ್ತಮ
ಮುದ್ರಿತ ಗ್ರಂಥಗಳನ್ನು ಕಂಪ್ಯೂಟರ್ ಲಿಪಿಗೆ ಪರಿವರ್ತಿಸಿ ಅದನ್ನು ಸಂರಕ್ಷಿಸುವುದು; ಕೃತಿಗಳ ಡಿಜಿಟಲ್ ಪ್ರಕಟಣೆಯನ್ನು
ಮಾಡಿ ಅದರ ಪ್ರಸಾರ ಹೆಚ್ಚಿಸುವುದು; ಕನ್ನಡದ ಬೃಹತ್ ಮಾಹಿತಿ ಸಂಚಯಗಳನ್ನು ಟೈಪಿಂಗ್ ಮೂಲಕ ಸಿದ್ಧಪಡಿಸುವ
ಕಾಲ ಮತ್ತು ಶ್ರಮಗಳನ್ನು ಕಡಮೆಗೊಳಿಸುವುದು - ಇಂತಹ ಕೆಲಸಗಳಿಗೆ ಕನ್ನಡದ ಓಸಿಆರ್ ತಂತ್ರಜ್ಞಾನ ಅಗತ್ಯವಾಗಿದೆ.
ಪುಸ್ತಕಗಳನ್ನು ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾದ
ಚಿತ್ರರೂಪದಲ್ಲಿ ಡಿಜಿಟೈಸ್ ಮಾಡಿದರೆ ಕನ್ನಡ ಪಠ್ಯವು ಕೇವಲ ಫೋಟೋ ರೂಪದಲ್ಲಿ ದೊರೆಯುತ್ತದೆ. ಇದರಿಂದ, ಓದುಗರು ಪರದೆಯಲ್ಲಿಯೇ ಓದಬಹುದು
ಅಥವಾ ಅದನ್ನು ಮುದ್ರಿಸಿಕೊಂಡು ಸಹ ಓದಬಹುದು. ಆದರೆ, ಅಗತ್ಯವಿದ್ದಷ್ಟು ಕನ್ನಡ ಪಠ್ಯವನ್ನು ನಕಲು ಮಾಡಿಕೊಂಡು, ಅದನ್ನು ಪುನರ್ಬಳಕೆ ಮಾಡಲು, ಅಂದರೆ, ಸಂಪಾದನಾ ಕಾರ್ಯಗಳನ್ನು ಮಾಡಲು
ಸಾಧ್ಯವಿಲ್ಲ. ಪುಸ್ತಕಗಳ ಡಿಜಿಟೈಸೇಷನ್ ಉದ್ದೇಶವು ಓದುಗರಿಗೆ ಪುಸ್ತಕಗಳ ಓದಿನ ಸವಲತ್ತನ್ನು ಅಷ್ಟೇ
ನೀಡುವುದಾದರೆ ಅದರಿಂದ ಹೆಚ್ಚಿನ ಪ್ರಯೋಜನವಿಲ್ಲ. ಆ ಪುಸ್ತಕದ ಪಠ್ಯರೂಪದ ಮಾಹಿತಿಯ ಉಲ್ಲೇಖವನ್ನು
ಉದ್ಧೃತ ಭಾಗವಾಗಿ ನೀಡಲು ಮತ್ತೆ ಪಠ್ಯವನ್ನು ಟೈಪಿಂಗ್ ಮಾಡಲೇಬೇಕು. ಫೋಟೋ ರೂಪದ ಪಠ್ಯವಿರುವ ಪುಟಗಳ
ಅಥವಾ ಫೈಲ್ನ ಗಾತ್ರವು ಹೆಚ್ಚಾಗಿರುವುದರಿಂದ, ಕಂಪ್ಯೂಟರ್ ಹಾರ್ಡ್ಡಿಸ್ಕ್ನ ಅಥವಾ ಇತರೆ ಸಂಗ್ರಹಣಾ ಮಾಧ್ಯಮಗಳಾದ
ಡಿ.ವಿ.ಡಿ.,
ಪೆನ್ಡ್ರೈವ್
ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಹೆಚ್ಚಿನ ಜಾಗವನ್ನು ಕಬಳಿಸುತ್ತವೆ. ಅಲ್ಲದೆ, ಅಂತರಜಾಲದಿಂದ ಡೌನ್ಲೋಡ್ ಆಗುವಲ್ಲಿ
ಹೆಚ್ಚಿನ ಸಮಯವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತವೆ. ಇವು ಪಠ್ಯರೂಪದಲ್ಲಿ ಲಭ್ಯವಾದರೆ, ಸಂಗ್ರಹಣಾ ಗಾತ್ರ ಗಣನೀಯವಾಗಿ
ಕಡಮೆಯಾಗಿ,
ವೇಗವಾಗಿ ಡೌನ್ಲೋಡ್
ಆಗುತ್ತದೆ. ಪಠ್ಯವನ್ನು ಯಥಾವತ್ತು ನಕಲಿಸಿಕೊಂಡು ಸಂಪಾದನಾ ಕಾರ್ಯದ ಮೂಲಕ ಅಗತ್ಯವಿರುವಷ್ಟು ಪಠ್ಯವನ್ನು
ಮಾತ್ರ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಅಲ್ಲದೆ, ಹೊಸದಾಗಿ ಟೈಪ್ಮಾಡುವ ಅಗತ್ಯ ಇರುವುದಿಲ್ಲ. ಇದರಿಂದಾಗಿ
ಸಮಯ ಮತ್ತು ಶ್ರಮ ಎಲ್ಲವೂ ಉಳಿತಾಯವಾಗುತ್ತದೆ. ಅಷ್ಟೇಅಲ್ಲದೆ, ಚಿತ್ರರೂಪದಲ್ಲಿರುವ ಲಿಪಿಯನ್ನು
ಇಂದಿನ ಅಂತರಜಾಲ ಸರ್ಚ್ ಎಂಜಿನ್ಗಳು ಹುಡುಕಿಕೊಡುವುದಿಲ್ಲ. ಈ ಕಾರಣದಿಂದಾಗಿ, ಇಂತಹ ಸ್ಕ್ಯಾನ್ರೂಪಿ ಫೈಲ್ಗಳಲ್ಲಿನ
ಮಾಹಿತಿಗಳನ್ನು ಅಂತರಜಾಲತಾಣಗಳಲ್ಲಿ ಇರಿಸಿ ಪ್ರಸಾರಿಸುವುದು ಅಸಾಧ್ಯದ ಕೆಲಸ.
ಮುದ್ರಿತ ಇಂಗ್ಲಿಷ್ ಪಠ್ಯವನ್ನು
ಕಂಪ್ಯೂಟರ್ ಲಿಪಿಯನ್ನಾಗಿ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಾಂಶಗಳು ಲಭ್ಯವಿವೆ. ಆದರೆ, ಕನ್ನಡದ ಮುದ್ರಿತ ಪಠ್ಯವನ್ನು
ಗುರುತಿಸಿ,
ಅವುಗಳನ್ನು ಕಂಪ್ಯೂಟರ್
ಪಠ್ಯವನ್ನಾಗಿಸುವ ತಂತ್ರಾಂಶಗಳು ಲಭ್ಯವಿಲ್ಲ. ಈ ತಂತ್ರಜ್ಞಾನವನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳಲು ಸಂಶೋಧನಾತ್ಮಕ
ಕ್ರಮಗಳು ಅಗತ್ಯವಾಗಿವೆ. ತಾಂತ್ರಿಕ ವಿಶ್ವವಿದ್ಯಾಲಯಗಳು ಮತ್ತು ಕಾಲೇಜುಗಳಲ್ಲಿ ಇಂತಹ ತಂತ್ರಜ್ಞಾನದ
ಕುರಿತಾದ ಸಂಶೋಧನಾ ಪ್ರಬಂಧಗಳು ಪ್ರಕಟವಾಗಿವೆಯೇ ವಿನಹ ಅವುಗಳ ಬಳಕೆಯೋಗ್ಯ ಉತ್ಪನ್ನವಾಗಿ ಹೊರಬಂದಿಲ್ಲ. ಕನ್ನಡದ ಓಸಿಆರ್ ತಂತ್ರಾಂಶವನ್ನು ತಯಾರಿಸಲು ಮೊದಲಿಗೆ ಕನ್ನಡದ
ಎಲ್ಲಾ ಅಕ್ಷರಗಳು, ಸ್ವರಗಳು ಸ್ವರಚಿಹ್ನೆಗಳು, ಒತ್ತಕ್ಷರಗಳು ಎಲ್ಲವುಗಳ ಮಾದರಿ ದೊರೆಯುವಂತೆ ಒಂದು ಮಾನಕ
ಅಥವಾ ಶಿಷ್ಟವಾದ (ಸ್ಟ್ಯಾಂಡರ್ಡ್) ಸೆಟ್ನ್ನು ಸಿದ್ಧಪಡಿಸಿಕೊಳ್ಳಬೇಕು. ನಂತರದಲ್ಲಿ, ವಿವಿಧ ಫಾಂಟ್ಗಳಲ್ಲಿ ಮುದ್ರಿವಾಗಿರುವ
ಅಕ್ಷರಗಳನ್ನು ಗುರುತಿಸುವ ತಂತ್ರಾಂಶವನ್ನು ಸಿದ್ಧಪಡಿಸಬೇಕು. ಇದು ಓಸಿಆರ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಕನ್ನಡಕ್ಕೆ ಅಳವಡಿಸುವ
ಪ್ರಕ್ರಿಯೆ. ಈ ಕ್ಷೇತ್ರದಲ್ಲಿ ಭಾರತೀಯ ಭಾಷೆಗಳ ವಿಚಾರದಲ್ಲಿ ನಡೆದಿರುವ ಸಂಶೋಧನೆಗಳು ಕನ್ನಡಕ್ಕೂ
ಬಳಕೆಯಾಗಿ,
ಕನ್ನಡಕ್ಕೂ ಓಸಿಆರ್
ತಂತ್ರಜ್ಞಾನವು ಉತ್ಪನ್ನದ ರೂಪದಲ್ಲಿ ಬಳಕೆಗೆ ಬರುವವರೆಗೆ ಈ ಸೌಲಭ್ಯಗಳು ಕನ್ನಡಕ್ಕೆ ದೊರೆಯುವುದಿಲ್ಲ.
ಕೇಂದ್ರ ಸರ್ಕಾರದ ಮಾಹಿತಿ ಮತ್ತು ತಂತ್ರಜ್ಞಾನ ಇಲಾಖೆಯ ಅನುದಾನಿತ ತಂತ್ರಾಂಶ ಸಂಶೋಧನಾ ಸಂಸ್ಥೆಯಾದ
ಪುಣೆಯ ಸೀಡ್ಯಾಕ್ ಸಂಸ್ಥೆಯು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗಾಗಿ ಓಸಿಆರ್ ತಂತ್ರಜ್ಞಾನವನ್ನು ಆವಿಷ್ಕರಿಸುವ ಪ್ರಯತ್ನದಲ್ಲಿ
ತೊಡಗಿದೆ. ಗೂಗಲ್ ಸಹ ಇಮೇಜ್ ಫೈಲ್ನಲ್ಲಿರುವ ಮುದ್ರಿತ ಮಾಹಿತಿಯನ್ನು ಪಠ್ಯವನ್ನಾಗಿಸುವ ಸವಲತ್ತನ್ನು
ನೀಡಿದೆ. ಆದರೆ, ಉತ್ತಮ ರೀತಿಯ ಬಳಕೆಯೋಗ್ಯ ತಂತ್ರಾಂಶವು ಇನ್ನೂ ಲಭ್ಯವಾಗಿಲ್ಲ. ಕೆಲವು ಖಾಸಗಿ ಕಂಪನಿಗಳು ತಮ್ಮ
ಸಂಶೋಧನೆಯ ಫಲವಾಗಿ ಕೆಲವು ಬೀಟಾ ವರ್ಷನ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದ್ದಾರೆ. ಅವುಗಳಲ್ಲಿ ತಕ್ಕಮಟ್ಟಿಗೆ
ಬಳಸಬಹುದಾದ ಮತ್ತು ಸರಿಸುಮಾರು ಚೆನ್ನಾಗಿಯೇ ಕೆಲಸ ಮಾಡುತ್ತಿದೆ ಎಂದು ಹೇಳಬಹುದಾದ ಕೆಲವೇ ಕನ್ನಡದ
ಓಸಿಆರ್ ತಂತ್ರಾಂಶಗಳ ಪೈಕಿ ‘ಕನ್ಸ್ಕ್ಯಾನ್’ ತಂತ್ರಾಂಶವೂ ಸಹ ಒಂದು.
‘ಕನ್ಸ್ಕ್ಯಾನ್’ ಎಂಬ ಕನ್ನಡದ ಓಸಿಆರ್ ತಂತ್ರಾಂಶ
: ಕಲೈಡೋಸ್ಕೋಪ್ ಸಾಫ್ಟ್ವೇರ್ ಲಿಮಿಟೆಡ್ ಎಂಬ ಹೆಸರಿನ ಬೆಂಗಳೂರಿನ ಖಾಸಗಿ ಕಂಪನಿಯೊಂದು ಕನ್ನಡದ ಓಸಿಆರ್ ತಂತ್ರಾಂಶವಾದ ‘ಕನ್ಸ್ಕ್ಯಾನ್’ ಅನ್ನು ಸಿದ್ಧಪಡಿಸಿದೆ. ಕನ್ನಡಕ್ಕೆ
ಇದೊಂದು ಉಪಯುಕ್ತವಾದ ತಂತ್ರಾಂಶವಾಗಿದೆ. ಇದರ ಪರೀಕ್ಷಾರ್ಥ ಆವೃತ್ತಿ (ಟ್ರಯಲ್ ವರ್ಷನ್) ತಿತಿತಿ.ಞಚಿಟeiಜosoಜಿಣತಿಚಿಡಿe.ಛಿom ಅಂತರಜಾಲತಾಣದಿಂದ ಡೌನ್ಲೋಡ್
ಮಾಡಿಕೊಳ್ಳಬಹುದು. ಇದನ್ನು ಬಳಸಿ, ಮೊದಲಿಗೆ, ಮುದ್ರಿತ ಕನ್ನಡ ಪಠ್ಯದ ಒಂದೊಂದೇ ಪುಟವನ್ನು ಸ್ಕ್ಯಾನ್
ಮಾಡಿ,
ನಂತರ ಒಂದೊಂದೇ
ಪುಟವನ್ನು ಈ ತಂತ್ರಾಂಶದ ಮೂಲಕ ಡಿಜಿಟಲ್ ಪಠ್ಯವನ್ನಾಗಿ ಪರಿವರ್ತಿಸಬಹುದು. ಇದರಿಂದಾಗಿ ಟೈಪಿಂಗ್
ಕೆಲಸವು ಇಲ್ಲದೆ ಮುದ್ರಿತ ಪಠ್ಯವು ಡಿಜಿಟಲ್ ಪಠ್ಯವಾಗಿ ಪರಿವರ್ತನೆಗೊಳ್ಳುತ್ತದೆ. ಆದರೆ, ಪರಿವರ್ತಿತಗೊಂಡ ಪಠ್ಯವು ನೂರಕ್ಕೆ
ನೂರರಷ್ಟು ಕರಾರುವಾಕ್ಕಾಗಿರುವುದಿಲ್ಲ. ಹಲವು ಕಾಗುಣಿತದ ತಪ್ಪುಗಳು ಇರುತ್ತವೆ. ಅಕ್ಷರಗಳ ಜಾಕ್ಷುಕ
ರೂಪವನ್ನು ಗುರುತಿಸಿ, ತಂತ್ರಾಂಶವು ಹಲವು ರೀತಿಯ ಪ್ರಕ್ರಿಯೆಗಳನ್ನು ಬಳಸಿ, ಪಠ್ಯರೂಪಕ್ಕೆ ಸ್ವಯಂಪರಿವರ್ತನೆ
ಮಾಡುವಾಗ ಅಕ್ಷರಗಳನ್ನು ತಪ್ಪಾಗಿ ಗುರುತಿಸುವ ಹಲವು ಸಾಧ್ಯತೆಗಳಿವೆ. ಒತ್ತಕ್ಷರಗಳು ಬಿಟ್ಟುಹೋಗಿ
ಕೇವಲ ಮೂಲ ಅಕ್ಷರಗಳು ಮೂಡಿಬರುವ ಸಂಭವವೂ ಸಹ ಇದೆ. ಆದ್ದರಿಂದ, ಮೂಲ ಮುದ್ರಿತ ಪಠ್ಯವನ್ನು ಓದಿಕೊಂಡು, ತಂತ್ರಾಂಶದ ಮೂಲಕ ಪರಿವರ್ತನೆಗೊಂಡ
ಡಿಜಿಟಲ್ ಪಠ್ಯವನ್ನು ಟೈಪಿಂಗ್ ಮೂಲಕ ಸೂಕ್ತವಾಗಿ ತಿದ್ದಬೇಕಾಗುತ್ತದೆ. ಇಲ್ಲಿ, ಇಡೀ ಪುಟವನ್ನು ಟೈಪಿಂಗ್ ಮಾಡುವ ಸಮಯ, ಶ್ರಮ, ಅಷ್ಟರಮಟ್ಟಿಗೆ ಉಳಿತಾಯವಾಗುತ್ತದೆ.
ಕೇವಲ ತಪ್ಪುಒಪ್ಪುಗಳನ್ನು ಸರಿಪಡಿಸಿಕೊಂಡಲ್ಲಿ ಅಲ್ಪ ಸಮಯದಲ್ಲಿಯೇ ಇಡೀ ಪುಟದ ಮುದ್ರಿತ ಪಠ್ಯವು ಡಿಜಿಟಲ್
ಪಠ್ಯವಾಗಿ ದೊರೆಯುತ್ತದೆ. ಆ ಪಠ್ಯವನ್ನು ಸಂಪಾದನಾ ಕಾರ್ಯ ಸೇರಿದಂತೆ ಯಾವುದೇ ಉದ್ದೇಶಕ್ಕೆ ಬಳಸಿಕೊಳ್ಳಬಹುದು.
ಮರುಮುದ್ರಣಕ್ಕೂ ಈ ಪಠ್ಯವನ್ನು ಬಳಸಿಕೊಳ್ಳಬಹುದು.
ಕಂಪ್ಯೂಟರ್ ಡಿಸ್ಕ್ನಲ್ಲಿ ಹೆಚ್ಚಿನ ಸ್ಟೋರೇಜ್ ಕಬಳಿಸುವ
ಕನ್ನಡದ ಇಮೇಜ್ ಫೈಲ್ಗಳ ಬದಲಾಗಿ ಕಡಿಮೆ ಸ್ಟೋರೇಜ್ ಇರುವ ಕನ್ನಡ ಪಠ್ಯದ ಫೈಲ್ಗಳು ಸಿದ್ಧವಾದರೆ
ಅಂತಹ ಪಠ್ಯವನ್ನು ಅಂತರಜಾಲದಲ್ಲಿ ಅಪ್ಲೋಡ್ ಮತ್ತು ಡೌನ್ಲೋಡ್ ಮಾಡುವುದು ಸುಲಭವಾಗುತ್ತದೆ. ಅಂತರಜಾಲದಲ್ಲಿ
ಪಠ್ಯವನ್ನು ಹುಡುಕುವುದು ಸುಲಭವಾಗುತ್ತದೆ. ಹಾಗೂ, ವಿವಿಧ ಉದ್ದೇಶಗಳಿಗಾಗಿ ಕನ್ನಡದ ಪಠ್ಯವನ್ನು ಬೇರೆಬೇರೆ
‘ಆಸ್ಕಿ ಫಾಂಟ್’ಗಳಿಗೆ ಮತ್ತು ‘ಯುನಿಕೋಡ್ ಎನ್ಕೋಡಿಂಗ್ ಫಾಂಟ್’ಗಳಿಗೆ ಪರಿವರ್ತಿಸಿಕೊಂಡು ಬಳಸುವುದೂ
ಸಹ ಸುಲಭವಾಗುತ್ತದೆ. ಕನ್ನಡವನ್ನು ಕಂಪ್ಯೂಟರಿನಲ್ಲಿ ಸಮರ್ಥವಾಗಿ ಬಳಸಲು ಇಂತಹ ಕನ್ನಡದ ಓಸಿಆರ್ ತಂತ್ರಾಂಶಗಳು
ಅತ್ಯಂತ ಉಪಯುಕ್ತವಾಗಬಲ್ಲವು.
ಕಾಮೆಂಟ್ಗಳು
ಕಾಮೆಂಟ್ ಪೋಸ್ಟ್ ಮಾಡಿ