ವ್ಯಾಖ್ಯಾನ
ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಎಂದರೆ ಚಿತ್ರಗಳು ಅಥವಾ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ದಾಖಲೆಗಳಲ್ಲಿನ ಪಠ್ಯ ಅಕ್ಷರಗಳ ಗುರುತಿಸುವಿಕೆ. ಇದು ಮುದ್ರಿತ ಮತ್ತು ಕೈಬರಹದ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಒಳಗೊಂಡಿದೆ.
ಉದ್ದೇಶ
ದೃಶ್ಯ ಸ್ವರೂಪಗಳಲ್ಲಿನ ಪಠ್ಯವನ್ನು ಪ್ರವೇಶಿಸಬಹುದಾದ ಮತ್ತು ಹುಡುಕಬಹುದಾದಂತೆ ಮಾಡುವುದು ಇದರ ಉದ್ದೇಶವಾಗಿದೆ.
ಪ್ರಾಮುಖ್ಯತೆ
- ಆರ್ಕೈವ್ಗಳ ಡಿಜಿಟಲೀಕರಣವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.
- ಪ್ರವೇಶಸಾಧ್ಯತೆ ಮತ್ತು ಯಾಂತ್ರೀಕರಣಕ್ಕೆ ನಿರ್ಣಾಯಕ.
- ನಿಖರತೆಯು ಚಿತ್ರದ ಗುಣಮಟ್ಟವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.
- OCR ತಂತ್ರಜ್ಞಾನಗಳಿಗೆ ಸಂಬಂಧಿಸಿದೆ.
ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ
- ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಅಥವಾ ಛಾಯಾಚಿತ್ರ ಮಾಡಿದ ದಾಖಲೆಗಳನ್ನು ಸೆರೆಹಿಡಿಯಿರಿ.
- ಸ್ಪಷ್ಟತೆಯನ್ನು ಸುಧಾರಿಸಲು ಚಿತ್ರಗಳನ್ನು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆಗೊಳಿಸಿ.
- ಪಠ್ಯ ಪ್ರದೇಶಗಳನ್ನು ಪತ್ತೆ ಮಾಡಿ.
- ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳನ್ನು ಅನ್ವಯಿಸಿ.
- ಯಂತ್ರ-ಓದಬಲ್ಲ ಪಠ್ಯವನ್ನು ಔಟ್ಪುಟ್ ಮಾಡಿ.
ಉದಾಹರಣೆಗಳು (ವಾಸ್ತವ ಪ್ರಪಂಚ)
- ಗೂಗಲ್ ಲೆನ್ಸ್: ಫೋಟೋಗಳಲ್ಲಿನ ಪಠ್ಯವನ್ನು ಗುರುತಿಸುತ್ತದೆ.
- ABBYY FineReader: ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ದಾಖಲೆಗಳನ್ನು ಡಿಜಿಟಲೀಕರಣಗೊಳಿಸುತ್ತದೆ.
- ಟೆಸ್ಸೆರಾಕ್ಟ್ OCR: ಮುಕ್ತ ಮೂಲ ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಎಂಜಿನ್.
ಉಲ್ಲೇಖಗಳು / ಹೆಚ್ಚಿನ ಓದಿಗೆ
- ಸ್ಮಿತ್, ಆರ್. "ಟೆಸ್ಸೆರಾಕ್ಟ್ OCR ಎಂಜಿನ್ನ ಅವಲೋಕನ." ICDAR.
- ISO/IEC 15938-4 ಮಾನದಂಡ.
- ಪ್ಯಾಟರ್ನ್ ಅನಾಲಿಸಿಸ್ ಮತ್ತು ಮೆಷಿನ್ ಇಂಟೆಲಿಜೆನ್ಸ್ನಲ್ಲಿ IEEE ವಹಿವಾಟುಗಳು.