ಕೈಬರಹ ಡೇಟಾಸೆಟ್‌ಗಳು

ನಿಮ್ಮ ML ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು 22 ಅತ್ಯುತ್ತಮ ಓಪನ್ ಸೋರ್ಸ್ OCR ಮತ್ತು ಕೈಬರಹ ಡೇಟಾಸೆಟ್‌ಗಳು

ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ ಬಳಕೆಯ ಏರಿಕೆಯು ಪ್ರಾಥಮಿಕವಾಗಿ ಸ್ವಯಂಚಾಲಿತ ಗುರುತಿಸುವಿಕೆ ವ್ಯವಸ್ಥೆಗಳ ಉತ್ಪಾದನೆಯಲ್ಲಿನ ಹೆಚ್ಚಳಕ್ಕೆ ಕಾರಣವಾಗಿದೆ. ಇದರ ಪರಿಣಾಮವಾಗಿ, OCR ತಂತ್ರಜ್ಞಾನದ ಜಾಗತಿಕ ಮಾರುಕಟ್ಟೆ ಮೌಲ್ಯವು, ಪೆಗ್ಡ್ $ 8.93 ಶತಕೋಟಿ 2021 ರಲ್ಲಿ, 15.4 ಮತ್ತು 2022 ರ ನಡುವೆ 2030% ನ CAGR ನಲ್ಲಿ ಬೆಳೆಯುತ್ತದೆ ಎಂದು ಊಹಿಸಲಾಗಿದೆ.

ಆದರೆ OCR ತಂತ್ರಜ್ಞಾನ ನಿಖರವಾಗಿ ಏನು? ಮತ್ತು ದಕ್ಷ AI ಮಾದರಿಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ ವ್ಯವಹಾರಗಳಿಗೆ ಇದು ಆಟದ ಬದಲಾವಣೆ ಏಕೆ? ಕಂಡುಹಿಡಿಯೋಣ.

OCR (ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್) ಎಂದರೇನು?

OCR ಎನ್ನುವುದು ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಪೇಪರ್ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳು, PDF ಗಳು ಅಥವಾ ಪಠ್ಯದ ಚಿತ್ರಗಳಂತಹ ವಿವಿಧ ರೀತಿಯ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಸಂಪಾದಿಸಬಹುದಾದ ಮತ್ತು ಹುಡುಕಬಹುದಾದ ಡೇಟಾಗೆ ಪರಿವರ್ತಿಸುವ ತಂತ್ರಜ್ಞಾನವಾಗಿದೆ. ಇದು ಇವರಿಂದ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ:

  • ಚಿತ್ರದಲ್ಲಿನ ಪಠ್ಯದ ರಚನೆಯನ್ನು ವಿಶ್ಲೇಷಿಸುವುದು
  • ಪಠ್ಯವನ್ನು ಸಾಲುಗಳು ಮತ್ತು ಅಕ್ಷರಗಳಾಗಿ ವಿಭಜಿಸುವುದು
  • ಈ ದೃಶ್ಯ ಅಕ್ಷರಗಳನ್ನು ಯಂತ್ರ-ಓದಬಲ್ಲ ಪಠ್ಯವಾಗಿ ಪರಿವರ್ತಿಸುವುದು

ಸಾಮಾನ್ಯ ಬಳಕೆಗಳು ಸೇರಿವೆ:

  • ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಡಾಕ್ಯುಮೆಂಟ್‌ಗಳನ್ನು ಸಂಪಾದಿಸಬಹುದಾದ ಪಠ್ಯ ಫೈಲ್‌ಗಳಾಗಿ ಪರಿವರ್ತಿಸುವುದು
  • ಮುದ್ರಿತ ಪುಸ್ತಕಗಳನ್ನು ಡಿಜಿಟಲೀಕರಣಗೊಳಿಸುವುದು
  • ಫೋಟೋಗಳಿಂದ ಪಠ್ಯವನ್ನು ಹೊರತೆಗೆಯಲಾಗುತ್ತಿದೆ
  • ಕೈಬರಹದ ಪ್ರಿಸ್ಕ್ರಿಪ್ಷನ್‌ಗಳನ್ನು ಡಿಜಿಟಲ್ ಪಠ್ಯಕ್ಕೆ ಪರಿವರ್ತಿಸುವುದು
  • ಪರವಾನಗಿ ಫಲಕ ಗುರುತಿಸುವಿಕೆ

ಒಸಿಆರ್ ತರಬೇತಿ ಡೇಟಾ

ಓಪನ್ ಸೋರ್ಸ್ ಡೇಟಾಸೆಟ್‌ಗಳ ಪ್ರಯೋಜನಗಳು ಮತ್ತು ಸವಾಲುಗಳು

ವ್ಯಾಪಾರಗಳು ತಮ್ಮ ML ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗಾಗಿ ಉಚಿತ-ಬಳಕೆಯ ಡೇಟಾವನ್ನು ಆರಿಸಿಕೊಳ್ಳಬೇಕೇ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಪರಸ್ಪರ ಪ್ರಯೋಜನಗಳು ಮತ್ತು ಸವಾಲುಗಳನ್ನು ಎದುರಿಸಬೇಕಾಗುತ್ತದೆ.

ಪ್ರಯೋಜನಗಳು

  • ಡೇಟಾವನ್ನು ಪ್ರವೇಶಿಸಲು ಸುಲಭವಾಗಿ ಲಭ್ಯವಿದೆ. ಡೇಟಾ ಲಭ್ಯತೆಯಿಂದಾಗಿ, ಅಪ್ಲಿಕೇಶನ್ ಅನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ ವೆಚ್ಚವು ಗಮನಾರ್ಹವಾಗಿ ಕಡಿಮೆಯಾಗಿದೆ.
  • ಡೇಟಾಸೆಟ್ ಸುಲಭವಾಗಿ ಲಭ್ಯವಿರುವುದರಿಂದ ಅಪ್ಲಿಕೇಶನ್‌ಗಾಗಿ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು ಖರ್ಚು ಮಾಡುವ ಸಮಯ ಮತ್ತು ಶ್ರಮವು ಗಮನಾರ್ಹವಾಗಿ ಕಡಿಮೆಯಾಗುತ್ತದೆ.
  • ಡೇಟಾಸೆಟ್ ಅನ್ನು ಕಲಿಯಲು, ಹೊಂದಿಕೊಳ್ಳಲು ಮತ್ತು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲು ಸಹಾಯ ಮಾಡುವ ಸಮುದಾಯ ವೇದಿಕೆಗಳು ಅಥವಾ ಸಹಾಯ ಗುಂಪುಗಳು ಹೇರಳವಾಗಿವೆ.
  • ಓಪನ್ ಸೋರ್ಸ್ ಡೇಟಾಸೆಟ್‌ನ ಪ್ರಮುಖ ಅನುಕೂಲವೆಂದರೆ ಅದು ಗ್ರಾಹಕೀಕರಣದ ಮೇಲೆ ಯಾವುದೇ ನಿರ್ಬಂಧಗಳನ್ನು ಹಾಕುವುದಿಲ್ಲ.
  •   ಮುಕ್ತ-ಮೂಲ ಡೇಟಾವನ್ನು ಜನಸಂಖ್ಯೆಯ ದೊಡ್ಡ ಭಾಗಕ್ಕೆ ಪ್ರವೇಶಿಸಬಹುದು, ವಿತ್ತೀಯ ಅಡೆತಡೆಗಳಿಲ್ಲದೆ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ನಾವೀನ್ಯತೆಯನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ.

ಸವಾಲುಗಳು

  • ಯೋಜನೆಗೆ ನಿರ್ದಿಷ್ಟವಾದ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳುವುದು ಕಷ್ಟ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ಮಾಹಿತಿಯು ಕಾಣೆಯಾಗಿದೆ ಮತ್ತು ಲಭ್ಯವಿರುವ ಡೇಟಾದ ತಪ್ಪಾದ ಬಳಕೆಯ ಸಾಧ್ಯತೆಯಿದೆ.
  • ಸ್ವಾಮ್ಯದ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳುವುದು ಸಮಯ ಮತ್ತು ಶ್ರಮವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ದುಬಾರಿಯಾಗಿದೆ
  • ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳುವುದು ಸುಲಭವಾಗಿದ್ದರೂ, ಜ್ಞಾನ ಮತ್ತು ವಿಶ್ಲೇಷಣೆ ವೆಚ್ಚವು ಆರಂಭಿಕ ಪ್ರಯೋಜನವನ್ನು ಮೀರಿಸುತ್ತದೆ.
  • ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಇತರ ಡೆವಲಪರ್‌ಗಳು ಸಹ ಅದೇ ಡೇಟಾವನ್ನು ಬಳಸುತ್ತಾರೆ.
  • ಈ ಡೇಟಾಸೆಟ್‌ಗಳು ಭದ್ರತಾ ಉಲ್ಲಂಘನೆಗಳು, ಗೌಪ್ಯತೆ ಮತ್ತು ಸಮ್ಮತಿಗೆ ಹೆಚ್ಚು ದುರ್ಬಲವಾಗಿರುತ್ತವೆ.

ಯಂತ್ರ ಕಲಿಕೆಗಾಗಿ 22 ಅತ್ಯುತ್ತಮ ಕೈಬರಹ ಮತ್ತು OCR ಡೇಟಾಸೆಟ್‌ಗಳು

ಓಪನ್ ಸೋರ್ಸ್ ಒಸಿಆರ್ ಡೇಟಾಸೆಟ್‌ಗಳು

ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ಅಪ್ಲಿಕೇಶನ್ ಅಭಿವೃದ್ಧಿಗಾಗಿ ಅನೇಕ ತೆರೆದ ಮೂಲ ಡೇಟಾಸೆಟ್‌ಗಳು ಲಭ್ಯವಿದೆ. ಕೆಲವು ಅತ್ಯುತ್ತಮ 22 ಇವೆ

  1. NIST ಡೇಟಾಬೇಸ್

    NIST ಅಥವಾ ನ್ಯಾಷನಲ್ ಇನ್‌ಸ್ಟಿಟ್ಯೂಟ್ ಆಫ್ ಸೈನ್ಸ್ 3600 ಕ್ಕೂ ಹೆಚ್ಚು ಅಕ್ಷರ ಚಿತ್ರಗಳೊಂದಿಗೆ 810,000 ಕ್ಕೂ ಹೆಚ್ಚು ಕೈಬರಹದ ಮಾದರಿಗಳ ಬಳಕೆಗೆ ಉಚಿತ ಸಂಗ್ರಹವನ್ನು ನೀಡುತ್ತದೆ.

  2. MNIST ಡೇಟಾಬೇಸ್

    NSITಯ ವಿಶೇಷ ಡೇಟಾಬೇಸ್ 1 ಮತ್ತು 3 ರಿಂದ ಪಡೆಯಲಾಗಿದೆ, MNIST ಡೇಟಾಬೇಸ್ ತರಬೇತಿ ಸೆಟ್‌ಗಾಗಿ 60,000 ಕೈಬರಹದ ಸಂಖ್ಯೆಗಳು ಮತ್ತು ಪರೀಕ್ಷಾ ಸೆಟ್‌ಗಾಗಿ 10,000 ಉದಾಹರಣೆಗಳ ಸಂಕಲನವಾಗಿದೆ. ಪೂರ್ವ-ಸಂಸ್ಕರಣೆಯಲ್ಲಿ ಕಡಿಮೆ ಸಮಯವನ್ನು ವ್ಯಯಿಸುವಾಗ ಮಾದರಿಗಳನ್ನು ಗುರುತಿಸಲು ಈ ಮುಕ್ತ-ಮೂಲ ಡೇಟಾಬೇಸ್ ರೈಲು ಮಾದರಿಗಳಿಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ.

  3. ಪಠ್ಯ ಪತ್ತೆ

    ತೆರೆದ ಮೂಲ ಡೇಟಾಬೇಸ್, ಪಠ್ಯ ಪತ್ತೆ ಡೇಟಾಸೆಟ್ ಸೈನ್‌ಬೋರ್ಡ್‌ಗಳು, ಡೋರ್ ಪ್ಲೇಟ್‌ಗಳು, ಎಚ್ಚರಿಕೆ ಫಲಕಗಳು ಮತ್ತು ಹೆಚ್ಚಿನವುಗಳ ಸುಮಾರು 500 ಒಳಾಂಗಣ ಮತ್ತು ಹೊರಾಂಗಣ ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.

  4. ಸ್ಟ್ಯಾನ್‌ಫೋರ್ಡ್ OCR

    ಸ್ಟ್ಯಾನ್‌ಫೋರ್ಡ್ ಪ್ರಕಟಿಸಿದ, ಈ ಉಚಿತ-ಬಳಕೆಯ ಡೇಟಾಸೆಟ್ MIT ಸ್ಪೋಕನ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಸಿಸ್ಟಮ್ಸ್ ಗ್ರೂಪ್‌ನಿಂದ ಕೈಬರಹದ ಪದ ಸಂಗ್ರಹವಾಗಿದೆ.

  5. ಗಲ್ಲಿ ವೀಕ್ಷಣೆ ಪಠ್ಯ

    Google ಸ್ಟ್ರೀಟ್ ವ್ಯೂ ಚಿತ್ರಗಳಿಂದ ಸಂಗ್ರಹಿಸಲಾಗಿದೆ, ಈ ಡೇಟಾಸೆಟ್ ಮುಖ್ಯವಾಗಿ ಬೋರ್ಡ್‌ಗಳು ಮತ್ತು ಬೀದಿ-ಹಂತದ ಚಿಹ್ನೆಗಳ ಪಠ್ಯ ಪತ್ತೆ ಚಿತ್ರಗಳನ್ನು ಹೊಂದಿದೆ.

  6. ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾಬೇಸ್

    ಡಾಕ್ಯುಮೆಂಟ್ ಡೇಟಾಬೇಸ್ 941 ಬರಹಗಾರರಿಂದ ಕೋಷ್ಟಕಗಳು, ಸೂತ್ರಗಳು, ರೇಖಾಚಿತ್ರಗಳು, ರೇಖಾಚಿತ್ರಗಳು, ಪಟ್ಟಿಗಳು ಮತ್ತು ಹೆಚ್ಚಿನವುಗಳನ್ನು ಒಳಗೊಂಡಂತೆ 189 ಕೈಬರಹದ ದಾಖಲೆಗಳ ಸಂಗ್ರಹವಾಗಿದೆ.

  7. ಗಣಿತದ ಅಭಿವ್ಯಕ್ತಿಗಳು

    ಗಣಿತದ ಅಭಿವ್ಯಕ್ತಿಗಳು 101 ಗಣಿತದ ಚಿಹ್ನೆಗಳು ಮತ್ತು 10,000 ಅಭಿವ್ಯಕ್ತಿಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಡೇಟಾಬೇಸ್ ಆಗಿದೆ.

  8. ಗಲ್ಲಿ ವೀಕ್ಷಣೆ ಮನೆ ಸಂಖ್ಯೆಗಳು

    ಗೂಗಲ್ ಸ್ಟ್ರೀಟ್ ವ್ಯೂನಿಂದ ಕೊಯ್ಲು ಮಾಡಲಾಗಿದೆ, ಈ ಸ್ಟ್ರೀಟ್ ವ್ಯೂ ಹೌಸ್ ಸಂಖ್ಯೆಗಳು 73257 ಸ್ಟ್ರೀಟ್ ಹೌಸ್ ಸಂಖ್ಯೆ ಅಂಕಿಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಡೇಟಾಬೇಸ್ ಆಗಿದೆ.

  9. ನೈಸರ್ಗಿಕ ಪರಿಸರ OCR

    ನೈಸರ್ಗಿಕ ಪರಿಸರ OCR, ವಿಶ್ವಾದ್ಯಂತ ಸುಮಾರು 660 ಚಿತ್ರಗಳು ಮತ್ತು 5238 ಪಠ್ಯ ಟಿಪ್ಪಣಿಗಳ ಡೇಟಾಸೆಟ್ ಆಗಿದೆ.

  10. ಗಣಿತದ ಅಭಿವ್ಯಕ್ತಿಗಳು

    10,000+ ಗಣಿತ ಚಿಹ್ನೆಗಳೊಂದಿಗೆ 101 ಕ್ಕೂ ಹೆಚ್ಚು ಅಭಿವ್ಯಕ್ತಿಗಳು.

  11. ಕೈಬರಹದ ಚೈನೀಸ್ ಅಕ್ಷರಗಳು

    909,818 ಕೈಬರಹದ ಚೈನೀಸ್ ಅಕ್ಷರ ಚಿತ್ರಗಳ ಡೇಟಾ ಸೆಟ್, ಸುಮಾರು 10 ಸುದ್ದಿ ಲೇಖನಗಳಿಗೆ ಸಮನಾಗಿರುತ್ತದೆ.

  12. ಅರೇಬಿಕ್ ಮುದ್ರಿತ ಪಠ್ಯ

    113,284 ಅರೇಬಿಕ್ ಫಾಂಟ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು 10 ಪದಗಳ ಲೆಕ್ಸಿಕಾನ್.

  13. ಕೈಬರಹದ ಇಂಗ್ಲಿಷ್ ಪಠ್ಯ

    1700 ಕ್ಕೂ ಹೆಚ್ಚು ನಮೂದುಗಳೊಂದಿಗೆ ವೈಟ್‌ಬೋರ್ಡ್‌ನಲ್ಲಿ ಕೈಬರಹದ ಇಂಗ್ಲಿಷ್ ಪಠ್ಯ.

  14. 3000 ಪರಿಸರದ ಚಿತ್ರಗಳು

    ವಿಭಿನ್ನ ಬೆಳಕಿನ ಅಡಿಯಲ್ಲಿ ಹೊರಾಂಗಣ ಮತ್ತು ಒಳಾಂಗಣ ದೃಶ್ಯಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ವಿವಿಧ ಪರಿಸರದಿಂದ 3000 ಚಿತ್ರಗಳು.

  15. Chars74K ಡೇಟಾ

    ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಕನ್ನಡ ಅಂಕಿಗಳ 74,000 ಚಿತ್ರಗಳು.

  16. IAM (IAM ಕೈಬರಹ)

    IAM ಡೇಟಾಬೇಸ್ ಬ್ರಿಟಿಷ್ ಇಂಗ್ಲಿಷ್‌ನ ಲಂಕಾಸ್ಟರ್-ಓಸ್ಲೋ/ಬರ್ಗೆನ್ ಕಾರ್ಪಸ್‌ನಿಂದ 13,353 ಬರಹಗಾರರಿಂದ 657 ಕೈಬರಹದ ಪಠ್ಯ ಚಿತ್ರಗಳನ್ನು ಹೊಂದಿದೆ.

  17. FUNSD (ಗದ್ದಲದ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ದಾಖಲೆಗಳಲ್ಲಿ ಫಾರ್ಮ್ ಅಂಡರ್ಸ್ಟ್ಯಾಂಡಿಂಗ್)

    FUNSD 199 ಟಿಪ್ಪಣಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ವಿವಿಧ ಮತ್ತು ಗದ್ದಲದ ನೋಟಗಳೊಂದಿಗೆ ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾದ ರೂಪಗಳು, ಫಾರ್ಮ್ ತಿಳುವಳಿಕೆಗೆ ಸವಾಲಾಗಿದೆ.

  18. ಪಠ್ಯ OCR

    TextOCR ನೈಸರ್ಗಿಕ ಚಿತ್ರಗಳಲ್ಲಿ ಅನಿಯಂತ್ರಿತ ಆಕಾರದ ದೃಶ್ಯ-ಪಠ್ಯದ ಮೇಲೆ ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಬೆಂಚ್‌ಮಾರ್ಕ್ ಮಾಡುತ್ತದೆ.

  19. ಟ್ವಿಟರ್ 100 ಕೆ

    Twitter100k ದುರ್ಬಲವಾಗಿ ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲಾದ ಕ್ರಾಸ್-ಮೀಡಿಯಾ ಮರುಪಡೆಯುವಿಕೆಗಾಗಿ ದೊಡ್ಡ ಡೇಟಾಸೆಟ್ ಆಗಿದೆ.

  20. SSIG-SegPlate – ಲೈಸೆನ್ಸ್ ಪ್ಲೇಟ್ ಕ್ಯಾರೆಕ್ಟರ್ ಸೆಗ್ಮೆಂಟೇಶನ್ (LPCS)

    ಈ ಡೇಟಾಸೆಟ್ 101 ಹಗಲಿನ ವಾಹನ ಚಿತ್ರಗಳೊಂದಿಗೆ ಪರವಾನಗಿ ಪ್ಲೇಟ್ ಕ್ಯಾರೆಕ್ಟರ್ ಸೆಗ್ಮೆಂಟೇಶನ್ (LPCS) ಅನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುತ್ತದೆ.

  21. 105,941 ಚಿತ್ರಗಳು ನೈಸರ್ಗಿಕ ದೃಶ್ಯಗಳು 12 ಭಾಷೆಗಳ OCR ಡೇಟಾ

    ಡೇಟಾವು 12 ಭಾಷೆಗಳನ್ನು (6 ಏಷ್ಯನ್, 6 ಯುರೋಪಿಯನ್) ಮತ್ತು ವಿವಿಧ ನೈಸರ್ಗಿಕ ದೃಶ್ಯಗಳು ಮತ್ತು ಕೋನಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ಲೈನ್-ಲೆವೆಲ್ ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್‌ಗಳು ಮತ್ತು ಪಠ್ಯ ಪ್ರತಿಲೇಖನಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಬಹು-ಭಾಷಾ OCR ಕಾರ್ಯಗಳಿಗೆ ಇದು ಉಪಯುಕ್ತವಾಗಿದೆ.

  22. ಭಾರತೀಯ ಸೈನ್‌ಬೋರ್ಡ್ ಚಿತ್ರ ಡೇಟಾಸೆಟ್

    ಡೇಟಾಸೆಟ್ ವರ್ಗೀಕರಣ ಮತ್ತು ಪತ್ತೆಗಾಗಿ ಭಾರತೀಯ ಸಂಚಾರ ಚಿಹ್ನೆ ಚಿತ್ರಗಳನ್ನು ಹೊಂದಿದೆ, ಹಗಲು, ಸಂಜೆ ಮತ್ತು ರಾತ್ರಿಯ ಸಮಯದಲ್ಲಿ ವಿವಿಧ ಹವಾಮಾನ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ತೆಗೆದಿದೆ.

ಪಠ್ಯ ಪತ್ತೆ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗಾಗಿ ML ಮಾದರಿಗಳ ತರಬೇತಿಗಾಗಿ ಇವು ಕೆಲವು ಉನ್ನತ ತೆರೆದ ಮೂಲ ಡೇಟಾಸೆಟ್‌ಗಳಾಗಿವೆ. ನಿಮ್ಮ ವ್ಯಾಪಾರ ಮತ್ತು ಅಪ್ಲಿಕೇಶನ್ ಅಗತ್ಯಗಳಿಗೆ ಹೊಂದಿಕೆಯಾಗುವ ಒಂದನ್ನು ಆಯ್ಕೆಮಾಡಲು ಸಮಯ ಮತ್ತು ಶ್ರಮ ತೆಗೆದುಕೊಳ್ಳಬಹುದು. ಆದಾಗ್ಯೂ, ಸೂಕ್ತವಾದದನ್ನು ನಿರ್ಧರಿಸುವ ಮೊದಲು ನೀವು ಈ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಪ್ರಯೋಗಿಸಬೇಕು.

[ಇದನ್ನೂ ಓದಿ: OCR ಇನ್ಫೋಗ್ರಾಫಿಕ್ - ವ್ಯಾಖ್ಯಾನ, ಪ್ರಯೋಜನಗಳು, ಸವಾಲುಗಳು ಮತ್ತು ಬಳಕೆಯ ಪ್ರಕರಣಗಳು]

ವಿಶ್ವಾಸಾರ್ಹ ಮತ್ತು ಪರಿಣಾಮಕಾರಿ ಪಠ್ಯ ಪತ್ತೆ ಅಪ್ಲಿಕೇಶನ್‌ನತ್ತ ಮುನ್ನಡೆಯಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು ಶೈಪ್ - ಉನ್ನತ ಶ್ರೇಣಿಯ ತಂತ್ರಜ್ಞಾನ ಪರಿಹಾರ ಪೂರೈಕೆದಾರ. ವಿವಿಧ ಕ್ಲೈಂಟ್ ಪ್ರಾಜೆಕ್ಟ್‌ಗಳಿಗಾಗಿ ಗ್ರಾಹಕೀಯಗೊಳಿಸಬಹುದಾದ, ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾದ ಮತ್ತು ಪರಿಣಾಮಕಾರಿಯಾದ OCR ತರಬೇತಿ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ರಚಿಸಲು ನಮ್ಮ ತಾಂತ್ರಿಕ ಅನುಭವವನ್ನು ನಾವು ಬಳಸಿಕೊಳ್ಳುತ್ತೇವೆ. ನಮ್ಮ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು, ಇಂದೇ ನಮ್ಮನ್ನು ಸಂಪರ್ಕಿಸಿ.

ಸಾಮಾಜಿಕ ಹಂಚಿಕೆ