ಅರೇಬಿಕ್ & ಥಾಯ್ & ವಿಯೆಟ್ನಾಮೀಸ್ & ಹಿಂದಿ & ಇಂಗ್ಲೀಷ್ & ಚೈನೀಸ್ ಭಾಷೆಯ ಡೇಟಾಸೆಟ್
ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 150k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಅರೇಬಿಕ್ & ಥಾಯ್ & ವಿಯೆಟ್ನಾಮೀಸ್ & ಹಿಂದಿ & ಇಂಗ್ಲೀಷ್ & ಚೈನೀಸ್ ಭಾಷೆಯ ಡೇಟಾಸೆಟ್
ಅರೇಬಿಕ್ ಪಠ್ಯ ಡೇಟಾಸೆಟ್
ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 1k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಅರೇಬಿಕ್ ಪಠ್ಯ ಡೇಟಾಸೆಟ್ ಅರೇಬಿಕ್ ಭಾಷೆಯಲ್ಲಿ ಬರೆಯಲಾದ ಪಠ್ಯ ಮಾದರಿಗಳ ಸಂಗ್ರಹವನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ಸುದ್ದಿ ಲೇಖನಗಳು, ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಪೋಸ್ಟ್ಗಳು, ಸಾಹಿತ್ಯ ಮತ್ತು ಸಂಭಾಷಣೆಯಂತಹ ವಿವಿಧ ರೀತಿಯ ವಿಷಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ವಿಭಿನ್ನ ವಿಷಯಗಳು ಮತ್ತು ಬರವಣಿಗೆ ಶೈಲಿಗಳನ್ನು ವ್ಯಾಪಿಸುತ್ತದೆ. ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣೆ (NLP), ಪಠ್ಯ ವರ್ಗೀಕರಣ, ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಅರೇಬಿಕ್ ಭಾಷೆಯ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ಯಂತ್ರ ಅನುವಾದದಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಚೈನೀಸ್ & ಇಂಗ್ಲೀಷ್ & ಟಿಬೆಟಿಯನ್ ಮತ್ತು ಉಯ್ಘರ್ ಭಾಷಾ ಡೇಟಾಸೆಟ್
ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 38k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಚೈನೀಸ್ & ಇಂಗ್ಲೀಷ್ & ಟಿಬೆಟಿಯನ್ ಮತ್ತು ಉಯ್ಘರ್ ಭಾಷಾ ಡೇಟಾಸೆಟ್
ಚೈನೀಸ್ ಮತ್ತು ಇಂಗ್ಲಿಷ್ ಮೆನು ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 60k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಚೈನೀಸ್ ಮತ್ತು ಇಂಗ್ಲಿಷ್ ಮೆನು ಡೇಟಾಸೆಟ್ ಚೀನೀ ಮತ್ತು ಇಂಗ್ಲಿಷ್ ಎರಡನ್ನೂ ಒಳಗೊಂಡಿರುವ ರೆಸ್ಟೋರೆಂಟ್ ಮೆನುಗಳ ಚಿತ್ರಗಳು ಅಥವಾ ಪಠ್ಯ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ವಿವಿಧ ಫಾಂಟ್ಗಳು, ಲೇಔಟ್ಗಳು ಮತ್ತು ಮೆನು ರಚನೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ದ್ವಿಭಾಷಾ ಭಕ್ಷ್ಯಗಳ ಹೆಸರುಗಳು, ವಿವರಣೆಗಳು ಮತ್ತು ಬೆಲೆಗಳನ್ನು ಪ್ರಸ್ತುತಪಡಿಸುತ್ತದೆ. ಬಹುಭಾಷಾ ಸೆಟ್ಟಿಂಗ್ಗಳಲ್ಲಿ ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ (OCR), ಯಂತ್ರ ಅನುವಾದ ಮತ್ತು ಮೆನು ಡಿಜಿಟಲೀಕರಣದಂತಹ ಕಾರ್ಯಗಳಿಗೆ ಈ ಡೇಟಾಸೆಟ್ ಉಪಯುಕ್ತವಾಗಿದೆ.
ಚೈನೀಸ್ ಕೈಬರಹದ ಸಂಯೋಜನೆ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 3k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಚೀನೀ ಕೈಬರಹದ ಸಂಯೋಜನೆ ಡೇಟಾಸೆಟ್ ಸಂಯೋಜನೆಗಳು, ಪ್ರಬಂಧಗಳು ಮತ್ತು ಇತರ ದೀರ್ಘ-ರೂಪದ ಪಠ್ಯವನ್ನು ಒಳಗೊಂಡಂತೆ ಕೈಬರಹದ ಚೈನೀಸ್ ಪಠ್ಯದ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ವಿವಿಧ ಕೈಬರಹ ಶೈಲಿಗಳು ಮತ್ತು ಸಂಕೀರ್ಣತೆಯ ಹಂತಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಮತ್ತು ಕೈಬರಹ ಗುರುತಿಸುವಿಕೆ, ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆಯ ಮಾದರಿ ತರಬೇತಿಯಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಚೈನೀಸ್ ವೈಫೈ ಪ್ರಾಂಪ್ಟ್ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 1k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಚೈನೀಸ್ WIFI ಪ್ರಾಂಪ್ಟ್ ಡೇಟಾಸೆಟ್ WIFI ಪ್ರಾಂಪ್ಟ್ಗಳಲ್ಲಿ ಕಂಡುಬರುವ ಪಠ್ಯ ಮಾದರಿಗಳನ್ನು ಮತ್ತು ಚೈನೀಸ್ ಭಾಷೆಯಲ್ಲಿ ಬರೆಯಲಾದ ಲಾಗಿನ್ ಸ್ಕ್ರೀನ್ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ಸಾಮಾನ್ಯವಾಗಿ ವೈಫೈ ನೆಟ್ವರ್ಕ್ಗಳಿಗೆ ಸಂಪರ್ಕಿಸಲು ಅಥವಾ ನಿರ್ವಹಿಸಲು ಸಂಬಂಧಿಸಿದ ವಿವಿಧ ಪ್ರಾಂಪ್ಟ್ಗಳು, ಸೂಚನೆಗಳು ಮತ್ತು ದೋಷ ಸಂದೇಶಗಳನ್ನು ಒಳಗೊಂಡಿರುತ್ತದೆ. ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ, ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣೆ ಮತ್ತು ನೆಟ್ವರ್ಕ್ ಸಂಪರ್ಕಕ್ಕಾಗಿ ಬಳಕೆದಾರ ಇಂಟರ್ಫೇಸ್ಗಳನ್ನು ಸುಧಾರಿಸುವಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಚೈನೀಸ್ ಕೈಬರಹ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 12k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ಕೈಬರಹ ಡೇಟಾಸೆಟ್ ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ಎರಡರಲ್ಲೂ ಕೈಬರಹದ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ವಿವಿಧ ಬರವಣಿಗೆಯ ಶೈಲಿಗಳು ಮತ್ತು ಅಕ್ಷರ ಸಂಕೀರ್ಣತೆಗಳನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ. ಕೈಬರಹ ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳ ತರಬೇತಿ ಮತ್ತು ಮೌಲ್ಯಮಾಪನ, ಬಹುಭಾಷಾ ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಇತರ ಸಂಬಂಧಿತ ಸಂಶೋಧನೆಗಳನ್ನು ಬೆಂಬಲಿಸಲು ಇದನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ. ಡೇಟಾಸೆಟ್ ಎರಡೂ ಭಾಷೆಗಳಲ್ಲಿ ವೈವಿಧ್ಯಮಯ ಶ್ರೇಣಿಯ ಅಕ್ಷರಗಳು, ಅಂಕೆಗಳು, ಪದಗಳು ಮತ್ತು ವಾಕ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.
ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಚೈನೀಸ್ ಅಂಗಡಿ ಚಿಹ್ನೆ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 30k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಚೈನೀಸ್ ಶಾಪ್ಸೈನ್ ಡೇಟಾಸೆಟ್ ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ಪಠ್ಯವನ್ನು ಒಳಗೊಂಡಿರುವ ಅಂಗಡಿ ಚಿಹ್ನೆಗಳ ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ವಿವಿಧ ಫಾಂಟ್ಗಳು, ಶೈಲಿಗಳು ಮತ್ತು ಸ್ವರೂಪಗಳಲ್ಲಿ ಪ್ರದರ್ಶಿಸಲಾದ ಅಂಗಡಿಯ ಹೆಸರುಗಳು, ಜಾಹೀರಾತುಗಳು, ಪ್ರಚಾರಗಳು ಮತ್ತು ನಿರ್ದೇಶನಗಳಂತಹ ವಿವಿಧ ಸಂಕೇತ ಅಂಶಗಳನ್ನು ಸೆರೆಹಿಡಿಯುತ್ತದೆ. ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಪಠ್ಯ ಪತ್ತೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆ, ಬಹುಭಾಷಾ ದೃಶ್ಯ ತಿಳುವಳಿಕೆ ಮತ್ತು ದ್ವಿಭಾಷಾ ಸಂಕೇತಗಳನ್ನು ಅರ್ಥೈಸಲು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಮಾದರಿಗಳನ್ನು ಸುಧಾರಿಸುವಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ವಿಶೇಷ ಕೋನ ಪಠ್ಯ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 50k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ವಿಶೇಷ ಆಂಗಲ್ ಟೆಕ್ಸ್ಟ್ ಡೇಟಾಸೆಟ್ ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ಎರಡರಲ್ಲೂ ವಿವಿಧ ಕೋನಗಳು ಮತ್ತು ದೃಷ್ಟಿಕೋನಗಳಲ್ಲಿ ಪ್ರದರ್ಶಿಸಲಾದ ಪಠ್ಯದ ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ಪ್ರಮಾಣಿತ ಸಮತಲ ಸ್ವರೂಪಗಳಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸದ ಚಿಹ್ನೆಗಳು, ಜಾಹೀರಾತುಗಳು ಮತ್ತು ದಾಖಲೆಗಳಂತಹ ಮೂಲಗಳಿಂದ ಪಠ್ಯವನ್ನು ಒಳಗೊಂಡಿದೆ. ಪಠ್ಯ ಪತ್ತೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳ ತರಬೇತಿ ಮತ್ತು ಮೌಲ್ಯಮಾಪನಕ್ಕಾಗಿ ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ನಿರ್ದಿಷ್ಟವಾಗಿ ಸಾಂಪ್ರದಾಯಿಕವಲ್ಲದ ದೃಷ್ಟಿಕೋನಗಳು ಮತ್ತು ದೃಷ್ಟಿಕೋನಗಳಲ್ಲಿ ಪಠ್ಯವನ್ನು ನಿರ್ವಹಿಸುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ.
ಇಂಗ್ಲೀಷ್ ಮೆನು ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 20k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಇಂಗ್ಲಿಷ್ ಮೆನು ಡೇಟಾಸೆಟ್ ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ ಬರೆಯಲಾದ ರೆಸ್ಟೋರೆಂಟ್ ಮೆನುಗಳ ಚಿತ್ರಗಳು ಅಥವಾ ಪಠ್ಯ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ವಿವಿಧ ಫಾಂಟ್ಗಳು, ಲೇಔಟ್ಗಳು ಮತ್ತು ಫಾರ್ಮ್ಯಾಟಿಂಗ್ ಶೈಲಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಭಕ್ಷ್ಯದ ಹೆಸರುಗಳಿಂದ ವಿವರಣೆಗಳು ಮತ್ತು ಬೆಲೆಗಳವರೆಗೆ ವಿಷಯವಿದೆ. ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಆಪ್ಟಿಕಲ್ ಕ್ಯಾರೆಕ್ಟರ್ ರೆಕಗ್ನಿಷನ್ (OCR), ಪಠ್ಯ ಹೊರತೆಗೆಯುವಿಕೆ ಮತ್ತು ಆಹಾರ-ಸಂಬಂಧಿತ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ಮೆನು ಡಿಜಿಟೈಸೇಶನ್ನಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಹೆಚ್ಚಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಇಂಗ್ಲೀಷ್ ದೃಶ್ಯಗಳ ಪಠ್ಯ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 33k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಇಂಗ್ಲಿಷ್ ದೃಶ್ಯಗಳ ಪಠ್ಯ ಡೇಟಾಸೆಟ್ ಎಂಬೆಡೆಡ್ ಇಂಗ್ಲಿಷ್ ಪಠ್ಯದೊಂದಿಗೆ ನೈಸರ್ಗಿಕ ದೃಶ್ಯಗಳನ್ನು ಹೊಂದಿರುವ ಚಿತ್ರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಪಠ್ಯವು ಚಿಹ್ನೆಗಳು, ಬಿಲ್ಬೋರ್ಡ್ಗಳು ಮತ್ತು ಪೋಸ್ಟರ್ಗಳಂತಹ ವಿವಿಧ ರೂಪಗಳಲ್ಲಿ ಕಾಣಿಸಿಕೊಳ್ಳುತ್ತದೆ, ಆಗಾಗ್ಗೆ ವೈವಿಧ್ಯಮಯ ಫಾಂಟ್ಗಳು, ಗಾತ್ರಗಳು ಮತ್ತು ದೃಷ್ಟಿಕೋನಗಳಲ್ಲಿ. ಪಠ್ಯ ಪತ್ತೆ, ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ದೃಶ್ಯ ತಿಳುವಳಿಕೆ ಕಾರ್ಯಗಳಲ್ಲಿ ಮಾದರಿಗಳ ತರಬೇತಿ ಮತ್ತು ಪರೀಕ್ಷೆಗಾಗಿ ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಕೈಬರಹದ ಪಠ್ಯ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಡಾಕ್ಯುಮೆಂಟ್ AI
ಸ್ವರೂಪ: HEIC (ಚಿತ್ರಗಳು) & .mov (ವೀಡಿಯೋಗಳು)
ಎಣಿಕೆ: 94053
ಟಿಪ್ಪಣಿ: ಇಲ್ಲ
ವಿವರಣೆ: ಜಪಾನೀಸ್, ಕೊರಿಯನ್ ಮತ್ತು ರಷ್ಯನ್ ಭಾಷೆಗಳಿಗೆ ಕೈಬರಹದ ಪಠ್ಯದೊಂದಿಗೆ ಲೈವ್ ಫೋಟೋಗಳು
ರೆಕಾರ್ಡಿಂಗ್ ಸಾಧನ: ಐಫೋನ್ ಮತ್ತು ಐಪ್ಯಾಡ್ ಕ್ಯಾಮೆರಾ
ರೆಕಾರ್ಡಿಂಗ್ ಸ್ಥಿತಿ: - ಆಕ್ರಮಣಕಾರಿ ಲೈಟಿಂಗ್/ಗ್ಲೇರ್ - ಕ್ಯಾಮೆರಾ ಫ್ಲ್ಯಾಶ್ ಆನ್ - ಬಣ್ಣದ ಬೆಳಕು - ಕಡಿಮೆ ಬೆಳಕು, ಕ್ಯಾಮೆರಾ ಫ್ಲ್ಯಾಶ್ ಇಲ್ಲ - ಸಾಮಾನ್ಯ
ಜಪಾನೀಸ್ ಮತ್ತು ಕೊರಿಯನ್ ಭಾಷೆಯ ಡೇಟಾಸೆಟ್

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಒಸಿಆರ್
ಸ್ವರೂಪ: ಚಿತ್ರ
ಎಣಿಕೆ: 40k
ಟಿಪ್ಪಣಿ: ಹೌದು
ವಿವರಣೆ: ಜಪಾನೀಸ್ ಮತ್ತು ಕೊರಿಯನ್ ಭಾಷೆಯ ಡೇಟಾಸೆಟ್ ಜಪಾನೀಸ್ ಮತ್ತು ಕೊರಿಯನ್ ಎರಡರಲ್ಲೂ ಪಠ್ಯ ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಇದು ವಿವಿಧ ಸಂದರ್ಭಗಳು ಮತ್ತು ಶೈಲಿಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ವಾಕ್ಯಗಳು, ನುಡಿಗಟ್ಟುಗಳು ಮತ್ತು ಪದಗಳಂತಹ ವಿಷಯದ ವ್ಯಾಪ್ತಿಯನ್ನು ಹೊಂದಿದೆ. ಈ ಡೇಟಾಸೆಟ್ ಅನ್ನು ಬಹುಭಾಷಾ ಅಪ್ಲಿಕೇಶನ್ಗಳಲ್ಲಿ ನೈಸರ್ಗಿಕ ಭಾಷಾ ಪ್ರಕ್ರಿಯೆ (NLP), ಯಂತ್ರ ಅನುವಾದ ಮತ್ತು ಪಠ್ಯ ವಿಶ್ಲೇಷಣೆಯಂತಹ ಕಾರ್ಯಗಳಿಗಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ.
ಮುದ್ರಿತ ನಿಯಮಿತ/ಕರ್ಸಿವ್ ಪಠ್ಯ ಡೇಟಾಸೆಟ್ (ಡಾಕ್ಯುಮೆಂಟ್ AI)

ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಡಾಕ್ಯುಮೆಂಟ್ AI
ಸ್ವರೂಪ: HEIC (ಚಿತ್ರಗಳು) & .mov (ವೀಡಿಯೋಗಳು)
ಎಣಿಕೆ: 23930
ಟಿಪ್ಪಣಿ: ಇಲ್ಲ
ವಿವರಣೆ: ಜಪಾನೀಸ್, ಕೊರಿಯನ್ ಮತ್ತು ರಷ್ಯನ್ ಭಾಷೆಗಳಿಗೆ ಕೈಬರಹದ ಪಠ್ಯದೊಂದಿಗೆ ಲೈವ್ ಫೋಟೋಗಳು
ರೆಕಾರ್ಡಿಂಗ್ ಸಾಧನ: ಐಫೋನ್ ಮತ್ತು ಐಪ್ಯಾಡ್ ಕ್ಯಾಮೆರಾ
ರೆಕಾರ್ಡಿಂಗ್ ಸ್ಥಿತಿ: - ಆಕ್ರಮಣಕಾರಿ ಲೈಟಿಂಗ್/ಗ್ಲೇರ್ - ಕ್ಯಾಮೆರಾ ಫ್ಲ್ಯಾಶ್ ಆನ್ - ಬಣ್ಣದ ಬೆಳಕು - ಕಡಿಮೆ ಬೆಳಕು, ಕ್ಯಾಮೆರಾ ಫ್ಲ್ಯಾಶ್ ಇಲ್ಲ - ಸಾಮಾನ್ಯ
ಪಠ್ಯ + ಆಡಿಯೋ-ವಿಶುವಲ್ (ಬಹುಭಾಷಾ/OCR/NLP) – ಪುಸ್ತಕಗಳು, ನಿಯತಕಾಲಿಕೆಗಳು, ಆಡಿಯೋ+ಪಠ್ಯ
ಪ್ರಕರಣವನ್ನು ಬಳಸಿ: ಪಠ್ಯ + ಆಡಿಯೋ-ವಿಶುವಲ್ (ಬಹುಭಾಷಾ / OCR / NLP)
ಸ್ವರೂಪ: ವೀಡಿಯೊಗಳು
ಎಣಿಕೆ: 100K+ ಉಪನ್ಯಾಸ ವೀಡಿಯೊಗಳು + PPT ದೀರ್ಘ ಸ್ವರೂಪದ ವೀಡಿಯೊಗಳು
ಟಿಪ್ಪಣಿ: ಇಲ್ಲ
ವಿವರಣೆ: ಚೈನೀಸ್ ಪುಸ್ತಕಗಳು, ಇಂಗ್ಲಿಷ್ ಪುಸ್ತಕಗಳು, ನಿಯತಕಾಲಿಕೆಗಳು, ಸಾರ್ವಜನಿಕ ನೀತಿ, ಕಾದಂಬರಿಗಳು, ಮಕ್ಕಳು, ಕ್ಯಾಂಟೋನೀಸ್ ಆಡಿಯೋ+ಪಠ್ಯ, ಉಪನ್ಯಾಸ ವೀಡಿಯೊ+ಪಿಪಿಟಿ, ದೀರ್ಘ-ಸ್ವರೂಪದ ವೀಡಿಯೊ ಅರ್ಧ ಬಿಲಿಯನ್ ಪುಸ್ತಕಗಳು, ಪ್ರಶ್ನೆ ಉತ್ತರ ಜೋಡಿಗಳು, ಲೇಖನಗಳು
