ಕೇಸ್ ಸ್ಟಡಿ: ಸಂವಾದಾತ್ಮಕ AI

3 ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ASR ಅನ್ನು ನಿರ್ಮಿಸಲು 8k ಗಂಟೆಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸಮಯದ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲಾಗಿದೆ, ವಿಂಗಡಿಸಲಾಗಿದೆ ಮತ್ತು ಲಿಪ್ಯಂತರ ಮಾಡಲಾಗಿದೆ.
ಸಂವಾದಾತ್ಮಕ AI
ಭಾಷಿಣಿ ಯೋಜನೆಯ ಮೂಲಕ ತನ್ನ ಸ್ವಂತ ಸ್ಥಳೀಯ ಭಾಷೆಯಲ್ಲಿ ಇಂಟರ್ನೆಟ್ ಮತ್ತು ಡಿಜಿಟಲ್ ಸೇವೆಗಳಿಗೆ ಸುಲಭ ಪ್ರವೇಶದೊಂದಿಗೆ ತನ್ನ ನಾಗರಿಕರನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲು ಸರ್ಕಾರ ಉದ್ದೇಶಿಸಿದೆ.

ಭಾಷಿನಿ, ಭಾರತದ AI-ಚಾಲಿತ ಭಾಷಾ ಅನುವಾದ ವೇದಿಕೆ, ಡಿಜಿಟಲ್ ಇಂಡಿಯಾ ಉಪಕ್ರಮದ ಪ್ರಮುಖ ಭಾಗವಾಗಿದೆ.

ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ (AI) ಮತ್ತು ನ್ಯಾಚುರಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ರೊಸೆಸಿಂಗ್ (NLP) ಉಪಕರಣಗಳನ್ನು MSMEಗಳು, ಸ್ಟಾರ್ಟ್‌ಅಪ್‌ಗಳು ಮತ್ತು ಸ್ವತಂತ್ರ ಆವಿಷ್ಕಾರಕರಿಗೆ ಒದಗಿಸಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ, ಭಾಷಿನಿ ವೇದಿಕೆಯು ಸಾರ್ವಜನಿಕ ಸಂಪನ್ಮೂಲವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಭಾರತೀಯ ನಾಗರಿಕರು ತಮ್ಮ ಸ್ಥಳೀಯ ಭಾಷೆಗಳಲ್ಲಿ ದೇಶದ ಡಿಜಿಟಲ್ ಉಪಕ್ರಮಗಳೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಲು ಅನುವು ಮಾಡಿಕೊಡುವ ಮೂಲಕ ಡಿಜಿಟಲ್ ಸೇರ್ಪಡೆಯನ್ನು ಉತ್ತೇಜಿಸುವುದು ಇದರ ಗುರಿಯಾಗಿದೆ.

ಹೆಚ್ಚುವರಿಯಾಗಿ, ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಇಂಟರ್ನೆಟ್ ವಿಷಯದ ಲಭ್ಯತೆಯನ್ನು ಗಣನೀಯವಾಗಿ ವಿಸ್ತರಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಇದು ವಿಶೇಷವಾಗಿ ಸಾರ್ವಜನಿಕ ಹಿತಾಸಕ್ತಿಯ ಕ್ಷೇತ್ರಗಳಾದ ಆಡಳಿತ ಮತ್ತು ನೀತಿ, ವಿಜ್ಞಾನ ಮತ್ತು ತಂತ್ರಜ್ಞಾನ ಇತ್ಯಾದಿಗಳನ್ನು ಗುರಿಯಾಗಿರಿಸಿಕೊಂಡಿದೆ. ಪರಿಣಾಮವಾಗಿ, ಇದು ನಾಗರಿಕರನ್ನು ಅವರ ಸ್ವಂತ ಭಾಷೆಯಲ್ಲಿ ಇಂಟರ್ನೆಟ್ ಅನ್ನು ಬಳಸಲು ಪ್ರೇರೇಪಿಸುತ್ತದೆ, ಅವರ ಸಕ್ರಿಯ ಭಾಗವಹಿಸುವಿಕೆಯನ್ನು ಉತ್ತೇಜಿಸುತ್ತದೆ.

ರಿಯಲ್ ವರ್ಲ್ಡ್ ಪರಿಹಾರ

ಡೇಟಾದೊಂದಿಗೆ ಸ್ಥಳೀಕರಣದ ಶಕ್ತಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವುದು

ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಡಿಜಿಟಲ್ ಸೇವೆಗಳನ್ನು ಒದಗಿಸಲು ಬಹುಭಾಷಾ ಡೇಟಾಸೆಟ್‌ಗಳು ಮತ್ತು AI-ಆಧಾರಿತ ಭಾಷಾ ತಂತ್ರಜ್ಞಾನ ಪರಿಹಾರಗಳನ್ನು ರಚಿಸುವುದರ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುವ ವೇದಿಕೆಯ ಅಗತ್ಯವಿದೆ. ಈ ಉಪಕ್ರಮವನ್ನು ಪ್ರಾರಂಭಿಸಲು, ಇಂಡಿಯನ್ ಇನ್‌ಸ್ಟಿಟ್ಯೂಟ್ ಆಫ್ ಟೆಕ್ನಾಲಜಿ, ಮದ್ರಾಸ್ (ಐಐಟಿ ಮದ್ರಾಸ್) ಬಹು-ಭಾಷಾ ಭಾಷಣ ಮಾದರಿಗಳನ್ನು ನಿರ್ಮಿಸಲು ಭಾರತೀಯ ಭಾಷಾ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಸಂಗ್ರಹಿಸಲು, ವಿಭಾಗಿಸಲು ಮತ್ತು ಲಿಪ್ಯಂತರ ಮಾಡಲು ಶೈಪ್‌ನೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆ ಹೊಂದಿದೆ.

ಸವಾಲುಗಳು

ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಅವರ ಸ್ಪೀಚ್ ಟೆಕ್ನಾಲಜಿ ಸ್ಪೀಚ್ ರೋಡ್‌ಮ್ಯಾಪ್‌ನೊಂದಿಗೆ ಕ್ಲೈಂಟ್‌ಗೆ ಸಹಾಯ ಮಾಡಲು, ತಂಡವು AI ಮಾದರಿಯನ್ನು ನಿರ್ಮಿಸಲು ದೊಡ್ಡ ಪ್ರಮಾಣದ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳಲು, ವಿಭಾಗಿಸಲು ಮತ್ತು ಲಿಪ್ಯಂತರ ಮಾಡಲು ಅಗತ್ಯವಿದೆ. ಕ್ಲೈಂಟ್ನ ನಿರ್ಣಾಯಕ ಅವಶ್ಯಕತೆಗಳು:

ಮಾಹಿತಿ ಸಂಗ್ರಹ

  • ಪ್ರತಿ ಭಾಷೆಗೆ 3000 ಉಪಭಾಷೆಗಳೊಂದಿಗೆ 8 ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ 4 ಗಂಟೆಗಳ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳಿ.
  • ಪ್ರತಿ ಭಾಷೆಗೆ, ಪೂರೈಕೆದಾರರು ಎಕ್ಸ್‌ಟೆಂಪೋರ್ ಸ್ಪೀಚ್ ಮತ್ತು ಸಂಗ್ರಹಿಸುತ್ತಾರೆ
    18-60 ವರ್ಷಗಳ ವಯೋಮಾನದವರಿಂದ ಸಂವಾದಾತ್ಮಕ ಭಾಷಣ
  • ವಯಸ್ಸು, ಲಿಂಗ, ಶಿಕ್ಷಣ ಮತ್ತು ಉಪಭಾಷೆಗಳ ಪ್ರಕಾರ ಮಾತನಾಡುವವರ ವೈವಿಧ್ಯಮಯ ಮಿಶ್ರಣವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ
  • ವಿಶೇಷಣಗಳ ಪ್ರಕಾರ ರೆಕಾರ್ಡಿಂಗ್ ಪರಿಸರದ ವೈವಿಧ್ಯಮಯ ಮಿಶ್ರಣವನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
  • ಪ್ರತಿ ಆಡಿಯೊ ರೆಕಾರ್ಡಿಂಗ್ ಕನಿಷ್ಠ 16kHz ಆದರೆ ಆದ್ಯತೆ 44kHz ಆಗಿರಬೇಕು

ಡೇಟಾ ವಿಭಜನೆ

  • 15 ಸೆಕೆಂಡ್‌ಗಳ ಸ್ಪೀಚ್ ವಿಭಾಗಗಳನ್ನು ರಚಿಸಿ ಮತ್ತು ಪ್ರತಿ ನೀಡಲಾದ ಸ್ಪೀಕರ್‌ಗೆ ಆಡಿಯೊವನ್ನು ಮಿಲಿಸೆಕೆಂಡ್‌ಗಳಿಗೆ ಟೈಮ್‌ಸ್ಟ್ಯಾಂಪ್ ಮಾಡಿ, ಧ್ವನಿಯ ಪ್ರಕಾರ (ಭಾಷಣ, ಬಬಲ್, ಸಂಗೀತ, ಶಬ್ದ), ಸಂಭಾಷಣೆಯಲ್ಲಿನ ತಿರುವುಗಳು, ಉಕ್ತಿಗಳು ಮತ್ತು ನುಡಿಗಟ್ಟುಗಳು
  • ಪ್ರಾರಂಭ ಮತ್ತು ಕೊನೆಯಲ್ಲಿ 200-400 ಮಿಲಿಸೆಕೆಂಡ್ ಪ್ಯಾಡಿಂಗ್‌ನೊಂದಿಗೆ ಅದರ ಉದ್ದೇಶಿತ ಧ್ವನಿ ಸಂಕೇತಕ್ಕಾಗಿ ಪ್ರತಿ ವಿಭಾಗವನ್ನು ರಚಿಸಿ.
  • ಎಲ್ಲಾ ವಿಭಾಗಗಳಿಗೆ, ಈ ಕೆಳಗಿನ ಆಬ್ಜೆಕ್ಟ್‌ಗಳನ್ನು ಭರ್ತಿ ಮಾಡಬೇಕು ಅಂದರೆ, ಪ್ರಾರಂಭ ಸಮಯ, ಮುಕ್ತಾಯದ ಸಮಯ, ವಿಭಾಗ ID, ಲೌಡ್‌ನೆಸ್ ಮಟ್ಟ, ಧ್ವನಿ ಪ್ರಕಾರ, ಭಾಷಾ ಕೋಡ್, ಸ್ಪೀಕರ್ ಐಡಿ, ಇತ್ಯಾದಿ.

ಡೇಟಾ ಪ್ರತಿಲೇಖನ

  • ಅಕ್ಷರಗಳು ಮತ್ತು ವಿಶೇಷ ಚಿಹ್ನೆಗಳು, ಕಾಗುಣಿತ ಮತ್ತು ವ್ಯಾಕರಣ, ಕ್ಯಾಪಿಟಲೈಸೇಶನ್, ಸಂಕ್ಷೇಪಣಗಳು, ಸಂಕೋಚನಗಳು, ವೈಯಕ್ತಿಕ ಮಾತನಾಡುವ ಅಕ್ಷರಗಳು, ಸಂಖ್ಯೆಗಳು, ವಿರಾಮಚಿಹ್ನೆಗಳು, ಪ್ರಥಮಾಕ್ಷರಗಳು, ಅಸ್ಪಷ್ಟ, ಮಾತು, ಅರ್ಥವಾಗದ ಮಾತು, ಗುರಿಯಿಲ್ಲದ ಭಾಷೆಗಳು, ಇತ್ಯಾದಿಗಳ ಬಗ್ಗೆ ವಿವರವಾದ ಪ್ರತಿಲೇಖನ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿ.

ಗುಣಮಟ್ಟ ಪರಿಶೀಲನೆ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆ

  • ಗುಣಮಟ್ಟದ ಮೌಲ್ಯಮಾಪನ ಮತ್ತು ಮೌಲ್ಯೀಕರಣಕ್ಕೆ ಒಳಗಾಗಲು ಎಲ್ಲಾ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳು, ಮೌಲ್ಯೀಕರಿಸಿದ ಭಾಷಣವನ್ನು ಮಾತ್ರ ವಿತರಿಸಲಾಗುವುದು

ಪರಿಹಾರ

ಸಂವಾದಾತ್ಮಕ AI ಕುರಿತು ನಮ್ಮ ಆಳವಾದ ತಿಳುವಳಿಕೆಯೊಂದಿಗೆ, 8 ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಆಡಿಯೊ ಡೇಟಾಸೆಟ್‌ನ ದೊಡ್ಡ ಕಾರ್ಪಸ್ ಅನ್ನು ನಿರ್ಮಿಸಲು ಪರಿಣಿತ ಸಂಗ್ರಾಹಕರು, ಭಾಷಾಶಾಸ್ತ್ರಜ್ಞರು ಮತ್ತು ಟಿಪ್ಪಣಿಕಾರರ ತಂಡದೊಂದಿಗೆ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲು, ವಿಭಾಗಿಸಲು ಮತ್ತು ಲಿಪ್ಯಂತರ ಮಾಡಲು ನಾವು ಕ್ಲೈಂಟ್‌ಗೆ ಸಹಾಯ ಮಾಡಿದ್ದೇವೆ.

ಶೈಪ್‌ನ ಕೆಲಸದ ವ್ಯಾಪ್ತಿಯು ಒಳಗೊಂಡಿತ್ತು ಆದರೆ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಆಡಿಯೊ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಪಡೆದುಕೊಳ್ಳುವುದು, ಆಡಿಯೊ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಬಹುವಿಧದಲ್ಲಿ ವಿಭಾಗಿಸುವುದು, ಡೇಟಾವನ್ನು ನಕಲು ಮಾಡುವುದು ಮತ್ತು ಮೆಟಾಡೇಟಾವನ್ನು ಹೊಂದಿರುವ ಅನುಗುಣವಾದ JSON ಫೈಲ್‌ಗಳನ್ನು ತಲುಪಿಸುವುದು [ಸ್ಪೀಕರ್‌ಐಡಿ, ವಯಸ್ಸು, ಲಿಂಗ, ಭಾಷೆ, ಉಪಭಾಷೆ,
ಮಾತೃಭಾಷೆ, ಅರ್ಹತೆ, ಉದ್ಯೋಗ, ಡೊಮೈನ್, ಫೈಲ್ ಫಾರ್ಮ್ಯಾಟ್, ಆವರ್ತನ, ಚಾನಲ್, ಆಡಿಯೊ ಪ್ರಕಾರ, ಸ್ಪೀಕರ್ಗಳ ಸಂಖ್ಯೆ, ವಿದೇಶಿ ಭಾಷೆಗಳ ಸಂಖ್ಯೆ, ಸೆಟಪ್ ಬಳಸಿದ, ಕಿರಿದಾದ ಬ್ಯಾಂಡ್ ಅಥವಾ ವೈಡ್ಬ್ಯಾಂಡ್ ಆಡಿಯೋ, ಇತ್ಯಾದಿ].

ಸಂಕೀರ್ಣ ಯೋಜನೆಗಳಿಗೆ ಭಾಷಣ ತಂತ್ರಜ್ಞಾನವನ್ನು ತರಬೇತುಗೊಳಿಸಲು ಅಗತ್ಯವಿರುವ ಗುಣಮಟ್ಟವನ್ನು ಅಪೇಕ್ಷಿತ ಮಟ್ಟದಲ್ಲಿ ನಿರ್ವಹಿಸುವಾಗ ಶೈಪ್ 3000 ಗಂಟೆಗಳ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದರು. ಪ್ರತಿಯೊಬ್ಬ ಭಾಗವಹಿಸುವವರಿಂದ ಸ್ಪಷ್ಟ ಸಮ್ಮತಿಯ ನಮೂನೆಯನ್ನು ತೆಗೆದುಕೊಳ್ಳಲಾಗಿದೆ.

1. ಮಾಹಿತಿ ಸಂಗ್ರಹ

2. ಡೇಟಾ ವಿಭಜನೆ

  • ಸಂಗ್ರಹಿಸಿದ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಪ್ರತಿ 15 ಸೆಕೆಂಡ್‌ಗಳ ಮಾತಿನ ಭಾಗಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ ಮತ್ತು ಪ್ರತಿ ನೀಡಲಾದ ಸ್ಪೀಕರ್‌ಗೆ ಮಿಲಿಸೆಕೆಂಡ್‌ಗಳಿಗೆ ಟೈಮ್‌ಸ್ಟ್ಯಾಂಪ್ ಮಾಡಲಾಗಿದೆ, ಧ್ವನಿಯ ಪ್ರಕಾರ, ತಿರುವುಗಳು, ಉಚ್ಚಾರಣೆಗಳು ಮತ್ತು ಸಂಭಾಷಣೆಯಲ್ಲಿ ನುಡಿಗಟ್ಟುಗಳು
  • ಧ್ವನಿ ಸಂಕೇತದ ಪ್ರಾರಂಭ ಮತ್ತು ಅಂತ್ಯದಲ್ಲಿ 200-400 ಮಿಲಿಸೆಕೆಂಡ್‌ಗಳ ಪ್ಯಾಡಿಂಗ್‌ನೊಂದಿಗೆ ಅದರ ಉದ್ದೇಶಿತ ಧ್ವನಿ ಸಂಕೇತಕ್ಕಾಗಿ ಪ್ರತಿ ವಿಭಾಗವನ್ನು ರಚಿಸಲಾಗಿದೆ.
  • ಎಲ್ಲಾ ವಿಭಾಗಗಳಿಗೆ, ಈ ಕೆಳಗಿನ ಆಬ್ಜೆಕ್ಟ್‌ಗಳು ಇರುತ್ತವೆ ಮತ್ತು ತುಂಬಿವೆ ಅಂದರೆ, ಪ್ರಾರಂಭ ಸಮಯ, ಅಂತ್ಯದ ಸಮಯ, ವಿಭಾಗ ID, ಲೌಡ್‌ನೆಸ್ ಮಟ್ಟ (ಜೋರಾಗಿ, ಸಾಮಾನ್ಯ, ಶಾಂತ), ಪ್ರಾಥಮಿಕ ಧ್ವನಿ ಪ್ರಕಾರ (ಮಾತು, ಬಬಲ್, ಸಂಗೀತ, ಶಬ್ದ, ಅತಿಕ್ರಮಣ), ಭಾಷಾ ಕೋಡ್ ಸ್ಪೀಕರ್ ID, ಪ್ರತಿಲೇಖನ ಇತ್ಯಾದಿ.

3. ಗುಣಮಟ್ಟ ಪರಿಶೀಲನೆ ಮತ್ತು ಪ್ರತಿಕ್ರಿಯೆ

  • ಎಲ್ಲಾ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಗುಣಮಟ್ಟಕ್ಕಾಗಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡಲಾಗಿದೆ ಮತ್ತು WER 90% ಮತ್ತು TER 90% ನೊಂದಿಗೆ ಮೌಲ್ಯೀಕರಿಸಿದ ಧ್ವನಿ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಮಾತ್ರ ವಿತರಿಸಲಾಗಿದೆ
  • ಗುಣಮಟ್ಟದ ಪರಿಶೀಲನಾಪಟ್ಟಿ ಅನುಸರಿಸಲಾಗಿದೆ:
    » ಸೆಗ್ಮೆಂಟ್ ಉದ್ದದ ಗರಿಷ್ಠ 15 ಸೆಕೆಂಡುಗಳು
    » ನಿರ್ದಿಷ್ಟ ಡೊಮೇನ್‌ಗಳಿಂದ ಪ್ರತಿಲೇಖನ, ಅವುಗಳೆಂದರೆ: ಹವಾಮಾನ, ವಿವಿಧ ರೀತಿಯ ಸುದ್ದಿ, ಆರೋಗ್ಯ, ಕೃಷಿ, ಶಿಕ್ಷಣ, ಉದ್ಯೋಗಗಳು ಅಥವಾ ಹಣಕಾಸು
    » ಕಡಿಮೆ ಹಿನ್ನೆಲೆ ಶಬ್ದ
    »ಆಡಿಯೋ ಕ್ಲಿಪ್ ಆಫ್ ಇಲ್ಲ - ಅಸ್ಪಷ್ಟತೆ ಇಲ್ಲ
    » ಪ್ರತಿಲೇಖನಕ್ಕಾಗಿ ಸರಿಯಾದ ಆಡಿಯೋ ವಿಭಾಗ

4. ಡೇಟಾ ಪ್ರತಿಲೇಖನ
ಹಿಂಜರಿಕೆಗಳು, ಫಿಲ್ಲರ್ ಪದಗಳು, ತಪ್ಪು ಪ್ರಾರಂಭಗಳು ಮತ್ತು ಇತರ ಮೌಖಿಕ ಸಂಕೋಚನಗಳು ಸೇರಿದಂತೆ ಎಲ್ಲಾ ಮಾತನಾಡುವ ಪದಗಳನ್ನು ಪ್ರತಿಲೇಖನದಲ್ಲಿ ನಿಖರವಾಗಿ ಸೆರೆಹಿಡಿಯಲಾಗಿದೆ. ನಾವು ದೊಡ್ಡಕ್ಷರ ಮತ್ತು ಸಣ್ಣ ಅಕ್ಷರಗಳು, ಕಾಗುಣಿತ, ದೊಡ್ಡಕ್ಷರ, ಸಂಕ್ಷೇಪಣಗಳು, ಸಂಕೋಚನಗಳು, ಸಂಖ್ಯೆಗಳ ಸುತ್ತಲಿನ ವಿವರಗಳ ಪ್ರತಿಲೇಖನ ಮಾರ್ಗಸೂಚಿಗಳನ್ನು ಅನುಸರಿಸಿದ್ದೇವೆ,
ವಿರಾಮಚಿಹ್ನೆ, ಸಂಕ್ಷೇಪಣಗಳು, ಅಸ್ಪಷ್ಟ ಮಾತು, ಭಾಷಣ-ಅಲ್ಲದ ಶಬ್ದಗಳು ಇತ್ಯಾದಿ. ಮೇಲಾಗಿ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಪ್ರತಿಲೇಖನಕ್ಕಾಗಿ ಅನುಸರಿಸಿದ ಕೆಲಸದ ಹರಿವು ಈ ಕೆಳಗಿನಂತಿದೆ:

ಫಲಿತಾಂಶ

ಪರಿಣಿತ ಭಾಷಾಶಾಸ್ತ್ರಜ್ಞರಿಂದ ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಆಡಿಯೊ ಡೇಟಾವು ಭಾರತೀಯ ತಂತ್ರಜ್ಞಾನ ಸಂಸ್ಥೆ - ಮದ್ರಾಸ್, ನಿಗದಿತ ಸಮಯದಲ್ಲಿ ವಿವಿಧ ಉಪಭಾಷೆಗಳೊಂದಿಗೆ 8 ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಬಹುಭಾಷಾ ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಮಾದರಿಗಳನ್ನು ನಿಖರವಾಗಿ ತರಬೇತಿ ನೀಡಲು ಮತ್ತು ನಿರ್ಮಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ. ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳನ್ನು ಇದಕ್ಕಾಗಿ ಬಳಸಬಹುದು:

  • ನಾಗರಿಕರನ್ನು ಅವರ ಸ್ವಂತ ಮಾತೃಭಾಷೆಯಲ್ಲಿ ಉಪಕ್ರಮಗಳಿಗೆ ಸಂಪರ್ಕಿಸುವ ಮೂಲಕ ಡಿಜಿಟಲ್ ಸೇರ್ಪಡೆಗಾಗಿ ಭಾಷಾ ತಡೆಗೋಡೆ ನಿವಾರಿಸಿ.
  • ಡಿಜಿಟಲ್ ಆಡಳಿತವನ್ನು ಉತ್ತೇಜಿಸುತ್ತದೆ
  • ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಸೇವೆಗಳು ಮತ್ತು ಉತ್ಪನ್ನಗಳಿಗೆ ಪರಿಸರ ವ್ಯವಸ್ಥೆಯನ್ನು ರೂಪಿಸಲು ವೇಗವರ್ಧಕ
  • ಸಾರ್ವಜನಿಕ ಹಿತಾಸಕ್ತಿಯ ಡೊಮೇನ್‌ಗಳಲ್ಲಿ ಹೆಚ್ಚು ಸ್ಥಳೀಕರಿಸಿದ ಡಿಜಿಟಲ್ ವಿಷಯ, ನಿರ್ದಿಷ್ಟವಾಗಿ, ಆಡಳಿತ ಮತ್ತು ನೀತಿ
ಗೋಲ್ಡನ್-5-ಸ್ಟಾರ್

ಸಂಭಾಷಣಾ ಎಐ ಜಾಗದಲ್ಲಿ ಶೈಪ್ ಅವರ ಪರಿಣತಿಯಿಂದ ನಾವು ಪ್ರಭಾವಿತರಾಗಿದ್ದೇವೆ. ಕಟ್ಟುನಿಟ್ಟಾದ ಟೈಮ್‌ಲೈನ್‌ಗಳು ಮತ್ತು ಮಾರ್ಗಸೂಚಿಗಳಲ್ಲಿ 8 ಭಾಷೆಗಳಲ್ಲಿ ಪರಿಣಿತ ಭಾಷಾಶಾಸ್ತ್ರಜ್ಞರಿಂದ ಅಗತ್ಯವಿರುವ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಸೋರ್ಸಿಂಗ್, ವಿಂಗಡಣೆ, ಲಿಪ್ಯಂತರ ಮತ್ತು ವಿತರಣೆಯಿಂದ ಅವರ ಒಟ್ಟಾರೆ ಯೋಜನೆಯ ಕಾರ್ಯಗತಗೊಳಿಸುವ ಸಾಮರ್ಥ್ಯ; ಇನ್ನೂ ಸ್ವೀಕಾರಾರ್ಹ ಗುಣಮಟ್ಟದ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳುವಾಗ.

ನಿಮ್ಮ ಸಂವಾದಾತ್ಮಕ AI ಅಪ್ಲಿಕೇಶನ್ ಅಭಿವೃದ್ಧಿಯನ್ನು 100% ರಷ್ಟು ವೇಗಗೊಳಿಸಿ

ವೈಶಿಷ್ಟ್ಯಪೂರ್ಣ ಗ್ರಾಹಕರು

ವಿಶ್ವದ ಪ್ರಮುಖ ಎಐ ಉತ್ಪನ್ನಗಳನ್ನು ನಿರ್ಮಿಸಲು ತಂಡಗಳಿಗೆ ಅಧಿಕಾರ ನೀಡುವುದು.