ಸ್ಪೀಚ್ ಎಮೋಷನ್ & ಸೆಂಟಿಮೆಂಟ್ ಅನಾಲಿಸಿಸ್

AI-ಚಾಲಿತ ಒಳನೋಟಗಳೊಂದಿಗೆ ಸ್ಮಾರ್ಟರ್ ಕಾಲ್ ಸೆಂಟರ್‌ಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲಾಗುತ್ತಿದೆ

ಸುಧಾರಿತ ಗ್ರಾಹಕ ಸೇವೆಗಾಗಿ ನೈಜ-ಸಮಯದ ಭಾವನೆ ಮತ್ತು ಭಾವನೆ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಆಡಿಯೊ ಡೇಟಾ ಸಂಗ್ರಹಣೆ ಮತ್ತು ಟಿಪ್ಪಣಿಯಲ್ಲಿ ಶೈಪ್‌ನ ಪರಿಣತಿಯನ್ನು ನಿಯಂತ್ರಿಸುವುದು.

ಮಾತಿನ ಭಾವನೆ ಮತ್ತು ಭಾವನೆಗಳ ವಿಶ್ಲೇಷಣೆ

ಸ್ವಯಂಚಾಲಿತ ಭಾಷಣ ಭಾವನೆ &
ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ

ಕಾಲ್ ಸೆಂಟರ್‌ಗಳಿಗಾಗಿ ಸ್ವಯಂಚಾಲಿತ ಭಾಷಣ ಭಾವನೆ ಮತ್ತು ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ ಮಾದರಿಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಗ್ರಾಹಕರು ಶೈಪ್‌ನೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆ ಹೊಂದಿದ್ದಾರೆ. ಈ ಯೋಜನೆಯು US, UK, ಆಸ್ಟ್ರೇಲಿಯನ್ ಮತ್ತು ಇಂಡಿಯನ್ ಎಂಬ ನಾಲ್ಕು ಇಂಗ್ಲಿಷ್ ಉಪಭಾಷೆಗಳಲ್ಲಿ 250 ಗಂಟೆಗಳ ಕಾಲ್ ಸೆಂಟರ್ ಆಡಿಯೋ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವುದು ಮತ್ತು ಟಿಪ್ಪಣಿ ಮಾಡುವುದನ್ನು ಒಳಗೊಂಡಿತ್ತು. ಇದು ಹ್ಯಾಪಿ, ನ್ಯೂಟ್ರಲ್ ಮತ್ತು ಆಂಗ್ರಿ ಮುಂತಾದ ಭಾವನೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಕ್ಲೈಂಟ್‌ಗೆ ಅವರ AI ಮಾದರಿಗಳನ್ನು ವರ್ಧಿಸಲು ಮತ್ತು ನೈಜ-ಸಮಯದ ಗ್ರಾಹಕರ ಸಂವಹನಗಳಲ್ಲಿ ಅತೃಪ್ತಿ ಮತ್ತು ತೃಪ್ತಿಯಂತಹ ಭಾವನೆಗಳನ್ನು ಹೆಚ್ಚಿಸಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಯೋಜನೆಯು ಚುಚ್ಚುಮಾತು ಪತ್ತೆ, ವಿಭಿನ್ನ ಆಡಿಯೊ ಉದ್ದಗಳು ಮತ್ತು ಅತೃಪ್ತಿಯ ಸೂಕ್ಷ್ಮ ಮೌಖಿಕ ಸೂಚನೆಗಳಂತಹ ಸವಾಲುಗಳನ್ನು ನಿವಾರಿಸಿದೆ, ನಿಖರವಾದ ಮತ್ತು ಸ್ಕೇಲೆಬಲ್ ಫಲಿತಾಂಶಗಳನ್ನು ನೀಡುತ್ತದೆ.

ಸ್ವಯಂಚಾಲಿತ ಭಾಷಣ ಭಾವನೆ ಮತ್ತು ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ

ಪ್ರಮುಖ ಅಂಕಿಅಂಶಗಳು

ಕಾಲ್ ಸೆಂಟರ್ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಲಾಗಿದೆ ಮತ್ತು 4 ಇಂಗ್ಲಿಷ್ ಉಪಭಾಷೆಗಳಲ್ಲಿ ಟಿಪ್ಪಣಿ ಮಾಡಲಾಗಿದೆ

250 ಗಂಟೆಗಳು

ಭಾಷೆಗಳ ಸಂಖ್ಯೆ

US ಇಂಗ್ಲೀಷ್, UK ಇಂಗ್ಲೀಷ್, ಆಸ್ಟ್ರೇಲಿಯನ್ ಇಂಗ್ಲೀಷ್ & ಭಾರತೀಯ ಇಂಗ್ಲೀಷ್

ಪ್ರಕರಣಗಳನ್ನು ಬಳಸಿ

ಸ್ವಯಂಚಾಲಿತ ಸ್ಪೀಚ್ ಎಮೋಷನ್ ಮತ್ತು ಸೆಂಟಿಮೆಂಟ್ ಅನಾಲಿಸಿಸ್

ಯೋಜನೆಯ ವ್ಯಾಪ್ತಿ

ಇಂಗ್ಲಿಷ್‌ನ ನಾಲ್ಕು ಉಪಭಾಷೆಗಳಲ್ಲಿ 250 ಗಂಟೆಗಳ ಕಾಲ್ ಸೆಂಟರ್ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಟಿಪ್ಪಣಿ ಮಾಡಿ:

  • US ಇಂಗ್ಲೀಷ್ (30%)
  • ಯುಕೆ ಇಂಗ್ಲೀಷ್ (30%)
  • ಆಸ್ಟ್ರೇಲಿಯನ್ ಇಂಗ್ಲಿಷ್ (20%)
  • ಭಾರತೀಯ ಇಂಗ್ಲಿಷ್ (20%)

ವ್ಯಾಪ್ತಿಯಲ್ಲಿ

ಯೋಜನೆಯು ಮೂರು ಭಾಗಗಳನ್ನು ಒಳಗೊಂಡಿದೆ:

  • ಮೆಟಾಡೇಟಾ ಸೇರಿದಂತೆ ನಿರ್ದಿಷ್ಟ ಘಟಕಗಳೊಂದಿಗೆ ಆಡಿಯೋ ಡೇಟಾ.
  • ವಿಭಜನೆ ಮತ್ತು ಸಮಯ-ಸ್ಟಾಂಪಿಂಗ್ ವಿವರಗಳೊಂದಿಗೆ ಅನುಗುಣವಾದ ಲಿಪ್ಯಂತರ ಫೈಲ್‌ಗಳು.
  • ಭಾವನೆಗಳು ಮತ್ತು ಭಾವನೆಗಳ ಟಿಪ್ಪಣಿಗಳು:
    • ಆಡಿಯೋ ಭಾವನೆ: ಸಂತೋಷ, ತಟಸ್ಥ, ಕೋಪ
    • ಪ್ರತಿಲೇಖನ ಭಾವನೆ: ಅತ್ಯಂತ ಅತೃಪ್ತಿ, ಅತೃಪ್ತಿ, ತಟಸ್ಥ, ತೃಪ್ತಿ, ಅತ್ಯಂತ ತೃಪ್ತಿ

ಸವಾಲುಗಳು

ಉಪಭಾಷೆಗಳ ವೈವಿಧ್ಯತೆ

ಆಡಿಯೊ ಡೇಟಾವು ನಿರ್ದಿಷ್ಟಪಡಿಸಿದ ಉಪಭಾಷೆಗಳನ್ನು (ಯುಎಸ್, ಯುಕೆ, ಆಸ್ಟ್ರೇಲಿಯನ್ ಮತ್ತು ಭಾರತೀಯ) ನಿಖರವಾಗಿ ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳುವುದು ಸವಾಲಿನ ಸಂಗತಿಯಾಗಿದೆ. ಈ ವರ್ಗಗಳೊಳಗಿನ ವಿವಿಧ ಪ್ರದೇಶಗಳು ವಿಭಿನ್ನ ಶಬ್ದಕೋಶ, ಉಚ್ಚಾರಣೆಗಳು ಮತ್ತು ಉಚ್ಚಾರಣೆಯನ್ನು ಬಳಸಬಹುದು.

ಪರಿಣಿತಿಯ ಅವಶ್ಯಕತೆ

ಭಾವನೆ ಮತ್ತು ಭಾವನೆಗಾಗಿ ಆಡಿಯೋ ಮತ್ತು ಪ್ರತಿಲೇಖನಗಳನ್ನು ಟಿಪ್ಪಣಿ ಮಾಡಲು ಪ್ರತಿ ಉಪಭಾಷೆಯ ಸಾಂಸ್ಕೃತಿಕ ಸೂಕ್ಷ್ಮತೆಗಳು ಮತ್ತು ಭಾಷಾ ಸೂಕ್ಷ್ಮತೆಗಳೊಂದಿಗೆ ಪರಿಚಿತವಾಗಿರುವ ತರಬೇತಿ ಪಡೆದ ಟಿಪ್ಪಣಿಕಾರರ ಅಗತ್ಯವಿದೆ.

ಭಾವನೆಗಳು ಮತ್ತು ಭಾವನೆಗಳ ಸಂಕೀರ್ಣತೆ

ಆಡಿಯೊ ಭಾವನೆ ಮತ್ತು ಪ್ರತಿಲೇಖನ ಭಾವನೆಗಳು ಯಾವಾಗಲೂ ಹೊಂದಾಣಿಕೆಯಾಗುವುದಿಲ್ಲ. ಉದಾಹರಣೆಗೆ, ಒಬ್ಬ ವ್ಯಕ್ತಿಯು ಕೋಪಗೊಂಡಂತೆ ಧ್ವನಿಸಬಹುದು ಆದರೆ ವಾಸ್ತವವಾಗಿ ತೃಪ್ತಿಯನ್ನು ವ್ಯಕ್ತಪಡಿಸಬಹುದು. ಉದಾ, "ಓಹ್, ಅದ್ಭುತ, ನನ್ನ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲು ಸಾಧ್ಯವಾಗದ ಇನ್ನೊಬ್ಬ ವ್ಯಕ್ತಿ" ನಂತಹ ವ್ಯಂಗ್ಯದ ಪದಗುಚ್ಛಗಳಲ್ಲಿ ವ್ಯಂಗ್ಯ ಸಂಭಾಷಣೆಗಳನ್ನು ನಿರ್ವಹಿಸುವುದು ಭಾವನೆ ಮತ್ತು ಭಾವನೆಗಾಗಿ ಸರಿಯಾಗಿ ಟಿಪ್ಪಣಿ ಮಾಡಬೇಕಾಗಿದೆ.

ಆಡಿಯೋ ಗುಣಮಟ್ಟ

ಆಡಿಯೋ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳ ಗುಣಮಟ್ಟವು ಬದಲಾಗಬಹುದು, ಇದು ಪ್ರತಿಲೇಖನದ ನಿಖರತೆ ಮತ್ತು ಭಾವನೆಗಳ ಪತ್ತೆಗೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ. ಹಿನ್ನೆಲೆ ಶಬ್ದ, ಅತಿಕ್ರಮಿಸುವ ಸಂಭಾಷಣೆಗಳು ಮತ್ತು ವಿವಿಧ ರೆಕಾರ್ಡಿಂಗ್ ಉಪಕರಣಗಳು ಗಮನಾರ್ಹ ಸವಾಲುಗಳನ್ನು ಒಡ್ಡಬಹುದು.

ನಿಖರವಾಗಿ ಸೆರೆಹಿಡಿಯುವುದು

ಭಾರೀ ನಿಶ್ವಾಸಗಳು ಅಥವಾ ಹತಾಶೆಯ ಇತರ ಚಿಹ್ನೆಗಳಂತಹ ಮೌಖಿಕ ಸೂಚನೆಗಳ ಮೂಲಕ ಅತೃಪ್ತಿ.

ಪರಿಹಾರ

ಸುಧಾರಿತ ನೈಸರ್ಗಿಕ ಭಾಷಾ ಸಂಸ್ಕರಣೆ (NLP) ತಂತ್ರಗಳನ್ನು ನಿಯಂತ್ರಿಸಿ, ಈ ಕೆಳಗಿನ ಪರಿಹಾರಗಳನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ:

ಮಾಹಿತಿ ಸಂಗ್ರಹ

  • 250 ಗಂಟೆಗಳ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಆಡುಭಾಷೆ-ನಿರ್ದಿಷ್ಟ ಕೋಟಾಗಳಾಗಿ ವಿಭಜಿಸಲಾಗಿದೆ.
    • US ಇಂಗ್ಲೀಷ್ (30% ಅಥವಾ 75 ಗಂಟೆಗಳು)
    • ಯುಕೆ ಇಂಗ್ಲಿಷ್ (30% ಅಥವಾ 75 ಗಂಟೆಗಳು)
    • ಆಸ್ಟ್ರೇಲಿಯನ್ ಇಂಗ್ಲಿಷ್ (20% ಅಥವಾ 50 ಗಂಟೆಗಳು)
    • ಭಾರತೀಯ ಇಂಗ್ಲಿಷ್ (20% ಅಥವಾ 50 ಗಂಟೆಗಳು)
  • US, UK, ಆಸ್ಟ್ರೇಲಿಯಾ ಮತ್ತು ಭಾರತದಿಂದ ಸ್ಥಳೀಯ ಉಚ್ಚಾರಣೆ ಬಳಕೆದಾರರು.
  • ಧ್ವನಿಯ ಭಾವನೆಯು ಕೋಪಗೊಂಡಿರುವ ಮತ್ತು ಪಠ್ಯದ ಭಾವನೆಯು ಅತೃಪ್ತಿ ಅಥವಾ ಅತ್ಯಂತ ಅತೃಪ್ತವಾಗಿರುವ ಸಂದರ್ಭಗಳಲ್ಲಿ ವಿಶೇಷ ಗಮನವನ್ನು ಹೊಂದಿರುವ ವಿವಿಧ ಸ್ವರಗಳನ್ನು ಹೊಂದಿರುವ ಮಾತಿನ ಮಾದರಿಗಳು.

ಪಠ್ಯ ವರ್ಗೀಕರಣ/ವ್ಯಾಖ್ಯಾನ

ಪಠ್ಯ ವರ್ಗೀಕರಣ

  • ನಿರ್ದಿಷ್ಟ ವರ್ಗಗಳ ಆಧಾರದ ಮೇಲೆ ಭಾವನೆಗಳು ಮತ್ತು ಭಾವನೆಗಳ ಟಿಪ್ಪಣಿ:
    • ಆಡಿಯೋ ಭಾವನೆ: ಸಂತೋಷ, ತಟಸ್ಥ, ಕೋಪ.
    • ಪ್ರತಿಲೇಖನ ಭಾವನೆ: ಅತ್ಯಂತ ಅತೃಪ್ತಿ, ಅತೃಪ್ತಿ, ತಟಸ್ಥ, ತೃಪ್ತಿ, ಅತ್ಯಂತ ತೃಪ್ತಿ.
  • ಪ್ರತಿಯೊಂದು ಆಡಿಯೊ ವಿಭಾಗವು ಕೇವಲ ಒಂದು ಪ್ರಾಥಮಿಕ ಭಾವನೆಯನ್ನು ಹೊಂದಿದೆ.
  • ಸಂಭಾಷಣೆಯೊಳಗೆ ಅನ್ವಯಿಸಲಾದ ವಿವಿಧ ವಿಳಂಬ ವಿಭಾಗಗಳು (2 ರಿಂದ 30 ಸೆಕೆಂಡುಗಳವರೆಗೆ).
  • ಎಡ ಮತ್ತು ಬಲ ಸ್ಪೀಕರ್ ಮಾಹಿತಿ, ಸೆಂಟಿಮೆಂಟ್ ಟ್ಯಾಗ್‌ಗಳು ಮತ್ತು ಅಂತಿಮ ವಿಭಾಗದ ಭಾವನೆ ಸೇರಿದಂತೆ ಪ್ರತಿಲೇಖನ ಸ್ವರೂಪವು JSON ಔಟ್‌ಪುಟ್ ಅನ್ನು ಅನುಸರಿಸಿದೆ.

 

ಕ್ವಾಲಿಟಿ ಅಶ್ಯೂರೆನ್ಸ್

ಗುಣಮಟ್ಟದ ಭರವಸೆ
ಪ್ರತಿಲೇಖನದ ನಿಖರತೆ:

  • ಕನಿಷ್ಠ ಇವುಗಳೊಂದಿಗೆ 250 ಗಂಟೆಗಳ ಆಡಿಯೊವನ್ನು ವಿತರಿಸಲಾಗಿದೆ ಎಂದು ಖಾತ್ರಿಪಡಿಸಲಾಗಿದೆ:
    • 90% ಪ್ರತಿಲೇಖನ ದೋಷ ದರ (TER) ನಿಖರತೆ.
    • 95% ವರ್ಡ್ ರೆಕಗ್ನಿಷನ್ ರೇಟ್ (WER) ನಿಖರತೆ.

QA ಪ್ರಕ್ರಿಯೆ:

  • ಡೇಟಾಸೆಟ್‌ನಿಂದ ಯಾದೃಚ್ಛಿಕವಾಗಿ ಆಯ್ಕೆಮಾಡಿದ ಮಾದರಿಗಳ ನಿಯಮಿತ ಲೆಕ್ಕಪರಿಶೋಧನೆಗಳನ್ನು ನಡೆಸಲಾಯಿತು.
    • ಡೇಟಾಸೆಟ್‌ನಾದ್ಯಂತ TER ಮತ್ತು WER ಅನ್ನು ಅಳೆಯಲು ಸ್ವಯಂಚಾಲಿತ ಸಾಧನಗಳನ್ನು ಬಳಸಲಾಗಿದೆ.
    • ಫ್ಲ್ಯಾಗ್ ಮಾಡಿದ ವಿಭಾಗಗಳ ಹಸ್ತಚಾಲಿತ ಪರಿಶೀಲನೆಯು ನಿಖರತೆಯ ಮಿತಿಗಳನ್ನು ಪೂರೈಸಿದೆ ಎಂದು ಖಚಿತಪಡಿಸುತ್ತದೆ.

ಫಲಿತಾಂಶ

ತರಬೇತಿ ಡೇಟಾವು ಸ್ವಯಂಚಾಲಿತ ಭಾವನೆ ಮತ್ತು ಭಾವನೆ ಪತ್ತೆ ಮಾದರಿಯ ಅಭಿವೃದ್ಧಿಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ:

  • ಕಾಲ್ ಸೆಂಟರ್ ಸಂವಹನಗಳಲ್ಲಿ ನೈಜ-ಸಮಯದ ಭಾವನೆಗಳ ಪತ್ತೆ.
  • ವ್ಯಂಗ್ಯ ಅಥವಾ ಅತೃಪ್ತಿಯಂತಹ ಸಂಕೀರ್ಣ ಪ್ರಕರಣಗಳನ್ನು ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಿರ್ವಹಿಸುವುದು.
  • ಭವಿಷ್ಯದ ಯೋಜನೆಗಳಿಗೆ ಸ್ಕೇಲೆಬಿಲಿಟಿ, ಹೆಚ್ಚಿದ ಡೇಟಾ ವಾಲ್ಯೂಮ್‌ಗಳು ಮತ್ತು ಹೆಚ್ಚಿನ ಭಾಷೆಗಳಿಗೆ ಸುಲಭವಾಗಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ.

ಡೆಲಿವರ್ಬಲ್ಸ್

  • 250 ಗಂಟೆಗಳ ಆಡಿಯೊ ಫೈಲ್‌ಗಳು (8 kHz PCM WAV ಸ್ವರೂಪದಲ್ಲಿ, ಮೊನೊ)
  • ಪ್ರತಿಲೇಖನ ಫೈಲ್‌ಗಳು (ವಿಭಜನೆ, ಸೆಂಟಿಮೆಂಟ್ ಟ್ಯಾಗ್‌ಗಳು ಮತ್ತು ಸ್ಪೀಕರ್ ಐಡೆಂಟಿಫೈಯರ್‌ಗಳೊಂದಿಗೆ)
  • ಮೆಟಾಡೇಟಾ (ಆಡಿಯೋ ಅವಧಿ, ಸ್ಪೀಕರ್ ವಿವರಗಳು, ಇತ್ಯಾದಿ)

ನಮ್ಮ ಕಾಲ್ ಸೆಂಟರ್ ಡೇಟಾ ಪ್ರಾಜೆಕ್ಟ್‌ಗಾಗಿ Shaip ನೊಂದಿಗೆ ಪಾಲುದಾರಿಕೆಯು ನಮ್ಮ AI ಪರಿಹಾರಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವಲ್ಲಿ ಪ್ರಮುಖ ಕ್ಷಣವಾಗಿದೆ. ಅವರ ತಂಡವು ನಾಲ್ಕು ಪ್ರಮುಖ ಇಂಗ್ಲಿಷ್ ಉಪಭಾಷೆಗಳಲ್ಲಿ 250 ಗಂಟೆಗಳ ಆಡಿಯೊ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದೆ ಮತ್ತು ಟಿಪ್ಪಣಿ ಮಾಡಿದೆ - ಯುಎಸ್, ಯುಕೆ, ಆಸ್ಟ್ರೇಲಿಯನ್ ಮತ್ತು ಇಂಡಿಯನ್ - ಅತ್ಯುನ್ನತ ಗುಣಮಟ್ಟ ಮತ್ತು ನಿಖರತೆಯನ್ನು ಖಾತ್ರಿಪಡಿಸುತ್ತದೆ. ಈ ಪ್ರದೇಶಗಳಲ್ಲಿನ ಭಾಷಾ ಸೂಕ್ಷ್ಮ ವ್ಯತ್ಯಾಸಗಳ ಗಮನವು ನಮ್ಮ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳ ನಿಖರತೆಯನ್ನು ಗಮನಾರ್ಹವಾಗಿ ಸುಧಾರಿಸಿದೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ಸಂಕೀರ್ಣ ದತ್ತಾಂಶ ಟಿಪ್ಪಣಿ ಯೋಜನೆಗಳನ್ನು ನಿರ್ವಹಿಸುವಲ್ಲಿ ಶೈಪ್‌ನ ಪರಿಣತಿಯು, ವಿಶ್ವಾಸಾರ್ಹ, ಅನುಸರಣೆ ಮಾದರಿಗಳನ್ನು ಪ್ರಮಾಣದಲ್ಲಿ ನಿರ್ಮಿಸಲು ನಮಗೆ ಸಹಾಯ ಮಾಡುವಲ್ಲಿ ಪ್ರಮುಖವಾಗಿದೆ.

ಗೋಲ್ಡನ್-5-ಸ್ಟಾರ್