ಡೇಟಾಸೆಟ್ಗಳನ್ನು ತೆರೆಯಿರಿ
ML ಮಾಡೆಲ್ಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುವ ಓಪನ್ ಸೋರ್ಸ್ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಅನ್ವೇಷಿಸಿ
ನೀವು AI/ML ಮಾದರಿಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಲು ತೆರೆದ ಮೂಲ ಡೇಟಾಸೆಟ್ಗಳು
ನಿಮ್ಮ AI ಮತ್ತು ML ಮಾಡೆಲ್ಗಳ ಔಟ್ಪುಟ್ ನೀವು ಅದನ್ನು ತರಬೇತಿ ಮಾಡಲು ಬಳಸುವ ಡೇಟಾದಷ್ಟೇ ಉತ್ತಮವಾಗಿರುತ್ತದೆ - ಆದ್ದರಿಂದ ಡೇಟಾ ಒಟ್ಟುಗೂಡುವಿಕೆಗೆ ನೀವು ಅನ್ವಯಿಸುವ ನಿಖರತೆ ಮತ್ತು ಆ ಡೇಟಾವನ್ನು ಟ್ಯಾಗ್ ಮಾಡುವುದು ಮತ್ತು ಗುರುತಿಸುವುದು ಮುಖ್ಯವಾಗಿದೆ!
ಆದ್ದರಿಂದ ನೀವು ಹೊಸ AI/ML ಉಪಕ್ರಮವನ್ನು ಪ್ರಾರಂಭಿಸಲು ಬಯಸಿದರೆ ಮತ್ತು ಉತ್ತಮ ಗುಣಮಟ್ಟದ ತರಬೇತಿ ಡೇಟಾವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ನಿಮ್ಮ ಪ್ರಾಜೆಕ್ಟ್ನ ಹೆಚ್ಚು ಸವಾಲಿನ ಅಂಶಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ ಎಂದು ನೀವು ತ್ವರಿತವಾಗಿ ಅರಿತುಕೊಳ್ಳುತ್ತಿದ್ದೀರಿ ಏಕೆಂದರೆ ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಡೇಟಾಸೆಟ್ಗಳು AI/ ಅನ್ನು ಉಳಿಸಿಕೊಳ್ಳುವ ಇಂಧನವಾಗಿದೆ. ಎಂಎಲ್ ಎಂಜಿನ್ ಚಾಲನೆಯಲ್ಲಿದೆ. ಭವಿಷ್ಯದ ನಿಮ್ಮ AI/ML ಮಾದರಿಗಳನ್ನು ಬಳಸಲು ಮತ್ತು ತರಬೇತಿ ನೀಡಲು ಉಚಿತವಾದ ಮುಕ್ತ ಡೇಟಾಸೆಟ್ಗಳ ಪಟ್ಟಿಯನ್ನು ನಾವು ಸಂಗ್ರಹಿಸಿದ್ದೇವೆ.
| ವಿಶೇಷತೆ | ಡೇಟಾ ಪ್ರಕಾರ | ಡೇಟಾಸೆಟ್ ಹೆಸರು | ಕೈಗಾರಿಕೆ / ಇಲಾಖೆ. | ಟಿಪ್ಪಣಿ/ಬಳಕೆಯ ಪ್ರಕರಣ | ಲಿಂಕ್ |
|---|---|---|---|---|---|
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಅಮೆಜಾನ್ ವಿಮರ್ಶೆಗಳು | E- ಕಾಮರ್ಸ್ | ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬಳಕೆದಾರ ಮತ್ತು ಉತ್ಪನ್ನದ ವಿವರಗಳೊಂದಿಗೆ ಸರಳ ಪಠ್ಯದಲ್ಲಿ ಕಳೆದ 35 ವರ್ಷಗಳಿಂದ 18 ಮಿಲಿಯನ್ ವಿಮರ್ಶೆಗಳು ಮತ್ತು ರೇಟಿಂಗ್ಗಳು. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ವಿಕಿಪೀಡಿಯಾ ಲಿಂಕ್ಸ್ ಡೇಟಾ | ಜನರಲ್ | ಲಿಂಕ್ | |
| ವಿವರಣೆ | ವಿಕಿಪೀಡಿಯಾದಿಂದ 1.9 ಶತಕೋಟಿ ಪದಗಳನ್ನು ಒಳಗೊಂಡಿರುವ 4 ದಶಲಕ್ಷಕ್ಕೂ ಹೆಚ್ಚು ಲೇಖನಗಳು. ಪ್ರತಿಯೊಂದು ಲೇಖನವು ಸಂಬಂಧಿತ ಘಟಕಕ್ಕಾಗಿ ಹೈಪರ್ಲಿಂಕ್ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಸ್ಟ್ಯಾಂಡ್ಫೋರ್ಡ್ ಸೆಂಟಿಮೆಂಟ್ ಟ್ರೀಬ್ಯಾಂಕ್ | ಮನರಂಜನೆ | ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 10,000 ಕ್ಕೂ ಹೆಚ್ಚು ರಾಟನ್ ಟೊಮ್ಯಾಟೋಸ್ ಚಲನಚಿತ್ರ ವಿಮರ್ಶೆ ವಾಕ್ಯಗಳಿಗೆ ಭಾವನೆ ಟಿಪ್ಪಣಿಗಳ ಡೇಟಾಸೆಟ್. ನುಡಿಗಟ್ಟು ಮಟ್ಟದಲ್ಲಿ ಲಭ್ಯವಿದೆ - ಪೆನ್ ಟ್ರೀಬ್ಯಾಂಕ್ ಸ್ವರೂಪದಲ್ಲಿ ಪಾರ್ಸ್ ಮರಗಳನ್ನು ಬೈನರೈಸ್ ಮಾಡುವ ಮೂಲಕ ಪ್ರತಿ ವಾಕ್ಯವನ್ನು ಉಪ-ಪದಗುಚ್ಛಗಳಾಗಿ ಪಾರ್ಸ್ ಮಾಡಲಾಗುತ್ತದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | Twitter US ಏರ್ಲೈನ್ ಸೆಂಟಿಮೆಂಟ್ | ಏರ್ಲೈನ್ | ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 2015 ರ ಯುಎಸ್ ಏರ್ಲೈನ್ಸ್ ಟ್ವೀಟ್ಗಳು ಸಕಾರಾತ್ಮಕ, ತಟಸ್ಥ ಮತ್ತು ನಕಾರಾತ್ಮಕ ಭಾವನೆಗಳಾಗಿ ವಿಭಜನೆಯಾದವು. | ||||
| +CV | ಚಿತ್ರ | ಇಮೇಜನೆಟ್ | ಜನರಲ್ | ಲಿಂಕ್ | |
| ವಿವರಣೆ | 14 ಮಿಲಿಯನ್ಗಿಂತಲೂ ಹೆಚ್ಚು ಚಿತ್ರಗಳನ್ನು ಹೊಂದಿರುವ ಡೇಟಾಸೆಟ್ ವಿವಿಧ ಫೈಲ್ ಫಾರ್ಮ್ಯಾಟ್ಗಳಲ್ಲಿ ಸುಮಾರು 21,000 ಸಿನ್ಸೆಟ್ಗಳಿಗೆ ಮ್ಯಾಪ್ ಮಾಡಲಾಗಿದೆ. ಸಿನ್ಸೆಟ್ಗಳು ಚಿತ್ರವಾಗಿ ಇರುವ ಸಂಬಂಧಿತ ಘಟಕಗಳೊಂದಿಗೆ ಸಿನೊಮಿಮ್ಗಳಾಗಿವೆ. 1 ಮಿಲಿಯನ್. ಚಿತ್ರಗಳು ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳನ್ನು ಹೊಂದಿವೆ ಮತ್ತು 1 ಮಿಲಿಯನ್ಗಿಂತ ಹೆಚ್ಚು. ಚಿತ್ರಗಳು SIFT ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಹೊಂದಿವೆ. | ||||
| +CV | ಚಿತ್ರ | Google ನ ತೆರೆದ ಚಿತ್ರಗಳು | ಜನರಲ್ | ಲಿಂಕ್ | |
| ವಿವರಣೆ | 600 ವಿಭಾಗಗಳನ್ನು ಹೊಂದಿರುವ ಇಮೇಜ್ನೆಟ್ಗೆ ಹೋಲುವ ಡೇಟಾಸೆಟ್. ಅಭಿವೃದ್ಧಿ, ಮೌಲ್ಯೀಕರಣ ಮತ್ತು ತರಬೇತಿ ವಿಭಜನೆಗಳಲ್ಲಿ ಲಭ್ಯವಿದೆ. ಕೆಲವು ಚಿತ್ರಗಳು ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳು ಮತ್ತು ದೃಶ್ಯ ಸಂಬಂಧಗಳನ್ನು ಸಹ ಒಳಗೊಂಡಿರುತ್ತವೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಕಾರ್ನೆಲ್ ಚಲನಚಿತ್ರ ಸಂಭಾಷಣೆಗಳು | ಮನರಂಜನೆ | ಸಂವಾದಗಳು | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಪಾತ್ರಗಳು ಮತ್ತು ಚಲನಚಿತ್ರಗಳ ಮೆಟಾಡೇಟಾದೊಂದಿಗೆ ಕಾಲ್ಪನಿಕ ಸಂಭಾಷಣೆಗಳ ಸಂಗ್ರಹ. ಪ್ರತಿಯೊಂದು ಸಾಲು ಪ್ರಶ್ನೋತ್ತರ ಸ್ವರೂಪದಲ್ಲಿ ಇಬ್ಬರು ವ್ಯಕ್ತಿಗಳ ನಡುವಿನ ಸಂಭಾಷಣೆಯಾಗಿದೆ. | ||||
| ವಿವರಣೆ | ಏಪ್ರಿಲ್ 2007 ಮತ್ತು ಅಕ್ಟೋಬರ್ 2007 ರ ನಡುವಿನ ಯಾಹೂ ಉತ್ತರಗಳ ಪೋರ್ಟಲ್ನಿಂದ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಉತ್ತರಗಳನ್ನು ಹೊಂದಿರುವ ಪ್ರಶ್ನೋತ್ತರ ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಎಂಎಸ್ ಮಾರ್ಕೊ | ಜನರಲ್ | ಪ್ರಶ್ನೆ ಉತ್ತರ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬಿಂಗ್ನ ವೆಬ್ ಹುಡುಕಾಟ ಲಾಗ್ಗಳಿಂದ ಟಿಪ್ಪಣಿಗಳೊಂದಿಗೆ ಪ್ರಶ್ನೋತ್ತರ ಡೇಟಾಸೆಟ್. ಪ್ರತಿಯೊಂದು ಪ್ರಶ್ನೆಯು ಬಳಕೆದಾರರಿಂದ ಒದಗಿಸಲಾದ ಉತ್ತರವನ್ನು ಹಾಗೂ ಉತ್ತರವನ್ನು ಒಳಗೊಂಡಿರುವ ವೆಬ್ ಪ್ಯಾಸೇಜ್ಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ನೈಸರ್ಗಿಕ ಪ್ರಶ್ನೆಗಳ ಡೇಟಾಸೆಟ್ | ಜನರಲ್ | ಪ್ರಶ್ನೆ ಉತ್ತರ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಗೂಗಲ್ ಬಿಡುಗಡೆ ಮಾಡಿದ ಈ ಡೇಟಾಸೆಟ್ ನಿಜವಾದ ಬಳಕೆದಾರ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ವಿಕಿಪೀಡಿಯಾ ಲೇಖನಗಳಿಂದ ಉತ್ತರಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಡಿಬಿ ಪೀಡಿಯಾ | ಜನರಲ್ | ಜ್ಞಾನ ಗ್ರಾಫ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಜ್ಞಾನ ಗ್ರಾಫ್ ಆಗಿ ಹೊರತೆಗೆಯಲಾದ ಅಸ್ತಿತ್ವಗಳು ಮತ್ತು ಸಂಬಂಧಗಳೊಂದಿಗೆ ವಿಕಿಪೀಡಿಯಾದ ರಚನಾತ್ಮಕ ನಿರೂಪಣೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಯಾಗೋ | ಜನರಲ್ | ಜ್ಞಾನ ಗ್ರಾಫ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ವಿಕಿಪೀಡಿಯಾ, ವರ್ಡ್ನೆಟ್ ಮತ್ತು ಜಿಯೋನೇಮ್ಸ್ಗಳಿಂದ ಅಸ್ತಿತ್ವಗಳು ಮತ್ತು ಸಂಬಂಧಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಜ್ಞಾನ ಗ್ರಾಫ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಫ್ರೀಬೇಸ್ | ಜನರಲ್ | ಜ್ಞಾನ ಗ್ರಾಫ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಅಸ್ತಿತ್ವಗಳು ಮತ್ತು ಸಂಬಂಧಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಜನಸಮೂಹ ಮೂಲದ ಜ್ಞಾನ ನೆಲೆ, ಈಗ ಗೂಗಲ್ ಜ್ಞಾನ ಗ್ರಾಫ್ನಲ್ಲಿ ಸಂಯೋಜಿಸಲ್ಪಟ್ಟಿದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಆನ್ಟೋಟ್ಸ್ | ಜನರಲ್ | ಲಾಕ್ಷಣಿಕ ಪಾತ್ರ ಲೇಬಲಿಂಗ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | CoNLL ಹಂಚಿಕೆಯ ಕಾರ್ಯಗಳಲ್ಲಿ ಬಳಸಲಾದ ವಾಕ್ಯರಚನೆ, ಶಬ್ದಾರ್ಥ ಮತ್ತು ಪ್ರವಚನ-ಮಟ್ಟದ ಟಿಪ್ಪಣಿಗಳನ್ನು ಹೊಂದಿರುವ ಕಾರ್ಪಸ್. | ||||
| ವಿವರಣೆ | ವ್ಯಕ್ತಿ, ಸಂಸ್ಥೆ ಮತ್ತು ಸ್ಥಳದಂತಹ ಹೆಸರಿಸಲಾದ ಘಟಕಗಳಿಗೆ ಟಿಪ್ಪಣಿ ಮಾಡಲಾದ ಇಂಗ್ಲಿಷ್ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ಕೊಕೊ | ಜನರಲ್ | ವಸ್ತು ಪತ್ತೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಸನ್ನಿವೇಶದಲ್ಲಿ ಸಾಮಾನ್ಯ ವಸ್ತುಗಳು: ವಸ್ತು ಪತ್ತೆ, ವಿಭಜನೆ ಮತ್ತು ಶೀರ್ಷಿಕೆಗಾಗಿ ಸಮೃದ್ಧವಾಗಿ ಟಿಪ್ಪಣಿ ಮಾಡಲಾದ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ಪ್ಯಾಸ್ಕಲ್ VOC | ಜನರಲ್ | ವಸ್ತು ಪತ್ತೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ವಸ್ತು ಪತ್ತೆ ಮತ್ತು ವಿಭಜನೆ ಸವಾಲುಗಳಿಗೆ ಮಾನದಂಡದ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ನಗರ ದೃಶ್ಯಗಳು | ಸ್ವಾಯತ್ತ ಚಾಲನೆ | ಲಾಕ್ಷಣಿಕ ವಿಭಾಗ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 30 ತರಗತಿಗಳಿಗೆ ಪಿಕ್ಸೆಲ್-ಮಟ್ಟದ ಟಿಪ್ಪಣಿಗಳೊಂದಿಗೆ ನಗರ ದೃಶ್ಯ ತಿಳುವಳಿಕೆಗಾಗಿ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ಎಂಎನ್ಐಎಸ್ಟಿ | ಜನರಲ್ | ಅಂಕಿ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 28x28 ಪಿಕ್ಸೆಲ್ಗಳ 60,000 ತರಬೇತಿ ಮತ್ತು 10,000 ಪರೀಕ್ಷಾ ಚಿತ್ರಗಳೊಂದಿಗೆ ಕೈಬರಹದ ಅಂಕೆಗಳ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ಫ್ಯಾಷನ್-MNIST | ಚಿಲ್ಲರೆ | ಚಿತ್ರ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬೆಂಚ್ಮಾರ್ಕಿಂಗ್ಗೆ ಡ್ರಾಪ್-ಇನ್ ಬದಲಿಯಾಗಿ ಬಳಸಲಾದ MNIST ನಂತೆಯೇ ಅದೇ ಸ್ವರೂಪದಲ್ಲಿ ಜಲಾಂಡೊ ಅವರ ಲೇಖನ ಚಿತ್ರಗಳ ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಆಡಿಯೋ | ಲಿಬ್ರಿಸ್ಪೀಚ್ | ಜನರಲ್ | ಎಎಸ್ಆರ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 1000 ಗಂಟೆಗಳ ಭಾಷಣ ಮತ್ತು ಸಂಬಂಧಿತ ಪಠ್ಯಗಳನ್ನು ಹೊಂದಿರುವ ಆಡಿಯೊಬುಕ್ಗಳಿಂದ ಪಡೆದ ಓದಿದ ಇಂಗ್ಲಿಷ್ ಭಾಷಣದ ಕಾರ್ಪಸ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಆಡಿಯೋ | ಟೆಡ್-ಲಿಯಂ | ಜನರಲ್ | ಎಎಸ್ಆರ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ಸಂಶೋಧನೆಗಾಗಿ ಆಡಿಯೋ ಮತ್ತು ಜೋಡಿಸಲಾದ ಪ್ರತಿಲೇಖನಗಳೊಂದಿಗೆ ಲಿಪ್ಯಂತರ ಮಾಡಿದ TED ಮಾತುಕತೆಗಳು. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಆಡಿಯೋ | ಟಿಮಿಟ್ | ಜನರಲ್ | ಧ್ವನಿಮಾ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಅಮೇರಿಕನ್ ಇಂಗ್ಲಿಷ್ ಮಾತನಾಡುವವರ ಫೋನೆಟಿಕ್ ಆಗಿ ಲಿಪ್ಯಂತರ ಮಾಡಲಾದ ಭಾಷಣ, ಫೋನೆಮ್ ಗುರುತಿಸುವಿಕೆ ಕಾರ್ಯಗಳಿಗೆ ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಆಡಿಯೋ | ಸಾಮಾನ್ಯ ಧ್ವನಿ | ಜನರಲ್ | ಎಎಸ್ಆರ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಪ್ರಪಂಚದಾದ್ಯಂತದ ಸ್ವಯಂಸೇವಕರು ಕೊಡುಗೆ ನೀಡಿದ ಬಹುಭಾಷಾ ವಾಚನಗೋಷ್ಠಿಯ ಸಂಗ್ರಹ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಆಡಿಯೋ | VoxCeleb | ಜನರಲ್ | ಸ್ಪೀಕರ್ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | YouTube ವೀಡಿಯೊಗಳಿಂದ ಸಂಗ್ರಹಿಸಲಾದ ದೊಡ್ಡ ಪ್ರಮಾಣದ ಸ್ಪೀಕರ್ ಗುರುತಿನ ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ವಿಕಿಪೀಡಿಯಾ ಡಂಪ್ | ಜನರಲ್ | ಭಾಷಾ ಮಾದರಿ ರಚನೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಭಾಷಾ ಮಾದರಿಗಳ ಪೂರ್ವ ತರಬೇತಿಗಾಗಿ ಬಳಸಲಾಗುವ, ನಿಯಮಿತವಾಗಿ ನವೀಕರಿಸಲಾಗುವ ವಿಕಿಪೀಡಿಯಾ ಲೇಖನಗಳ ಪೂರ್ಣ ಪಠ್ಯ ಡಂಪ್ಗಳು. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಗಿಗಾವರ್ಡ್ | ಸುದ್ದಿ | ಭಾಷಾ ಮಾದರಿ ರಚನೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬಹು ಸುದ್ದಿ ಸಂಸ್ಥೆಗಳಿಂದ ಸುದ್ದಿವಾಹಿನಿಯ ಪಠ್ಯ ದತ್ತಾಂಶದ ಸಮಗ್ರ ಆರ್ಕೈವ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | IMDB ವಿಮರ್ಶೆಗಳು | ಮನರಂಜನೆ | ಭಾವನೆ ವಿಶ್ಲೇಷಣೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬೈನರಿ ಭಾವನೆ ವರ್ಗೀಕರಣಕ್ಕಾಗಿ ದೊಡ್ಡ ಚಲನಚಿತ್ರ ವಿಮರ್ಶೆ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ದೃಶ್ಯ | ಚಲನಶಾಸ್ತ್ರ-700 | ಜನರಲ್ | ಕ್ರಿಯೆ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 700 ಮಾನವ ಕ್ರಿಯಾ ತರಗತಿಗಳನ್ನು ಒಳಗೊಂಡ YouTube ವೀಡಿಯೊ ಕ್ಲಿಪ್ಗಳ ದೊಡ್ಡ-ಪ್ರಮಾಣದ, ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ದೃಶ್ಯ | ಯುಸಿಎಫ್ 101 | ಜನರಲ್ | ಕ್ರಿಯೆ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 101 ಕ್ರಿಯಾ ವಿಭಾಗಗಳನ್ನು ಹೊಂದಿರುವ ವಾಸ್ತವಿಕ ಕ್ರಿಯಾ ವೀಡಿಯೊಗಳ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ದೃಶ್ಯ | ಎಚ್ಎಂಡಿಬಿ 51 | ಜನರಲ್ | ಕ್ರಿಯೆ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 51 ಕ್ರಿಯಾ ವಿಭಾಗಗಳನ್ನು ಹೊಂದಿರುವ ದೊಡ್ಡ ಮಾನವ ಚಲನಶೀಲ ವೀಡಿಯೊ ಡೇಟಾಬೇಸ್. | ||||
| ವಿವರಣೆ | ಅನಿಯಂತ್ರಿತ ಮುಖ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಅಧ್ಯಯನ ಮಾಡಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಮುಖದ ಛಾಯಾಚಿತ್ರಗಳ ಡೇಟಾಬೇಸ್. | ||||
| +CV | ಚಿತ್ರ | CASIA-ವೆಬ್ಫೇಸ್ | ಜನರಲ್ | ಮುಖ ಗುರುತಿಸುವಿಕೆ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಆಳವಾದ ಮುಖ ಗುರುತಿಸುವಿಕೆ ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಲು ಲಕ್ಷಾಂತರ ಮುಖ ಚಿತ್ರಗಳೊಂದಿಗೆ ಒಂದು ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | SQuAD | ಜನರಲ್ | ಓದುವಿಕೆ ಕಾಂಪ್ರಹೆನ್ಷನ್ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಸ್ಟ್ಯಾನ್ಫೋರ್ಡ್ ಪ್ರಶ್ನೆ ಉತ್ತರಿಸುವ ಡೇಟಾಸೆಟ್: ವಿಕಿಪೀಡಿಯಾ ಲೇಖನಗಳ ಗುಂಪಿನಲ್ಲಿ ಜನಸಮೂಹದ ಕೆಲಸಗಾರರು ಕೇಳಿದ ಪ್ರಶ್ನೆಗಳು. | ||||
| ವಿವರಣೆ | CNN ಸುದ್ದಿ ಲೇಖನಗಳನ್ನು ಆಧರಿಸಿದ ಪ್ರಶ್ನೆಗಳು ಮತ್ತು ಉತ್ತರಗಳನ್ನು ಹೊಂದಿರುವ ಯಂತ್ರ ಗ್ರಹಿಕೆಯ ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಮಲ್ಟಿಎನ್ಎಲ್ಐ | ಜನರಲ್ | ನೈಸರ್ಗಿಕ ಭಾಷಾ ನಿರ್ಣಯ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಬಹು ಪ್ರಕಾರಗಳಲ್ಲಿ ವಾಕ್ಯ-ಜೋಡಿ ನೈಸರ್ಗಿಕ ಭಾಷಾ ನಿರ್ಣಯಕ್ಕಾಗಿ ಒಂದು ಡೇಟಾಸೆಟ್. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | ಎಸ್ಎನ್ಎಲ್ಐ | ಜನರಲ್ | ನೈಸರ್ಗಿಕ ಭಾಷಾ ನಿರ್ಣಯ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಸ್ಟ್ಯಾನ್ಫೋರ್ಡ್ ನ್ಯಾಚುರಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಇನ್ಫರೆನ್ಸ್ ಕಾರ್ಪಸ್, ವಾಕ್ಯ ಜೋಡಿಗಳನ್ನು ಸಂಜ್ಞೆ, ವಿರೋಧಾಭಾಸ ಅಥವಾ ತಟಸ್ಥ ಎಂದು ಲೇಬಲ್ ಮಾಡಲಾಗಿದೆ. | ||||
| ವಿವರಣೆ | ವಿಕಿಪೀಡಿಯಾದಲ್ಲಿ ಪರಿಶೀಲಿಸಿದ ಉತ್ತಮ ಮತ್ತು ವೈಶಿಷ್ಟ್ಯಗೊಳಿಸಿದ ಲೇಖನಗಳ ಗುಂಪಿನಿಂದ ಹೊರತೆಗೆಯಲಾದ 100 ಮಿಲಿಯನ್ಗಿಂತಲೂ ಹೆಚ್ಚು ಟೋಕನ್ಗಳ ಸಂಗ್ರಹ. | ||||
| ವಿವರಣೆ | 196 ವರ್ಗದ ಕಾರುಗಳ 16,185 ಚಿತ್ರಗಳ ಡೇಟಾಸೆಟ್. | ||||
| +CV | ಚಿತ್ರ | ಆಕ್ಸ್ಫರ್ಡ್ ಫ್ಲವರ್ಸ್ 102 | ಸಸ್ಯಶಾಸ್ತ್ರ | ಸೂಕ್ಷ್ಮ-ಧಾನ್ಯ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | ಯುನೈಟೆಡ್ ಕಿಂಗ್ಡಂನಲ್ಲಿ ಸಾಮಾನ್ಯವಾಗಿ ಕಂಡುಬರುವ 102 ಹೂವಿನ ವರ್ಗಗಳು. | ||||
| +CV | ಚಿತ್ರ | CIFAR-10 | ಜನರಲ್ | ಚಿತ್ರ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 10 ವರ್ಗಗಳ ಚಿತ್ರಗಳು: ವಿಮಾನ, ಆಟೋಮೊಬೈಲ್, ಪಕ್ಷಿ, ಬೆಕ್ಕು, ಜಿಂಕೆ, ನಾಯಿ, ಕಪ್ಪೆ, ಕುದುರೆ, ಹಡಗು ಮತ್ತು ಟ್ರಕ್. | ||||
| +CV | ಚಿತ್ರ | CIFAR-100 | ಜನರಲ್ | ಚಿತ್ರ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | CIFAR-10 ಗೆ ಹೋಲುವ ಡೇಟಾಸೆಟ್, ಆದರೆ 100 ಸೂಕ್ಷ್ಮ-ಧಾನ್ಯ ವರ್ಗಗಳನ್ನು ಹೊಂದಿದೆ. | ||||
| +CV | ಚಿತ್ರ | VOC ವ್ಯಕ್ತಿ ವಿನ್ಯಾಸ | ಜನರಲ್ | ಪೋಸ್ ಅಂದಾಜು | ಲಿಂಕ್ |
| ವಿವರಣೆ | ತಲೆ, ಕೈಗಳು ಮತ್ತು ಪಾದಗಳಂತಹ ವ್ಯಕ್ತಿ ವಿನ್ಯಾಸ ಟಿಪ್ಪಣಿಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುವ PASCAL VOC ನ ಭಾಗ. | ||||
| +CV | ಚಿತ್ರ | MPII ಮಾನವ ಭಂಗಿ | ಜನರಲ್ | ಪೋಸ್ ಅಂದಾಜು | ಲಿಂಕ್ |
| ವಿವರಣೆ | ದೇಹದ ಕೀಲುಗಳ ಟಿಪ್ಪಣಿ ಹೊಂದಿರುವ 40,000 ಕ್ಕೂ ಹೆಚ್ಚು ಜನರನ್ನು ಒಳಗೊಂಡಿರುವ ಸುಮಾರು 25,000 ಚಿತ್ರಗಳು. | ||||
| ವಿವರಣೆ | ಪಠ್ಯ ವರ್ಗೀಕರಣ ಸಂಶೋಧನೆಗಾಗಿ ರಾಯಿಟರ್ಸ್ ಸುದ್ದಿವಾಹಿನಿಯ ಲೇಖನಗಳ ಸಂಗ್ರಹ. | ||||
| +ಎನ್ಎಲ್ಪಿ | ಪಠ್ಯ | 20 ಸುದ್ದಿ ಗುಂಪುಗಳು | ಜನರಲ್ | ಪಠ್ಯ ವರ್ಗೀಕರಣ | ಲಿಂಕ್ |
| ವಿವರಣೆ | 20,000 ಸುದ್ದಿಗುಂಪು ದಾಖಲೆಗಳ ಸಂಗ್ರಹವನ್ನು 20 ವಿಭಿನ್ನ ಸುದ್ದಿಗುಂಪುಗಳಾಗಿ ವಿಂಗಡಿಸಲಾಗಿದೆ. | ||||