ವ್ಯಾಖ್ಯಾನ
ಲಾಕ್ಷಣಿಕ ವಿಭಜನೆಯು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ಕಾರ್ಯವಾಗಿದ್ದು, ಚಿತ್ರದಲ್ಲಿನ ಪ್ರತಿಯೊಂದು ಪಿಕ್ಸೆಲ್ ಅನ್ನು ರಸ್ತೆ, ಕಟ್ಟಡ ಅಥವಾ ಪಾದಚಾರಿಗಳಂತಹ ವರ್ಗಕ್ಕೆ ವರ್ಗೀಕರಿಸುತ್ತದೆ.
ಉದ್ದೇಶ
ಸ್ವಯಂ ಚಾಲನೆ, ವೈದ್ಯಕೀಯ ಚಿತ್ರಣ ಮತ್ತು ರೊಬೊಟಿಕ್ಸ್ನಲ್ಲಿ AI ಅನ್ವಯಿಕೆಗಳಿಗೆ ವಿವರವಾದ ದೃಶ್ಯ ತಿಳುವಳಿಕೆಯನ್ನು ಒದಗಿಸುವುದು ಇದರ ಉದ್ದೇಶವಾಗಿದೆ.
ಪ್ರಾಮುಖ್ಯತೆ
- ಸುರಕ್ಷತೆ-ನಿರ್ಣಾಯಕ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ಪಿಕ್ಸೆಲ್-ಮಟ್ಟದ ಗ್ರಹಿಕೆಗೆ ಅತ್ಯಗತ್ಯ.
- ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್ಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ನಿಖರವಾದ ವಸ್ತುವಿನ ಗಡಿಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.
- ದೊಡ್ಡ ಟಿಪ್ಪಣಿ ಮಾಡಿದ ಡೇಟಾಸೆಟ್ಗಳ ಅಗತ್ಯವಿದೆ.
- ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ಗಳಲ್ಲಿ ಕಂಪ್ಯೂಟೇಶನಲ್ ಆಗಿ ತೀವ್ರವಾಗಿರುತ್ತದೆ.
ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ
- ಪಿಕ್ಸೆಲ್-ಮಟ್ಟದ ಟಿಪ್ಪಣಿ ಮಾಡಿದ ಚಿತ್ರಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಲೇಬಲ್ ಮಾಡಿ.
- ಸಂಪೂರ್ಣ ಕನ್ವಲ್ಯೂಷನಲ್ ನೆಟ್ವರ್ಕ್ಗಳಂತಹ ಆಳವಾದ ಕಲಿಕೆಯ ಮಾದರಿಗಳಿಗೆ ತರಬೇತಿ ನೀಡಿ.
- ಇನ್ಪುಟ್ ಚಿತ್ರವನ್ನು ಪಿಕ್ಸೆಲ್-ಮಟ್ಟದ ಭವಿಷ್ಯವಾಣಿಗಳಾಗಿ ಸಂಸ್ಕರಿಸಲಾಗುತ್ತದೆ.
- ಔಟ್ಪುಟ್ ಮಾಸ್ಕ್ ಪ್ರತಿಯೊಂದು ಪಿಕ್ಸೆಲ್ ಅನ್ನು ಒಂದು ವರ್ಗಕ್ಕೆ ನಿಯೋಜಿಸುತ್ತದೆ.
- ಇಂಟರ್ಸೆಕ್ಷನ್ ಓವರ್ ಯೂನಿಯನ್ (IoU) ನಂತಹ ಮೆಟ್ರಿಕ್ಗಳೊಂದಿಗೆ ಮೌಲ್ಯಮಾಪನ ಮಾಡಿ.
ಉದಾಹರಣೆಗಳು (ವಾಸ್ತವ ಪ್ರಪಂಚ)
- ನಗರದೃಶ್ಯಗಳ ದತ್ತಾಂಶ ಸಂಗ್ರಹ: ನಗರ ದೃಶ್ಯಗಳಿಗಾಗಿ ಶಬ್ದಾರ್ಥದ ವಿಭಜನೆ.
- ಟೆಸ್ಲಾ ಆಟೋಪೈಲಟ್: ರಸ್ತೆ ಸಂಚರಣೆಗೆ ಪಿಕ್ಸೆಲ್-ಮಟ್ಟದ ವಿಭಜನೆ.
- ವೈದ್ಯಕೀಯ ಚಿತ್ರಣ: MRI ಸ್ಕ್ಯಾನ್ಗಳಲ್ಲಿ ಗೆಡ್ಡೆಗಳನ್ನು ವಿಭಜಿಸುವುದು.
ಉಲ್ಲೇಖಗಳು / ಹೆಚ್ಚಿನ ಓದಿಗೆ
- ಲಾಂಗ್ ಮತ್ತು ಇತರರು. “ಶಬ್ದಾರ್ಥ ವಿಭಜನೆಗಾಗಿ ಸಂಪೂರ್ಣ ಕನ್ವಲ್ಯೂಷನಲ್ ನೆಟ್ವರ್ಕ್ಗಳು.” CVPR 2015.
- ನಗರದೃಶ್ಯಗಳ ಡೇಟಾಸೆಟ್.
- IEEE ಟ್ರಾನ್ಸಾಕ್ಷನ್ಸ್ ಆನ್ ಮೆಡಿಕಲ್ ಇಮೇಜಿಂಗ್.