Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… машинного обучСния

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. b33683d495964ebb9ca8d413e60c4085. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-b33683d495964ebb9ca8d413e60c4085. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° b33683d495964ebb9ca8d413e60c4085

Π’ Π·Π°Π΄Π°Ρ‡Π°Ρ… машинного обучСния для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ сравнСния Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ, Π° ΠΈΡ… Π²Ρ‹Π±ΠΎΡ€ ΠΈ Π°Π½Π°Π»ΠΈΠ· β€” нСпрСмСнная Ρ‡Π°ΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ датасатаниста.

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ рассмотрим Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΈ качСства Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации, обсудим, Ρ‡Ρ‚ΠΎ являСтся Π²Π°ΠΆΠ½Ρ‹ΠΌ ΠΏΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΈ Ρ‡Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠΉΡ‚ΠΈ Π½Π΅ Ρ‚Π°ΠΊ.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации

Для дСмонстрации ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ sklearn ΠΈ наглядного прСдставлСния ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ датасСт ΠΏΠΎ ΠΎΡ‚Ρ‚ΠΎΠΊΡƒ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² Ρ‚Π΅Π»Π΅ΠΊΠΎΠΌ-ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π°.

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

Accuracy, precision ΠΈ recall

ΠŸΠ΅Ρ€Π΅Π΄ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΎΠΌ ΠΊ самим ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ввСсти Π²Π°ΠΆΠ½ΡƒΡŽ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ для описания этих ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ошибок классификации β€” confusion matrix (ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок).
Допустим, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π²Π° класса ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· классов, Ρ‚ΠΎΠ³Π΄Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок классификации Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π³Π»ΡΠ΄Π΅Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 447bea1c7af9dca25d20da8fede95184. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-447bea1c7af9dca25d20da8fede95184. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 447bea1c7af9dca25d20da8fede95184Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 12a4a86327cbde9aa9fec271ce37a205. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-12a4a86327cbde9aa9fec271ce37a205. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 12a4a86327cbde9aa9fec271ce37a205
Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 8188c3192189c41564bd2ae4a03a9d91. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-8188c3192189c41564bd2ae4a03a9d91. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 8188c3192189c41564bd2ae4a03a9d91True Positive (TP)False Positive (FP)
Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 74d5cbba34162f133a65cbbe32164dd7. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-74d5cbba34162f133a65cbbe32164dd7. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 74d5cbba34162f133a65cbbe32164dd7False Negative (FN)True Negative (TN)

Π—Π΄Π΅ΡΡŒ Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 8b1e9965f298b958fcd6ae9f77c60704. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-8b1e9965f298b958fcd6ae9f77c60704. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 8b1e9965f298b958fcd6ae9f77c60704β€” это ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Π° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 1e6829a256c8a2712f849dc1d2343b62. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-1e6829a256c8a2712f849dc1d2343b62. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 1e6829a256c8a2712f849dc1d2343b62β€” истинная ΠΌΠ΅Ρ‚ΠΊΠ° класса Π½Π° этом ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅.
Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ошибки классификации Π±Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²ΡƒΡ… Π²ΠΈΠ΄ΠΎΠ²: False Negative (FN) ΠΈ False Positive (FP).

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

Accuracy

Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ понятной, ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎΠΉ ΠΈ ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ являСтся accuracy β€” доля ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 3a6cb82da231408bd4c38a70e59fb1d8. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-3a6cb82da231408bd4c38a70e59fb1d8. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 3a6cb82da231408bd4c38a70e59fb1d8

Π­Ρ‚Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° бСсполСзна Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… с Π½Π΅Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ классами, ΠΈ это Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅.

Допустим, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Ρƒ спам-Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° ΠΏΠΎΡ‡Ρ‚Ρ‹. Π£ нас Π΅ΡΡ‚ΡŒ 100 Π½Π΅-спам писСм, 90 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… наш классификатор ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Negative = 90, False Positive = 10), ΠΈ 10 спам-писСм, 5 ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… классификатор Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» Π²Π΅Ρ€Π½ΠΎ (True Positive = 5, False Negative = 5).
Π’ΠΎΠ³Π΄Π° accuracy:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 35fff701dae36207f6bf3d536f366fc1. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-35fff701dae36207f6bf3d536f366fc1. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 35fff701dae36207f6bf3d536f366fc1

Однако Ссли ΠΌΡ‹ просто Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ всС письма ΠΊΠ°ΠΊ Π½Π΅-спам, Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ accuracy:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 6fc81da6e0a9354fca9491b22b3981f4. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-6fc81da6e0a9354fca9491b22b3981f4. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 6fc81da6e0a9354fca9491b22b3981f4

ΠŸΡ€ΠΈ этом, наша модСль ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ силой, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ письма со спамом. ΠŸΡ€Π΅ΠΎΠ΄ΠΎΠ»Π΅Ρ‚ΡŒ это Π½Π°ΠΌ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ с ΠΎΠ±Ρ‰Π΅ΠΉ для всСх классов ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ показатСлям качСства классов.

Precision, recall ΠΈ F-ΠΌΠ΅Ρ€Π°

Для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΠΈΠ· классов ΠΏΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π²Π²Π΅Π΄Π΅ΠΌ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ precision (Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ) ΠΈ recall (ΠΏΠΎΠ»Π½ΠΎΡ‚Π°).

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 16493bc899f7275f3b5ff8d45a3ed2e2. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-16493bc899f7275f3b5ff8d45a3ed2e2. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 16493bc899f7275f3b5ff8d45a3ed2e2

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 2584e78f32225eade5cb8b1b4a665193. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-2584e78f32225eade5cb8b1b4a665193. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 2584e78f32225eade5cb8b1b4a665193

Precision ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ долю ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π½Π°Π·Π²Π°Π½Π½Ρ‹Ρ… классификатором ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΈ ΠΏΡ€ΠΈ этом Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡΠ²Π»ΡΡŽΡ‰ΠΈΠΌΠΈΡΡ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π° recall ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΡƒΡŽ долю ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса ΠΈΠ· всСх ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса нашСл Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ.

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

ИмСнно Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ precision Π½Π΅ позволяСт Π½Π°ΠΌ Π·Π°ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² ΠΎΠ΄ΠΈΠ½ класс, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Π² этом случаС ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ рост уровня False Positive. Recall дСмонстрируСт ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹ΠΉ класс Π²ΠΎΠΎΠ±Ρ‰Π΅, Π° precision β€” ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒ этот класс ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΈΡ… классов.

Как ΠΌΡ‹ ΠΎΡ‚ΠΌΠ΅Ρ‡Π°Π»ΠΈ Ρ€Π°Π½Π΅Π΅, ошибки классификации Π±Ρ‹Π²Π°ΡŽΡ‚ Π΄Π²ΡƒΡ… Π²ΠΈΠ΄ΠΎΠ²: False Positive ΠΈ False Negative. Π’ статистикС ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Π²ΠΈΠ΄ ошибок Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ошибкой I-Π³ΠΎ Ρ€ΠΎΠ΄Π°, Π° Π²Ρ‚ΠΎΡ€ΠΎΠΉ β€” ошибкой II-Π³ΠΎ Ρ€ΠΎΠ΄Π°. Π’ нашСй Π·Π°Π΄Π°Ρ‡Π΅ ΠΏΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ ΠΎΡ‚Ρ‚ΠΎΠΊΠ° Π°Π±ΠΎΠ½Π΅Π½Ρ‚ΠΎΠ², ошибкой ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ принятиС лояльного Π°Π±ΠΎΠ½Π΅Π½Ρ‚Π° Π·Π° уходящСго, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ наша нулСвая Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½ΠΈΠΊΡ‚ΠΎ ΠΈΠ· Π°Π±ΠΎΠ½Π΅Π½Ρ‚ΠΎΠ² Π½Π΅ ΡƒΡ…ΠΎΠ΄ΠΈΡ‚, Π° ΠΌΡ‹ эту Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρƒ ΠΎΡ‚Π²Π΅Ρ€Π³Π°Π΅ΠΌ. БоотвСтствСнно, ошибкой Π²Ρ‚ΠΎΡ€ΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ²Π»ΡΡ‚ΡŒΡΡ «ΠΏΡ€ΠΎΠΏΡƒΡΠΊ» уходящСго Π°Π±ΠΎΠ½Π΅Π½Ρ‚Π° ΠΈ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎΠ΅ принятиС Π½ΡƒΠ»Π΅Π²ΠΎΠΉ Π³ΠΈΠΏΠΎΡ‚Π΅Π·Ρ‹.

Precision ΠΈ recall Π½Π΅ зависят, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ accuracy, ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ классов ΠΈ ΠΏΠΎΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹ Π² условиях нСсбалансированных Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ.
Часто Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ стоит Π·Π°Π΄Π°Ρ‡Π° Π½Π°ΠΉΡ‚ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ (для Π·Π°ΠΊΠ°Π·Ρ‡ΠΈΠΊΠ°) баланс ΠΌΠ΅ΠΆΠ΄Ρƒ этими двумя ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°ΠΌΠΈ. ΠšΠ»Π°ΡΡΠΈΡ‡Π΅ΡΠΊΠΈΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ являСтся Π·Π°Π΄Π°Ρ‡Π° опрСдСлСния ΠΎΡ‚Ρ‚ΠΎΠΊΠ° ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ².
ΠžΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅ΠΌ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ всСх уходящих Π² ΠΎΡ‚Ρ‚ΠΎΠΊ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΡ…. Но, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ² ΡΡ‚Ρ€Π°Ρ‚Π΅Π³ΠΈΡŽ ΠΈ рСсурс для удСрТания ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Π½ΡƒΠΆΠ½Ρ‹Π΅ ΠΏΠΎΡ€ΠΎΠ³ΠΈ ΠΏΠΎ precision ΠΈ recall. НапримСр, ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΡΡ€Π΅Π΄ΠΎΡ‚ΠΎΡ‡ΠΈΡ‚ΡŒΡΡ Π½Π° ΡƒΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ высокодоходных ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ»ΠΈ Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ ΡƒΠΉΠ΄Π΅Ρ‚ с большСй Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹ Π² рСсурсах ΠΊΠΎΠ»Π»-Ρ†Π΅Π½Ρ‚Ρ€Π°.

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² случаС ΠΏΠ΅Ρ€Π΅Π±ΠΎΡ€Π° ΠΏΠΎ сСткС GridSearchCV ) ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΠ΄Π½Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ°, ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ ΠΈ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ Π½Π° тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅.
БущСствуСт нСсколько Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… способов ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ precision ΠΈ recall Π² Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΉ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ качСства. F-ΠΌΠ΅Ρ€Π° (Π² ΠΎΠ±Ρ‰Π΅ΠΌ случаС Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 7c3bf70f29a2fa3bc5f72bd3dcf3a579. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-7c3bf70f29a2fa3bc5f72bd3dcf3a579. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 7c3bf70f29a2fa3bc5f72bd3dcf3a579) β€” срСднСС гармоничСскоС precision ΠΈ recall :

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 4f1f5c0ab5dcf8379ff4bcbbd02f0623. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-4f1f5c0ab5dcf8379ff4bcbbd02f0623. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 4f1f5c0ab5dcf8379ff4bcbbd02f0623

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. f3905b5cfab08d98b2d380d5ea75c66c. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-f3905b5cfab08d98b2d380d5ea75c66c. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° f3905b5cfab08d98b2d380d5ea75c66cΠ² Π΄Π°Π½Π½ΠΎΠΌ случаС опрСдСляСт вСс точности Π² ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅, ΠΈ ΠΏΡ€ΠΈ Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. a6657a5ad779fd051b6a6b0fe3464c51. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-a6657a5ad779fd051b6a6b0fe3464c51. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° a6657a5ad779fd051b6a6b0fe3464c51это срСднСС гармоничСскоС (с ΠΌΠ½ΠΎΠΆΠΈΡ‚Π΅Π»Π΅ΠΌ 2, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π² случаС precision = 1 ΠΈ recall = 1 ΠΈΠΌΠ΅Ρ‚ΡŒ Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 8ebd7aa050e5cab1d1d63f1eb7f1e366. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-8ebd7aa050e5cab1d1d63f1eb7f1e366. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 8ebd7aa050e5cab1d1d63f1eb7f1e366)
F-ΠΌΠ΅Ρ€Π° достигаСт максимума ΠΏΡ€ΠΈ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅ ΠΈ точности, Ρ€Π°Π²Π½Ρ‹ΠΌΠΈ Π΅Π΄ΠΈΠ½ΠΈΡ†Π΅, ΠΈ Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ Π½ΡƒΠ»ΡŽ, Ссли ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π±Π»ΠΈΠ·ΠΎΠΊ ΠΊ Π½ΡƒΠ»ΡŽ.
Π’ sklearn Π΅ΡΡ‚ΡŒ удобная функция _metrics.classificationreport, Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°ΡŽΡ‰Π°Ρ recall, precision ΠΈ F-ΠΌΠ΅Ρ€Ρƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· классов, Π° Ρ‚Π°ΠΊΠΆΠ΅ количСство экзСмпляров ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса.

classprecisionrecallf1-scoresupport
Non-churned0.880.970.93941
Churned0.600.250.35159
avg / total0.840.870.841100

Π—Π΄Π΅ΡΡŒ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π² случаС Π·Π°Π΄Π°Ρ‡ с нСсбалансированными классами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€Π΅Π²Π°Π»ΠΈΡ€ΡƒΡŽΡ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, часто приходится ΠΏΡ€ΠΈΠ±Π΅Π³Π°Ρ‚ΡŒ ΠΊ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°ΠΌ искусствСнной ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ датасСта для выравнивания ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ классов. Π˜Ρ… сущСствуСт ΠΌΠ½ΠΎΠ³ΠΎ, ΠΈ ΠΌΡ‹ Π½Π΅ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡ… ΠΊΠ°ΡΠ°Ρ‚ΡŒΡΡ, здСсь ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ подходящий для вашСй Π·Π°Π΄Π°Ρ‡ΠΈ.

AUC-ROC ΠΈ AUC-PR

ΠŸΡ€ΠΈ ΠΊΠΎΠ½Π²Π΅Ρ€Ρ‚Π°Ρ†ΠΈΠΈ вСщСствСнного ΠΎΡ‚Π²Π΅Ρ‚Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, вСроятности принадлСТности ΠΊ классу, ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ см. SVM) Π² Π±ΠΈΠ½Π°Ρ€Π½ΡƒΡŽ ΠΌΠ΅Ρ‚ΠΊΡƒ, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ ΠΏΠΎΡ€ΠΎΠ³, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ 0 становится 1. ЕстСствСнным ΠΈ Π±Π»ΠΈΠ·ΠΊΠΈΠΌ каТСтся ΠΏΠΎΡ€ΠΎΠ³, Ρ€Π°Π²Π½Ρ‹ΠΉ 0.5, Π½ΠΎ ΠΎΠ½ Π½Π΅ всСгда оказываСтся ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈ Π²Ρ‹ΡˆΠ΅ΡƒΠΏΠΎΠΌΡΠ½ΡƒΡ‚ΠΎΠΌ отсутствии баланса классов.

Одним ΠΈΠ· способов ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ модСль Π² Ρ†Π΅Π»ΠΎΠΌ, Π½Π΅ ΠΏΡ€ΠΈΠ²ΡΠ·Ρ‹Π²Π°ΡΡΡŒ ΠΊ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΌΡƒ ΠΏΠΎΡ€ΠΎΠ³Ρƒ, являСтся AUC-ROC (ΠΈΠ»ΠΈ ROC AUC) β€” ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ (Area Under Curve) ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ошибок (Receiver Operating Characteristic curve ). Данная кривая прСдставляСт ΠΈΠ· сСбя линию ΠΎΡ‚ (0,0) Π΄ΠΎ (1,1) Π² ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°Ρ… True Positive Rate (TPR) ΠΈ False Positive Rate (FPR):

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 71e20ff859277c93efc4a1cb20fd4f7a. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-71e20ff859277c93efc4a1cb20fd4f7a. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 71e20ff859277c93efc4a1cb20fd4f7a

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. f75d27d279b274eedc5004a691ccb18a. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-f75d27d279b274eedc5004a691ccb18a. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° f75d27d279b274eedc5004a691ccb18a

TPR Π½Π°ΠΌ ΡƒΠΆΠ΅ извСстна, это ΠΏΠΎΠ»Π½ΠΎΡ‚Π°, Π° FPR ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΡƒΡŽ долю ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² negative класса Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ прСдсказал Π½Π΅Π²Π΅Ρ€Π½ΠΎ. Π’ идСальном случаС, ΠΊΠΎΠ³Π΄Π° классификатор Π½Π΅ Π΄Π΅Π»Π°Π΅Ρ‚ ошибок (FPR = 0, TPR = 1) ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ, Ρ€Π°Π²Π½ΡƒΡŽ Π΅Π΄ΠΈΠ½ΠΈΡ†Π΅; Π² ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΎΠΌ случаС, ΠΊΠΎΠ³Π΄Π° классификатор случайно Π²Ρ‹Π΄Π°Π΅Ρ‚ вСроятности классов, AUC-ROC Π±ΡƒΠ΄Π΅Ρ‚ ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ ΠΊ 0.5, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ классификатор Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π΄Π°Π²Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ количСство TP ΠΈ FP.
КаТдая Ρ‚ΠΎΡ‡ΠΊΠ° Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ соотвСтствуСт Π²Ρ‹Π±ΠΎΡ€Ρƒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π°. ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ качСство Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (большС β€” Π»ΡƒΡ‡ΡˆΠ΅), ΠΊΡ€ΠΎΠΌΠ΅ этого, Π²Π°ΠΆΠ½ΠΎΠΉ являСтся ΠΊΡ€ΡƒΡ‚ΠΈΠ·Π½Π° самой ΠΊΡ€ΠΈΠ²ΠΎΠΉ β€” ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ TPR, минимизируя FPR, Π° Π·Π½Π°Ρ‡ΠΈΡ‚, наша кривая Π² ΠΈΠ΄Π΅Π°Π»Π΅ Π΄ΠΎΠ»ΠΆΠ½Π° ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ ΠΊ Ρ‚ΠΎΡ‡ΠΊΠ΅ (0,1).

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

ΠšΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ AUC-ROC устойчив ΠΊ нСсбалансированным классам (спойлСр: ΡƒΠ²Ρ‹, Π½Π΅ всё Ρ‚Π°ΠΊ ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½ΠΎ) ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ ΠΊΠ°ΠΊ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ positive ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ€Π°Π½ΠΆΠΈΡ€ΠΎΠ²Π°Π½ классификатором Π²Ρ‹ΡˆΠ΅ (Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π±Ρ‹Ρ‚ΡŒ positive), Ρ‡Π΅ΠΌ случайно Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹ΠΉ negative ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

Рассмотрим ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ: Π½Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ 100 Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² ΠΈΠ· 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ². ΠœΡ‹ Π½Π°ΠΌΠ°ΡˆΠΈΠ½Π»Π΅Ρ€Π½ΠΈΠ»ΠΈ Π΄Π²Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 025614701b5a3780f0284941f27807af. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-025614701b5a3780f0284941f27807af. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 025614701b5a3780f0284941f27807af

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 069ba664fd6cf79f32077d8d97e82822. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-069ba664fd6cf79f32077d8d97e82822. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 069ba664fd6cf79f32077d8d97e82822

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 025614701b5a3780f0284941f27807af. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-025614701b5a3780f0284941f27807af. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 025614701b5a3780f0284941f27807af

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 8b92d68c64dd425e82a61736a193bad3. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-8b92d68c64dd425e82a61736a193bad3. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 8b92d68c64dd425e82a61736a193bad3

Π‘ΠΊΠΎΡ€Π΅Π΅ всСго, ΠΌΡ‹ Π±Ρ‹ Π²Ρ‹Π±Ρ€Π°Π»ΠΈ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²Ρ‹Π΄Π°Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ°Π»ΠΎ False Positive Π½Π° Ρ„ΠΎΠ½Π΅ своСго ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚Π°. Но Ρ€Π°Π·Π½ΠΈΡ†Π° Π² False Positive Rate ΠΌΠ΅ΠΆΠ΄Ρƒ этими двумя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ ΠΊΡ€Π°ΠΉΠ½Π΅ ΠΌΠ°Π»Π° β€” всСго 0.0019. Π­Ρ‚ΠΎ являСтся слСдствиСм Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ AUC-ROC измСряСт долю False Positive ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ True Negative ΠΈ Π² Π·Π°Π΄Π°Ρ‡Π°Ρ…, Π³Π΄Π΅ Π½Π°ΠΌ Π½Π΅ Ρ‚Π°ΠΊ Π²Π°ΠΆΠ΅Π½ Π²Ρ‚ΠΎΡ€ΠΎΠΉ (больший) класс, ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Π²Π°Ρ‚ΡŒ Π½Π΅ совсСм Π°Π΄Π΅ΠΊΠ²Π°Ρ‚Π½ΡƒΡŽ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρƒ ΠΏΡ€ΠΈ сравнСнии Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

Для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, вСрнСмся ΠΊ ΠΏΠΎΠ»Π½ΠΎΡ‚Π΅ ΠΈ точности :

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. f0fee92db0bbd42834e684013d6c7adb. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-f0fee92db0bbd42834e684013d6c7adb. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° f0fee92db0bbd42834e684013d6c7adb

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 525b482263b78da07ec0413edd70d16b. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-525b482263b78da07ec0413edd70d16b. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 525b482263b78da07ec0413edd70d16b

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. d912daf29a8d59b4641930add0b284d3. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-d912daf29a8d59b4641930add0b284d3. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° d912daf29a8d59b4641930add0b284d3

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 169a14cf303ee39cfc422a779e37b55d. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-169a14cf303ee39cfc422a779e37b55d. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 169a14cf303ee39cfc422a779e37b55d

Π—Π΄Π΅ΡΡŒ ΡƒΠΆΠ΅ Π·Π°ΠΌΠ΅Ρ‚Π½Π° сущСствСнная Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ двумя Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ β€” 0.855 Π² точности!

Precision ΠΈ recall Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для построСния ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΈ, Π°Π½Π°Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ AUC-ROC, находят ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ.

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

Π—Π΄Π΅ΡΡŒ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π½Π° ΠΌΠ°Π»Π΅Π½ΡŒΠΊΠΈΡ… датасСтах ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ PR-ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ чСрСсчур оптимистична, ΠΏΠΎΡ‚ΠΎΠΌΡƒ ΠΊΠ°ΠΊ вычисляСтся ΠΏΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρƒ Ρ‚Ρ€Π°ΠΏΠ΅Ρ†ΠΈΠΉ, Π½ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π² Ρ‚Π°ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π΄Π°Π½Π½Ρ‹Ρ… достаточно. Π—Π° подробностями ΠΎ Π²Π·Π°ΠΈΠΌΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡΡ… AUC-ROC ΠΈ AUC-PR ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒΡΡ сюда.

Logistic Loss

Особняком стоит логистичСская функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, опрСдСляСмая ΠΊΠ°ΠΊ:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. c54acbf01a8ad65e36a632819be32a2b. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-c54acbf01a8ad65e36a632819be32a2b. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° c54acbf01a8ad65e36a632819be32a2b

здСсь Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 8b1e9965f298b958fcd6ae9f77c60704. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-8b1e9965f298b958fcd6ae9f77c60704. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 8b1e9965f298b958fcd6ae9f77c60704β€” это ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 72195b0dbc8d5e1fbd3b06fd91ae2dba. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-72195b0dbc8d5e1fbd3b06fd91ae2dba. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 72195b0dbc8d5e1fbd3b06fd91ae2dba-ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 1e6829a256c8a2712f849dc1d2343b62. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-1e6829a256c8a2712f849dc1d2343b62. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 1e6829a256c8a2712f849dc1d2343b62β€” истинная ΠΌΠ΅Ρ‚ΠΊΠ° класса Π½Π° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 72195b0dbc8d5e1fbd3b06fd91ae2dba. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-72195b0dbc8d5e1fbd3b06fd91ae2dba. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 72195b0dbc8d5e1fbd3b06fd91ae2dba-ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Π° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ce38a83878bf16954ea60627fc7c66eb. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-ce38a83878bf16954ea60627fc7c66eb. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ce38a83878bf16954ea60627fc7c66ebΡ€Π°Π·ΠΌΠ΅Ρ€ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ.

ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΠΏΡ€ΠΎ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΡŽ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΡƒΠΆΠ΅ написано Π² Ρ€Π°ΠΌΠΊΠ°Ρ… поста ΠΏΡ€ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
Данная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° нСчасто выступаСт Π² бизнСс-трСбованиях, Π½ΠΎ часто β€” Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π½Π° kaggle.
Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ logloss ΠΊΠ°ΠΊ Π·Π°Π΄Π°Ρ‡Ρƒ максимизации accuracy ΠΏΡƒΡ‚Π΅ΠΌ ΡˆΡ‚Ρ€Π°Ρ„Π° Π·Π° Π½Π΅Π²Π΅Ρ€Π½Ρ‹Π΅ прСдсказания. Однако Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ logloss ΠΊΡ€Π°ΠΉΠ½Π΅ сильно ΡˆΡ‚Ρ€Π°Ρ„ΡƒΠ΅Ρ‚ Π·Π° ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ классификатора Π² Π½Π΅Π²Π΅Ρ€Π½ΠΎΠΌ ΠΎΡ‚Π²Π΅Ρ‚Π΅.

ΠžΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, ΠΊΠ°ΠΊ драматичСски выросла logloss ΠΏΡ€ΠΈ Π½Π΅Π²Π΅Ρ€Π½ΠΎΠΌ ΠΎΡ‚Π²Π΅Ρ‚Π΅ ΠΈ ΡƒΠ²Π΅Ρ€Π΅Π½Π½ΠΎΠΉ классификации!
Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ошибка Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ сущСствСнноС ΡƒΡ…ΡƒΠ΄ΡˆΠ΅Π½ΠΈΠ΅ ΠΎΠ±Ρ‰Π΅ΠΉ ошибки Π½Π° Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Π’Π°ΠΊΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ часто Π±Ρ‹Π²Π°ΡŽΡ‚ выбросами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½ΡƒΠΆΠ½ΠΎ Π½Π΅ Π·Π°Π±Ρ‹Π²Π°Ρ‚ΡŒ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ»ΠΈ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ.
Всё становится Π½Π° свои мСста, Ссли Π½Π°Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ Π³Ρ€Π°Ρ„ΠΈΠΊ logloss:

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. image loader. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-image loader. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° image loader

Π’ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‡Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ ΠΊ Π½ΡƒΠ»ΡŽ ΠΎΡ‚Π²Π΅Ρ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΡ€ΠΈ ground truth = 1, Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ошибки ΠΈ ΠΊΡ€ΡƒΡ‡Π΅ растёт кривая.

ΠŸΠΎΠ΄Ρ‹Ρ‚ΠΎΠΆΠΈΠΌ:

ΠŸΠΎΠ»Π΅Π·Π½Ρ‹Π΅ ссылки

Благодарности

Бпасибо mephistopheies ΠΈ madrugado Π·Π° ΠΏΠΎΠΌΠΎΡ‰ΡŒ Π² ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠšΡ€ΠΈΠ²Π°Ρ ошибок

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» ΠΈΠ· MachineLearning.

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

ΠšΡ€ΠΈΠ²Π°Ρ ошибок ΠΈΠ»ΠΈ ROC-кривая – графичСкая характСристика качСства Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ классификатора, Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π΄ΠΎΠ»ΠΈ Π²Π΅Ρ€Π½Ρ‹Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… классификаций ΠΎΡ‚ Π΄ΠΎΠ»ΠΈ Π»ΠΎΠΆΠ½Ρ‹Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… классификаций ΠΏΡ€ΠΈ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠΎΡ€ΠΎΠ³Π° Ρ€Π΅ΡˆΠ°ΡŽΡ‰Π΅Π³ΠΎ ΠΏΡ€Π°Π²ΠΈΠ»Π°. ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠΌ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ являСтся Π΅Ρ‘ ΠΈΠ½Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½Ρ‹ ошибки I ΠΈ II Ρ€ΠΎΠ΄Π°.

Π—Π°Π΄Π°Ρ‡Π° классификации

Для байСсовского классификатора ΠΏΡ€ΠΈ достаточно ΠΎΠ±Ρ‰ΠΈΡ… прСдполоТСниях Π΄ΠΎΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΡ€ΠΎΠ³Π° зависит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½Ρ‹ ошибок:

Π—Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ частным случаСм Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ байСсовского классификатора являСтся логистичСская рСгрСссия.

TPR ΠΈ FPR

ROC-кривая

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 180px RoC 1. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-180px RoC 1. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 180px RoC 1

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. magnify clip. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-magnify clip. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° magnify clip

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 180px RoC 2. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-180px RoC 2. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 180px RoC 2

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. magnify clip. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-magnify clip. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° magnify clip

ROC-кривая ΠΌΠΎΠ½ΠΎΡ‚ΠΎΠ½Π½ΠΎ Π½Π΅ ΡƒΠ±Ρ‹Π²Π°Π΅Ρ‚. Π§Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Π»Π΅ΠΆΠΈΡ‚ кривая, Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ качСство классификации.

На рисункС 1 ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° ROC-кривая, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π°Ρ Ρ…ΡƒΠ΄ΡˆΠ΅ΠΌΡƒ ΡΠ»ΡƒΡ‡Π°ΡŽ β€” Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ «случайного гадания». На рисункС 2 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΡ‘Π½ ΠΎΠ±Ρ‰ΠΈΠΉ случай. Π›ΡƒΡ‡ΡˆΠΈΠΉ случай β€” это кривая, проходящая Ρ‡Π΅Ρ€Π΅Π· Ρ‚ΠΎΡ‡ΠΊΠΈ

ROC-кривая ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ вычислСна ΠΏΠΎ любой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Однако ROC-кривая, вычислСнная ΠΏΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, являСтся оптимистично смСщённой Π²Π»Π΅Π²ΠΎ-Π²Π²Π΅Ρ€Ρ… вслСдствиС пСрСобучСния. Π’Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ этого смСщСния ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ довольно Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ, поэтому Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ всСгда ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ ΠΏΠΎ нСзависомой тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅.

ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ AUC

ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ AUC (Area Under Curve) являСтся Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ характСристикой качСства классификации, Π½Π΅ зависящСй ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½ ошибок. Π§Π΅ΠΌ большС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ AUC, Ρ‚Π΅ΠΌ Β«Π»ΡƒΡ‡ΡˆΠ΅Β» модСль классификации. Π”Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ классификации.

Алгоритм построСния ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ строит ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ Π·Π° ΠΎΠ±Ρ€Π°Ρ‰Π΅Π½ΠΈΠΉ ΠΊ дискриминантной Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

Π§ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ

Наряду с FPR ΠΈ TPR ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ спСцифичности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΠ·ΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ :

МодСль с высокой Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ часто Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Наоборот, модСль с высокой ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ Ρ‡Π°Ρ‰Π΅ Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Если Ρ€Π°ΡΡΡƒΠΆΠ΄Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… мСдицинской диагностики, Π³Π΄Π΅ модСль классификации ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² Π½Π° Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ Π·Π΄ΠΎΡ€ΠΎΠ²Ρ‹Ρ… называСтся диагностичСским тСстом, Ρ‚ΠΎ получится ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅:

Π˜ΡΡ‚ΠΎΡ€ΠΈΡ

Π’Π΅Ρ€ΠΌΠΈΠ½ опСрационная характСристика ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊΠ° (Receiver Operating Characteristic, ROC) ΠΏΡ€ΠΈΡˆΡ‘Π» ΠΈΠ· Ρ‚Π΅ΠΎΡ€ΠΈΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сигналов. Π­Ρ‚Ρƒ характСристику Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π²Π²Π΅Π»ΠΈ Π²ΠΎ врСмя II ΠΌΠΈΡ€ΠΎΠ²ΠΎΠΉ Π²ΠΎΠΉΠ½Ρ‹, послС пораТСния амСриканского Π²ΠΎΠ΅Π½Π½ΠΎΠ³ΠΎ Ρ„Π»ΠΎΡ‚Π° Π² ΠŸΡ‘Ρ€Π» Π₯Π°Ρ€Π±ΠΎΡ€Π΅ Π² 1941 Π³ΠΎΠ΄Ρƒ, ΠΊΠΎΠ³Π΄Π° Π±Ρ‹Π»Π° осознана ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности распознавания самолётов ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΈΠΊΠ° ΠΏΠΎ Ρ€Π°Π΄ΠΈΠΎΠ»ΠΎΠΊΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌΡƒ сигналу. ПозТС нашлись ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ примСнСния: мСдицинская диагностика, ΠΏΡ€ΠΈΡ‘ΠΌΠΎΡ‡Π½Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ качСства, ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΉ скоринг, прСдсказаниС Π»ΠΎΡΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΈ Ρ‚.Π΄.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠšΡ€ΠΈΠ²Π°Ρ ошибок

ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» ΠΈΠ· MachineLearning.

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

ΠšΡ€ΠΈΠ²Π°Ρ ошибок ΠΈΠ»ΠΈ ROC-кривая – графичСкая характСристика качСства Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ классификатора, Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ Π΄ΠΎΠ»ΠΈ Π²Π΅Ρ€Π½Ρ‹Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… классификаций ΠΎΡ‚ Π΄ΠΎΠ»ΠΈ Π»ΠΎΠΆΠ½Ρ‹Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… классификаций ΠΏΡ€ΠΈ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠΎΡ€ΠΎΠ³Π° Ρ€Π΅ΡˆΠ°ΡŽΡ‰Π΅Π³ΠΎ ΠΏΡ€Π°Π²ΠΈΠ»Π°. ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠΌ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ являСтся Π΅Ρ‘ ΠΈΠ½Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½Ρ‹ ошибки I ΠΈ II Ρ€ΠΎΠ΄Π°.

Π—Π°Π΄Π°Ρ‡Π° классификации

Для байСсовского классификатора ΠΏΡ€ΠΈ достаточно ΠΎΠ±Ρ‰ΠΈΡ… прСдполоТСниях Π΄ΠΎΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΡ€ΠΎΠ³Π° зависит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½Ρ‹ ошибок:

Π—Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ частным случаСм Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ байСсовского классификатора являСтся логистичСская рСгрСссия.

TPR ΠΈ FPR

ROC-кривая

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 180px RoC 1. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-180px RoC 1. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 180px RoC 1

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. magnify clip. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-magnify clip. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° magnify clip

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. 180px RoC 2. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-180px RoC 2. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° 180px RoC 2

Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. magnify clip. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ„ΠΎΡ‚ΠΎ. Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚-magnify clip. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° Roc кривая Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚. ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° magnify clip

ROC-кривая ΠΌΠΎΠ½ΠΎΡ‚ΠΎΠ½Π½ΠΎ Π½Π΅ ΡƒΠ±Ρ‹Π²Π°Π΅Ρ‚. Π§Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ Π»Π΅ΠΆΠΈΡ‚ кривая, Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ качСство классификации.

На рисункС 1 ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π° ROC-кривая, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π°Ρ Ρ…ΡƒΠ΄ΡˆΠ΅ΠΌΡƒ ΡΠ»ΡƒΡ‡Π°ΡŽ β€” Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ «случайного гадания». На рисункС 2 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΡ‘Π½ ΠΎΠ±Ρ‰ΠΈΠΉ случай. Π›ΡƒΡ‡ΡˆΠΈΠΉ случай β€” это кривая, проходящая Ρ‡Π΅Ρ€Π΅Π· Ρ‚ΠΎΡ‡ΠΊΠΈ

ROC-кривая ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ вычислСна ΠΏΠΎ любой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Однако ROC-кривая, вычислСнная ΠΏΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, являСтся оптимистично смСщённой Π²Π»Π΅Π²ΠΎ-Π²Π²Π΅Ρ€Ρ… вслСдствиС пСрСобучСния. Π’Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ этого смСщСния ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ довольно Ρ‚Ρ€ΡƒΠ΄Π½ΠΎ, поэтому Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ всСгда ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ ΠΏΠΎ нСзависомой тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅.

ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ AUC

ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ AUC (Area Under Curve) являСтся Π°Π³Ρ€Π΅Π³ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ характСристикой качСства классификации, Π½Π΅ зависящСй ΠΎΡ‚ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ Ρ†Π΅Π½ ошибок. Π§Π΅ΠΌ большС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ AUC, Ρ‚Π΅ΠΌ Β«Π»ΡƒΡ‡ΡˆΠ΅Β» модСль классификации. Π”Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ классификации.

Алгоритм построСния ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ строит ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ Π·Π° ΠΎΠ±Ρ€Π°Ρ‰Π΅Π½ΠΈΠΉ ΠΊ дискриминантной Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

Π§ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ

Наряду с FPR ΠΈ TPR ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ спСцифичности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΠ·ΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ :

МодСль с высокой Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ часто Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Наоборот, модСль с высокой ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ Ρ‡Π°Ρ‰Π΅ Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Если Ρ€Π°ΡΡΡƒΠΆΠ΄Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… мСдицинской диагностики, Π³Π΄Π΅ модСль классификации ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² Π½Π° Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ Π·Π΄ΠΎΡ€ΠΎΠ²Ρ‹Ρ… называСтся диагностичСским тСстом, Ρ‚ΠΎ получится ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅:

Π˜ΡΡ‚ΠΎΡ€ΠΈΡ

Π’Π΅Ρ€ΠΌΠΈΠ½ опСрационная характСристика ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊΠ° (Receiver Operating Characteristic, ROC) ΠΏΡ€ΠΈΡˆΡ‘Π» ΠΈΠ· Ρ‚Π΅ΠΎΡ€ΠΈΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сигналов. Π­Ρ‚Ρƒ характСристику Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π²Π²Π΅Π»ΠΈ Π²ΠΎ врСмя II ΠΌΠΈΡ€ΠΎΠ²ΠΎΠΉ Π²ΠΎΠΉΠ½Ρ‹, послС пораТСния амСриканского Π²ΠΎΠ΅Π½Π½ΠΎΠ³ΠΎ Ρ„Π»ΠΎΡ‚Π° Π² ΠŸΡ‘Ρ€Π» Π₯Π°Ρ€Π±ΠΎΡ€Π΅ Π² 1941 Π³ΠΎΠ΄Ρƒ, ΠΊΠΎΠ³Π΄Π° Π±Ρ‹Π»Π° осознана ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности распознавания самолётов ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½ΠΈΠΊΠ° ΠΏΠΎ Ρ€Π°Π΄ΠΈΠΎΠ»ΠΎΠΊΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌΡƒ сигналу. ПозТС нашлись ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ примСнСния: мСдицинская диагностика, ΠΏΡ€ΠΈΡ‘ΠΌΠΎΡ‡Π½Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ качСства, ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΉ скоринг, прСдсказаниС Π»ΠΎΡΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΈ Ρ‚.Π΄.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ROC ΠΊΡ€ΠΈΠ²Ρ‹Π΅ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ

ΠšΡ€ΠΈΠ²Π°Ρ ROC подписываСтся для ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ характСристичСской ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΏΡ€ΠΈΠ΅ΠΌΠ½ΠΈΠΊΠ°. ROC ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ°ΡŽΡ‚ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ классификационной ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ROC Curve стоит Π·Π° ΠŸΡ€ΠΈΠ΅ΠΌΠ½ΠΈΠΊ ΠžΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½Π°Ρ характСристичСская кривая ΠžΡ‚ΠΊΠ°Π· ROC ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ°ΡŽΡ‚ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ классификационной ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ROC Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ Π½Π°ΠΌ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠ° модСль для различСния ΠΌΠ΅ΠΆΠ΄Ρƒ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ классами, с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ вСроятности.

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ ΠΏΠΎΠΉΠΌΠ΅ΠΌ ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ROC, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ AUC ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации для понимания Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΊΡ€ΠΈΠ²ΡƒΡŽ ROC для ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ROC

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρƒ нас Π΅ΡΡ‚ΡŒ модСль логистичСской рСгрСссии, которая классифицируСт событиС ΠΊΠ°ΠΊ True ΠΈΠ»ΠΈ false. ΠœΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ для классификации Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΊΠ°ΠΊ TRUE ΠΈΠ»ΠΈ FALSE, составляСт 0,5 Π² логистичСской рСгрСссии, Π½ΠΎ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ это ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для соотвСтствия нашСй потрСбности.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, кривая ROC прСдставляСт собой Π³Ρ€Π°Ρ„ΠΈΠΊ Π»ΠΎΠΆΠ½ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ скорости (FPR) (оси x) ΠΏΡ€ΠΎΡ‚ΠΈΠ² истинной ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ скорости (TPR) (ось Y) для ряда Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π° ΠΎΡ‚ 0,0 Π΄ΠΎ 1,0.

ПониманиС TPR и FPR

Как ΡƒΠΆΠ΅ ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΎΡΡŒ, кривая ROC зависит ΠΎΡ‚ истинной ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ скорости ΠΈ Π»ΠΎΠΆΠ½ΠΎΠΉ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ скорости, посмотрим, Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΈ Π΅ΡΡ‚ΡŒ.

Π˜ΡΡ‚ΠΈΠ½Π½Π°Ρ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ: Π˜ΡΡ‚ΠΈΠ½Π½Π°Ρ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ рассчитываСтся ΠΊΠ°ΠΊ количСство истинных ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… пластов, Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Π½Π° сумму количСства истинных ΠΏΠΎΠ·ΠΈΡ‚ΠΈΠ²ΠΎΠ² ΠΈ количСства Π»ΠΎΠΆΠ½Ρ‹Ρ… Π½Π΅Π³Π°Ρ‚ΠΈΠ²ΠΎΠ².

ЛоТная ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ: Π›ΠΎΠΆΠ½ΠΎΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ рассчитываСтся ΠΊΠ°ΠΊ количСство Π»ΠΎΠΆΠ½Ρ‹Ρ… ΠΏΠΎΠ·ΠΈΡ‚ΠΈΠ²ΠΎΠ², Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… Π½Π° сумму количСства Π»ΠΎΠΆΠ½Ρ‹Ρ… срабатываний ΠΈ количСства истинных Π½Π΅Π³Π°Ρ‚ΠΈΠ²ΠΎΠ².

Для Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ Ρ€Π°Π·Π½Ρ‹Π΅ TPR ΠΈ FPR.

ΠŸΠΎΡ‡Π΅ΠΌΡƒ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ ROC ΠΊΡ€ΠΈΠ²Ρ‹Π΅?

ΠšΡ€ΠΈΠ²Ρ‹Π΅ ROC ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ ΠΏΠΎ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π°ΠΌ:

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΡƒΡŽ модСль, ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ΡŒ Π½Π°ΡˆΡƒ ΠΈΡΡ‚ΠΈΠ½Π½ΡƒΡŽ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ставку ΠΈ ΡΠ½ΠΈΠ·ΠΈΡ‚ΡŒ Π½Π°ΡˆΡƒ Π»ΠΎΠΆΠ½ΡƒΡŽ ΠΏΠΎΠ·ΠΈΡ‚ΠΈΠ²Π½ΡƒΡŽ ставку).

Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ наша модСль смоТСт ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΡ‚Π΄Π΅Π»ΠΈΡ‚ΡŒ классы. Π’Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ извСстны ΠΊΠ°ΠΊ ΡƒΠΌΠ΅Π»Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ это Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ достигаСтся.

МодСль Π±Π΅Π· Π½Π°Π²Ρ‹ΠΊΠΎΠ² Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΠΏΠΎΡ€ΠΎΠ³Π΅ прСдставлСна диагональной Π»ΠΈΠ½ΠΈΠ΅ΠΉ ΠΈΠ· Π½ΠΈΠΆΠ½Π΅ΠΉ Π»Π΅Π²ΠΎΠΉ части Π³Ρ€Π°Ρ„ΠΈΠΊΠ° ΠΊ Π²Π΅Ρ€Ρ…Π½Π΅ΠΉ справа (синяя линия Π² Π²Ρ‹ΡˆΠ΅ΡƒΠΊΠ°Π·Π°Π½Π½ΠΎΠΉ Ρ„ΠΈΠ³ΡƒΡ€Π΅). Π’Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ AUC 0,5. Π’Π°ΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π²Π½Ρ‹ΠΉ TPR ΠΈ FPR для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ значСния ΠΏΠΎΡ€ΠΎΠ³Π°.

ΠŸΠΎΡΡ‚Ρ€ΠΎΠ΅Π½ΠΈΠ΅ ΠΊΡ€ΠΈΠ²Ρ‹Ρ… ROC Π² Python

Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ построим Π±ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΉ классификатор ΠΈ ΡΡŽΠΆΠ΅Ρ‚, это кривая ROC, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ процСсс.

ΠœΠΎΠ΄ΡƒΠ»ΡŒ Sklearn прСдоставляСт Π½Π°ΠΌ Roc_curve Ѐункция, которая Π²ΠΎΠ·Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ Π»ΠΎΠΆΠ½Ρ‹Π΅ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ставки ΠΈ истинныС ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ставки Π² качСствС Π²Ρ‹Π²ΠΎΠ΄Π°.

Π’Π°ΠΌ Π²Ρ‹ ΠΈΠ΄Π΅Ρ‚Π΅, Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, ΠΊΠ°ΠΊ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΊΡ€ΠΈΠ²ΡƒΡŽ ROC для ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации.

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΠΊΡ€ΠΈΠ²Ρ‹Ρ… ROC ΠΈ ΠΏΠΎΡ‡Π΅ΠΌΡƒ Π²Π°ΠΆΠ½ΠΎ. Π£ нас Ρ‚Π°ΠΊΠΆΠ΅ Π΅ΡΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ прСдставлСниС ΠΎ истинных ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… показатСлях ΠΈ Π»ΠΎΠΆΠ½Ρ‹Ρ… ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… показатСлях ΠΈ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΎΡ‚ Π½ΠΈΡ… зависит ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ROC. НаконСц ΠΌΡ‹ смотрСли Π² ΠΊΠΎΠ΄, Ρ‡Ρ‚ΠΎΠ±Ρ‹ с участиСм ROC ΠΊΡ€ΠΈΠ²Ρ‹Ρ… для ΠΌΠΎΠ΄Π΅Π»ΠΈ логистичСской рСгрСссии.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *