Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

УмСньшСниС размСрности

Под ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠ΅ΠΌ размСрности (Π°Π½Π³Π». dimensionality reduction) Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ подразумСваСтся ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠ΅ числа ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…. НаличиС Π² Π½Π΅ΠΌ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹Ρ…, Π½Π΅ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΈΠ»ΠΈ слабо ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠ½ΠΈΠ·ΠΈΡ‚ΡŒ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π° послС Ρ‚Π°ΠΊΠΎΠ³ΠΎ прСобразования ΠΎΠ½Π° упрощаСтся, ΠΈ соотвСтствСнно ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ Ρ€Π°Π·ΠΌΠ΅Ρ€ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Π² памяти ΠΈ ускоряСтся Ρ€Π°Π±ΠΎΡ‚Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² ML Π½Π° Π½Π΅ΠΌ. УмСньшСниС размСрности ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ осущСствлСно ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌΠΈ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (Π°Π½Π³Π». feature selection) ΠΈΠ»ΠΈ выдСлСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (Π°Π½Π³Π». feature extraction).

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅

Π’Ρ‹Π±ΠΎΡ€ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠœΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ подмноТСство исходного Π½Π°Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², избавляясь ΠΎΡ‚ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹Ρ… ΠΈ слабо ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Ρ‹Ρ…. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ прСимущСства этого класса Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ²:

ВсС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° 5 Ρ‚ΠΈΠΏΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ Π²Ρ‹Π±ΠΎΡ€Π° Π»ΠΈΡˆΠ½ΠΈΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π€ΠΈΠ»ΡŒΡ‚Ρ€Ρ‹ [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π€ΠΈΠ»ΡŒΡ‚Ρ€Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ:

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠΌ Π³Ρ€ΡƒΠΏΠΏΡ‹ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² являСтся простота вычислСния рСлСвантности ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ нСдостатком Π² Ρ‚Π°ΠΊΠΎΠΌ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π΅ являСтся ΠΈΠ³Π½ΠΎΡ€ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… зависимостСй ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ.

ΠžΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

ΠžΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ (Π°Π½Π³Π». wrapper methods) находят подмноТСство искомых ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ классификатор ΠΊΠ°ΠΊ источник ΠΎΡ†Π΅Π½ΠΊΠΈ качСства Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‚.Π΅. этот процСсс являСтся цикличСским ΠΈ продолТаСтся Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ достигнуты Π·Π°Π΄Π°Π½Π½Ρ‹Π΅ условия останова. ΠžΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ зависимости ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ, Ρ‡Ρ‚ΠΎ являСтся прСимущСством ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°ΠΌΠΈ, ΠΊ Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, Π½ΠΎ вычислСния Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ врСмя, ΠΈ ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ΡΡ риск пСрСобучСния.

БущСствуСт нСсколько Ρ‚ΠΈΠΏΠΎΠ² ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ²: Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ·ΠΌΠ΅Π½ΡΡŽΡ‚ мноТСство ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌΡƒ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ, Π° Ρ‚Π°ΠΊΠΆΠ΅ Ρ€Π°Π½Π΄ΠΎΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ гСнСтичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ для Π²Ρ‹Π±ΠΎΡ€Π° искомого подмноТСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π‘Ρ€Π΅Π΄ΠΈ Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² самыми простыми ΡΠ²Π»ΡΡŽΡ‚ΡΡ:

ВстроСнныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π“Ρ€ΡƒΠΏΠΏΠ° встроСнных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² (Π°Π½Π³Π». embedded methods) ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹, Π½ΠΎ для Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ нСпосрСдствСнно структуру Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ классификатора. Π’ ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… классификатор слуТит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π° Π΄Π°Π½Π½ΠΎΠΌ мноТСствС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ встроСнныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΊΠ°ΠΊΡƒΡŽ-Ρ‚ΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°Ρ…, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ классификаторы ΠΏΡ€ΠΈΡΠ²Π°ΠΈΠ²Π°ΡŽΡ‚ Π²ΠΎ врСмя обучСния.

Одним ΠΈΠ· ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² встроСнного ΠΌΠ΅Ρ‚ΠΎΠ΄Π° являСтся рСализация Π½Π° случайном лСсС: ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ Π΄Π΅Ρ€Π΅Π²Ρƒ Π½Π° Π²Ρ…ΠΎΠ΄ ΠΏΠΎΠ΄Π°ΡŽΡ‚ΡΡ случайноС подмноТСство Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· датасСта с ΠΊΠ°ΠΊΠΈΠΌ-Ρ‚ΠΎ случайным Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Π² процСссС обучСния ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ ΠΈΠ· Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ «Π³ΠΎΠ»ΠΎΡΠΎΠ²Π°Π½ΠΈΠ΅» Π·Π° Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½ΠΎΡΡ‚ΡŒ Π΅Π³ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², эти Π΄Π°Π½Π½Ρ‹Π΅ Π°Π³Ρ€Π΅Π³ΠΈΡ€ΡƒΡŽΡ‚ΡΡ, ΠΈ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ значСния ваТности ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…. Π”Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠΈΠΉ Π²Ρ‹Π±ΠΎΡ€ Π½ΡƒΠΆΠ½Ρ‹Ρ… Π½Π°ΠΌ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΡƒΠΆΠ΅ зависит ΠΎΡ‚ Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠ³ΠΎ критСрия ΠΎΡ‚Π±ΠΎΡ€Π°.

ВстроСнныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ прСимущСства ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΈ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π±ΠΎΠ»Π΅Π΅ эффСктивными, ΠΏΡ€ΠΈ этом Π½Π° ΠΎΡ‚Π±ΠΎΡ€ тратится мСньшС Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ риск пСрСобучСния, Π½ΠΎ Ρ‚.ΠΊ. ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π±Ρ‹Π» ΠΎΡ‚ΠΎΠ±Ρ€Π°Π½ Π½Π° основС Π·Π½Π°Π½ΠΈΠΉ ΠΎ классификаторС, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ для Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ классификатора это мноТСство ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΡƒΠΆΠ΅ Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π°ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΆΠ΅ Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹ΠΌ.

Π”Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π•ΡΡ‚ΡŒ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²: Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½Ρ‹Π΅ (Π°Π½Π³Π». hybrid methods) ΠΈ ансамблСвыС (Π°Π½Π³Π». ensemble methods). Π“ΠΈΠ±Ρ€ΠΈΠ΄Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ нСсколько Ρ€Π°Π·Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ мноТСство Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ², Π° ΠΏΠΎΡ‚ΠΎΠΌ Π·Π°ΠΏΡƒΡΠΊΠ°ΡŽΡ‚ ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹ΠΉ ΠΈΠ»ΠΈ встроСнный ΠΌΠ΅Ρ‚ΠΎΠ΄. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΡΠΎΡ‡Π΅Ρ‚Π°ΡŽΡ‚ Π² сСбС прСимущСства сразу Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², ΠΈ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΏΠΎΠ²Ρ‹ΡˆΠ°ΡŽΡ‚ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

АнсамблСвыС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ большС для Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… с ΠΎΡ‡Π΅Π½ΡŒ большим числом ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π’ Π΄Π°Π½Π½ΠΎΠΌ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π΅ для Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ мноТСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² создаСтся нСсколько подмноТСств ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΈ эти Π³Ρ€ΡƒΠΏΠΏΡ‹ ΠΊΠ°ΠΊΠΈΠΌ-Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π°Π±ΠΎΡ€ самых Ρ€Π΅Π»Π΅Π²Π°Π½Ρ‚Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π­Ρ‚ΠΎ довольно гибкая Π³Ρ€ΡƒΠΏΠΏΠ° ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², Ρ‚.ΠΊ. для Π½Π΅Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ способы Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈ объСдинСния ΠΈΡ… подмноТСств.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΊΠΎΠ΄Π° scikit-learn [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π°, Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΡŽΡ‰Π΅Π³ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° Π½Π° основС коэффициСнта Ρ€Π°Π½Π³ΠΎΠ²ΠΎΠΉ коррСляции:

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π°, Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΡŽΡ‰Π΅Π³ΠΎ SVM-RFE wrapper:

Π’Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

Π”Ρ€ΡƒΠ³ΠΈΠΌ способом ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… являСтся Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π­Ρ‚ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΊΠ°ΠΊΠΈΠΌ-Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ ΠΈΠ· ΡƒΠΆΠ΅ исходных ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π½ΠΎΠ²Ρ‹Π΅, всС Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ пространство Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ Π΅Π³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΈ тСряя Π² рСпрСзСнтативности Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚.ΠΊ. становится нСпонятно, Π·Π° Ρ‡Ρ‚ΠΎ ΠΎΡ‚Π²Π΅Ρ‡Π°ΡŽΡ‚ Π½ΠΎΠ²Ρ‹Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ. ВсС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ feature extraction ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅.

Одним ΠΈΠ· самых извСстных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ выдСлСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² являСтся PCA [Π½Π° 28.01.19 Π½Π΅ создан] (Principal Component Analysis, рус. ΠΌΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚). Основной ΠΈΠ΄Π΅Π΅ΠΉ этого ΠΌΠ΅Ρ‚ΠΎΠ΄Π° являСтся поиск Ρ‚Π°ΠΊΠΎΠΉ гипСрплоскости, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΏΡ€ΠΈ ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΉ ΠΏΡ€ΠΎΠ΅ΠΊΡ†ΠΈΠΈ всСх ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² максимизируСтся диспСрсия. Π”Π°Π½Π½ΠΎΠ΅ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΎ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ сингулярного разлоТСния ΠΌΠ°Ρ‚Ρ€ΠΈΡ† ΠΈ создаСт ΠΏΡ€ΠΎΠ΅ΠΊΡ†ΠΈΡŽ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π° Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½Ρ‹Π΅ плоскости, поэтому ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ находится Π² ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ….

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π° scikit-learn [ ΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ]

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ выдСлСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ PCA Π² scikit-learn:

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠžΠ±Π·ΠΎΡ€ Π½ΠΎΠ²ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности UMAP. Π”Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΠΈ ΠΎΠ½ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈ быстрСС, Ρ‡Π΅ΠΌ t-SNE?

ΠŸΡ€ΠΈΠ²Π΅Ρ‚, Π₯Π°Π±Ρ€! Π—Π°Π΄Π°Ρ‡Π° сниТСния размСрности являСтся ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π²Π°ΠΆΠ½Π΅ΠΉΡˆΠΈΡ… Π² Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡƒΡ‚ΡŒ Π² Π΄Π²ΡƒΡ… ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… случаях. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π² цСлях Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ: ΠΏΠ΅Ρ€Π΅Π΄ Ρ‚Π΅ΠΌ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŽ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π° ΠΈΡ… структуру, ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ² Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΈ спроСцировав ΠΈΡ… Π½Π° Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΡƒΡŽ ΠΈΠ»ΠΈ Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½ΡƒΡŽ ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности ΠΏΠΎΠ»Π΅Π·Π½ΠΎ для ΠΏΡ€Π΅Π΄ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π² модСлях машинного обучСния, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ Π½Π΅ΡƒΠ΄ΠΎΠ±Π½ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π½Π° сотнС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², срСди ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ мноТСство Π·Π°ΡˆΡƒΠΌΠ»Π΅Π½Π½Ρ‹Ρ… ΠΈ/ΠΈΠ»ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ зависимых, ΠΎΡ‚ Π½ΠΈΡ… Π½Π°ΠΌ, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ, Ρ…ΠΎΡ‚Π΅Π»ΠΎΡΡŒ Π±Ρ‹ ΠΈΠ·Π±Π°Π²ΠΈΡ‚ΡŒΡΡ. НаконСц, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠ΅ размСрности пространства Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ускоряСт ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π° всС ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ врСмя β€” это наш самый Ρ†Π΅Π½Π½Ρ‹ΠΉ рСсурс.

UMAP (Uniform Manifold Approximation and Projection) β€” это Π½ΠΎΠ²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности, Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° с Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Π²Ρ‹ΡˆΠ»Π° совсСм Π½Π΅Π΄Π°Π²Π½ΠΎ. Авторы Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ UMAP способСн Π±Ρ€ΠΎΡΠΈΡ‚ΡŒ Π²Ρ‹Π·ΠΎΠ² соврСмСнным модСлям сниТСния размСрности, Π² частности, t-SNE, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π° сСгодняшний дСнь являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ популярным. По Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌ ΠΈΡ… исслСдований, Ρƒ UMAP Π½Π΅Ρ‚ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΉ Π½Π° Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ исходного пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ, ΠΎΠ½ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ быстрСС ΠΈ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ эффСктивСн, Ρ‡Π΅ΠΌ t-SNE, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π»ΡƒΡ‡ΡˆΠ΅ справляСтся с Π·Π°Π΄Π°Ρ‡Π΅ΠΉ пСрСноса глобальной структуры Π΄Π°Π½Π½Ρ‹Ρ… Π² Π½ΠΎΠ²ΠΎΠ΅, ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½Π½ΠΎΠ΅ пространство.

Π’ Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ постараСмся Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΈΠ· сСбя прСдставляСт UMAP, ΠΊΠ°ΠΊ Π½Π°ΡΡ‚Ρ€Π°ΠΈΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΈ, Π½Π°ΠΊΠΎΠ½Π΅Ρ†, ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ, Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΠΈ ΠΎΠ½ ΠΈΠΌΠ΅Π΅Ρ‚ прСимущСства ΠΏΠ΅Ρ€Π΅Π΄ t-SNE.

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

НСмного Ρ‚Π΅ΠΎΡ€ΠΈΠΈ

Алгоритмы пониТСния размСрности ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° 2 основныС Π³Ρ€ΡƒΠΏΠΏΡ‹: ΠΎΠ½ΠΈ ΠΏΡ‹Ρ‚Π°ΡŽΡ‚ΡΡ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π»ΠΈΠ±ΠΎ Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½ΡƒΡŽ структуру Π΄Π°Π½Π½Ρ‹Ρ…, Π»ΠΈΠ±ΠΎ Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹Π΅ расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ. К ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ относятся Ρ‚Π°ΠΊΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΊΠ°ΠΊ ΠœΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ (PCA) ΠΈ MDS (Multidimensional Scaling), Π° ΠΊΠΎ Π²Ρ‚ΠΎΡ€Ρ‹ΠΌ β€” t-SNE, ISOMAP, LargeVis ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅. UMAP относится ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΊ послСдним ΠΈ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ схоТиС с t-SNE Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ для Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ понимания ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΎΠ² Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° трСбуСтся сильная матСматичСская ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠ°, Π·Π½Π°Π½ΠΈΠ΅ Ρ€ΠΈΠΌΠ°Π½ΠΎΠ²ΠΎΠΉ Π³Π΅ΠΎΠΌΠ΅Ρ‚Ρ€ΠΈΠΈ ΠΈ Ρ‚ΠΎΠΏΠΎΠ»ΠΎΠ³ΠΈΠΈ, ΠΌΡ‹ опишСм лишь ΠΎΠ±Ρ‰ΡƒΡŽ идСю ΠΌΠΎΠ΄Π΅Π»ΠΈ UMAP, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° Π΄Π²Π° основных шага. На ΠΏΠ΅Ρ€Π²ΠΎΠΌ этапС ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅ΠΌ пространство, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΏΠΎ Π½Π°ΡˆΠ΅ΠΌΡƒ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΡŽ ΠΈ находятся Π΄Π°Π½Π½Ρ‹Π΅. Π•Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Π΄Π°Ρ‚ΡŒ Π°ΠΏΡ€ΠΈΠΎΡ€ΠΈ (ΠΊΠ°ΠΊ просто Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности), Π»ΠΈΠ±ΠΎ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ…. А Π½Π° Π²Ρ‚ΠΎΡ€ΠΎΠΌ шагС пытаСмся ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠ· ΠΎΡ†Π΅Π½Π΅Π½Π½ΠΎΠ³ΠΎ Π½Π° ΠΏΠ΅Ρ€Π²ΠΎΠΌ этапС пространства Π² Π½ΠΎΠ²ΠΎΠ΅, мСньшСй размСрности.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ примСнСния

Π˜Ρ‚Π°ΠΊ, Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ UMAP ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡƒ-Π½ΠΈΠ±ΡƒΠ΄ΡŒ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ сравним Π΅Π³ΠΎ качСство Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ с t-SNE. Наш Π²Ρ‹Π±ΠΎΡ€ ΠΏΠ°Π» Π½Π° датасСт Fashion MNIST, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² сСбя 70000 Ρ‡Π΅Ρ€Π½ΠΎ-Π±Π΅Π»Ρ‹Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ ΠΎΠ΄Π΅ΠΆΠ΄Ρ‹ ΠΏΠΎ 10 классам: Ρ„ΡƒΡ‚Π±ΠΎΠ»ΠΊΠΈ, Π±Ρ€ΡŽΠΊΠΈ, свитСры, ΠΏΠ»Π°Ρ‚ΡŒΡ, кроссовки ΠΈ Ρ‚.Π΄. КаТдая ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€ 28×28 пиксСлСй ΠΈΠ»ΠΈ 784 пиксСля всСго. Они ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ ΡΠ²Π»ΡΡ‚ΡŒΡΡ Ρ„ΠΈΡ‡Π°ΠΌΠΈ Π² нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π˜Ρ‚Π°ΠΊ, ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ UMAP Π½Π° Python для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ наши ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Ρ‹ ΠΎΠ΄Π΅ΠΆΠ΄Ρ‹ Π½Π° Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠΉ плоскости. Π—Π°Π΄Π°Π΄ΠΈΠΌ количСство сосСдСй, Ρ€Π°Π²Π½ΠΎΠ΅ 5, Π° ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ оставим ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ. Π˜Ρ… ΠΌΡ‹ обсудим Ρ‡ΡƒΡ‚ΡŒ ΠΏΠΎΠ·ΠΆΠ΅.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠΌ прСобразования стали Π΄Π²Π° Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Ρ‚ΠΎΠΉ ΠΆΠ΅ Π΄Π»ΠΈΠ½Ρ‹, Ρ‡Ρ‚ΠΎ ΠΈ исходный датасСт. Π’ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ эти Π²Π΅ΠΊΡ‚ΠΎΡ€Π° ΠΈ посмотрим, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ ΡƒΠ΄Π°Π»ΠΎΡΡŒ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ структуру Π΄Π°Π½Π½Ρ‹Ρ…:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Как Π²ΠΈΠ΄Π½ΠΎ, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ справляСтся Π²ΠΏΠΎΠ»Π½Π΅ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΈ Β«Π½Π΅ растСрял» Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Ρ†Π΅Π½Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, которая ΠΎΡ‚Π»ΠΈΡ‡Π°Π΅Ρ‚ ΠΎΠ΄ΠΈΠ½ Π²ΠΈΠ΄ ΠΎΠ΄Π΅ΠΆΠ΄Ρ‹ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ. Π’Π°ΠΊΠΆΠ΅ ΠΎ качСствС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ ΠΈ Ρ‚ΠΎΡ‚ Ρ„Π°ΠΊΡ‚, Ρ‡Ρ‚ΠΎ UMAP ΠΎΡ‚Π΄Π΅Π»ΠΈΠ» ΠΎΠ±ΡƒΠ²ΡŒ, ΠΎΠ΄Π΅ΠΆΠ΄Ρƒ для Ρ‚ΡƒΠ»ΠΎΠ²ΠΈΡ‰Π° ΠΈ Π±Ρ€ΡŽΠΊΠΈ Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°, понимая, Ρ‡Ρ‚ΠΎ это ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Ρ€Π°Π·Π½Ρ‹Π΅ Π²Π΅Ρ‰ΠΈ. ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, Π΅ΡΡ‚ΡŒ ΠΈ ошибки. К ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, модСль Ρ€Π΅ΡˆΠΈΠ»Π°, Ρ‡Ρ‚ΠΎ Ρ€ΡƒΠ±Π°ΡˆΠΊΠ° ΠΈ свитСр β€” это ΠΎΠ΄Π½ΠΎ ΠΈ Ρ‚ΠΎ ΠΆΠ΅.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ посмотрим, ΠΊΠ°ΠΊ с этим ΠΆΠ΅ Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ… управится t-SNE. Для этого Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Multicore TSNE β€” ΡΠ°ΠΌΡƒΡŽ Π±Ρ‹ΡΡ‚Ρ€ΡƒΡŽ (Π΄Π°ΠΆΠ΅ Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ядра) срСди всСх Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

T-SNE ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ схоТиС с UMAP Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΈ допускаСт Ρ‚Π΅ ΠΆΠ΅ ошибки. Однако, Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΈ ΠΎΡ‚ UMAP, t-SNE Π½Π΅ Ρ‚Π°ΠΊ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ Π²ΠΈΠ΄Ρ‹ ΠΎΠ΄Π΅ΠΆΠ΄Ρ‹ Π² ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ Π³Ρ€ΡƒΠΏΠΏΡ‹: Π±Ρ€ΡŽΠΊΠΈ, Π²Π΅Ρ‰ΠΈ для Ρ‚ΡƒΠ»ΠΎΠ²ΠΈΡ‰Π° ΠΈ для Π½ΠΎΠ³ находятся Π±Π»ΠΈΠ·ΠΊΠΎ Π΄Ρ€ΡƒΠ³ ΠΊ Π΄Ρ€ΡƒΠ³Ρƒ. Однако Π² Ρ†Π΅Π»ΠΎΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΡΠΏΡ€Π°Π²ΠΈΠ»ΠΈΡΡŒ с Π·Π°Π΄Π°Ρ‡Π΅ΠΉ ΠΈ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ Π²ΠΎΠ»Π΅Π½ Π½Π° свой вкус Π΄Π΅Π»Π°Ρ‚ΡŒ Π²Ρ‹Π±ΠΎΡ€ Π² ΠΏΠΎΠ»ΡŒΠ·Ρƒ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ. МоТно Π±Ρ‹Π»ΠΎ, Ссли Π±Ρ‹ Π½Π΅ ΠΎΠ΄Π½ΠΎ Β«Π½ΠΎΒ».

Π­Ρ‚ΠΎ Β«Π½ΠΎΒ» Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² скорости обучСния. На сСрвСрС с 4 ядрами Intel Xeon E5- 2690v3, 2,6 Π“Ρ† ΠΈ 16 Π“Π± ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти Π½Π° Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… Ρ€Π°Π·ΠΌΠ΅Ρ€Π° 70000Ρ…784 UMAP обучился Π·Π° 4 ΠΌΠΈΠ½ΡƒΡ‚Ρ‹ ΠΈ 21 сСкунду, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ t-SNE ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎΡΡŒ Π½Π° это ΠΏΠΎΡ‡Ρ‚ΠΈ Π² 5 Ρ€Π°Π· большС Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ: 20 ΠΌΠΈΠ½ΡƒΡ‚, 14 сСкунд. Π’ΠΎ Π΅ΡΡ‚ΡŒ UMAP Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ эффСктивСн, Ρ‡Ρ‚ΠΎ Π΄Π°Π΅Ρ‚ Π΅ΠΌΡƒ ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ прСимущСство ΠΏΠ΅Ρ€Π΅Π΄ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ, Π² Ρ‚ΠΎΠΌ числС ΠΈ ΠΏΠ΅Ρ€Π΅Π΄ t-SNE.

ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°

Число сосСдСй β€” n_neighbors. Π’Π°Ρ€ΡŒΠΈΡ€ΡƒΡ этот ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π²Π°ΠΆΠ½Π΅Π΅ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π² Π½ΠΎΠ²ΠΎΠΌ пространствСнном прСдставлСнии Π΄Π°Π½Π½Ρ‹Ρ…: Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½ΡƒΡŽ ΠΈΠ»ΠΈ Π»ΠΎΠΊΠ°Π»ΡŒΠ½ΡƒΡŽ структуру Π΄Π°Π½Π½Ρ‹Ρ…. МалСнькиС значСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° ΠΎΠ·Π½Π°Ρ‡Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ, ΠΏΡ‹Ρ‚Π°ΡΡΡŒ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ пространство, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ распрСдСлСны Π΄Π°Π½Π½Ρ‹Π΅, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ограничиваСтся ΠΌΠ°Π»ΠΎΠΉ ΠΎΠΊΡ€Π΅ΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ Π²ΠΎΠΊΡ€ΡƒΠ³ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ пытаСтся ΡƒΠ»ΠΎΠ²ΠΈΡ‚ΡŒ Π»ΠΎΠΊΠ°Π»ΡŒΠ½ΡƒΡŽ структуру Π΄Π°Π½Π½Ρ‹Ρ… (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π² ΡƒΡ‰Π΅Ρ€Π± ΠΎΠ±Ρ‰Π΅ΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Π΅). Π‘ Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны большиС значСния n_neighbors Π·Π°ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ UMAP ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠΈ Π² большСй окрСстности, сохраняя Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½ΡƒΡŽ структуру Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ упуская Π΄Π΅Ρ‚Π°Π»ΠΈ.

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΠΌ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ нашСго датасСта, ΠΊΠ°ΠΊ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ n_neighbors влияСт Π½Π° качСство ΠΈ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Из Π΄Π°Π½Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρ‹ ΠΌΠΎΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ нСсколько Π²Ρ‹Π²ΠΎΠ΄ΠΎΠ²:

ВСрнСмся ΠΊ Π½Π°ΡˆΠ΅ΠΌΡƒ датасСту ΠΈ ΠΎΡ†Π΅Π½ΠΈΠΌ влияниС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° min_dist. Π—Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ n_neighbors Π±ΡƒΠ΄Π΅Ρ‚ фиксированным ΠΈ Ρ€Π°Π²Π½Ρ‹ΠΌ 5:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Как ΠΈ оТидалось, ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ значСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ мСньшСй стСпСни кластСризации, Π΄Π°Π½Π½Ρ‹Π΅ ΡΠΎΠ±ΠΈΡ€Π°ΡŽΡ‚ΡΡ Π² ΠΊΡƒΡ‡Ρƒ ΠΈ различия ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ ΡΡ‚ΠΈΡ€Π°ΡŽΡ‚ΡΡ. Π˜Π½Ρ‚Π΅Ρ€Π΅ΡΠ½ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ минимальном Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ min_dist Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ пытаСтся Π½Π°ΠΉΡ‚ΠΈ различия Π²Π½ΡƒΡ‚Ρ€ΠΈ кластСров ΠΈ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΈΡ… Π½Π° Π΅Ρ‰Π΅ Π±ΠΎΠ»Π΅Π΅ ΠΌΠ΅Π»ΠΊΠΈΠ΅ Π³Ρ€ΡƒΠΏΠΏΡ‹.

ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠ° расстояния β€” metric. ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ metric опрСдСляСт, ΠΊΠ°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π±ΡƒΠ΄ΡƒΡ‚ рассчитаны расстояния Π² пространствС исходных Π΄Π°Π½Π½Ρ‹Ρ…. По ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ UMAP ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ всСвозмоТныС расстояния, ΠΎΡ‚ Минковского Π΄ΠΎ Π₯эмминга. Π’Ρ‹Π±ΠΎΡ€ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ зависит ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌ эти Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΈΡ… Ρ‚ΠΈΠΏΠ°. К ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, работая с тСкстовой ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ, ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ косинусноС расстояниС (metric=’cosine’).

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΠΌ ΠΈΠ³Ρ€Π°Ρ‚ΡŒ с нашим датасСтом ΠΈ ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

По Π΄Π°Π½Π½Ρ‹ΠΌ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ°ΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠ±Π΅Π΄ΠΈΡ‚ΡŒΡΡ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Π±ΠΎΡ€ ΠΌΠ΅Ρ€Ρ‹ расстояния ΠΎΡ‡Π΅Π½ΡŒ сильно влияСт Π½Π° ΠΈΡ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, поэтому, ΠΊ Π΅Π΅ Π²Ρ‹Π±ΠΎΡ€Ρƒ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ отвСтствСнно. Если ΠΆΠ΅ Π²Ρ‹ Π½Π΅ ΡƒΠ²Π΅Ρ€Π΅Π½Ρ‹, ΠΊΠ°ΠΊΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ ΠΈΠ· всСго многообразия Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ, Ρ‚ΠΎ расстояниС Π•Π²ΠΊΠ»ΠΈΠ΄Π° являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ бСзопасным Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠΌ (стоит ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ Π² UMAP).

Π Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠ³ΠΎ пространства β€” n_components. Π’ΡƒΡ‚ всС ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ: ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ опрСдСляСт Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ пространства. Если Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅, Ρ‚ΠΎ слСдуСт Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ 2 ΠΈΠ»ΠΈ 3. Если ΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½Π½Ρ‹Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π² качСствС Ρ„ΠΈΡ‡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΈ большС.

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

UMAP Π±Ρ‹Π» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½ совсСм Π½Π΅Π΄Π°Π²Π½ΠΎ ΠΈ постоянно ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΡƒΠ΅Ρ‚ΡΡ, ΠΎΠ΄Π½Π°ΠΊΠΎ ΡƒΠΆΠ΅ сСйчас ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΏΠΎ качСству Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΎΠ½ Π½Π΅ уступаСт Π΄Ρ€ΡƒΠ³ΠΈΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ ΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π½Π°ΠΊΠΎΠ½Π΅Ρ†, Ρ€Π΅ΡˆΠΈΡ‚ ΠΎΡΠ½ΠΎΠ²Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ соврСмСнных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности β€” ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒ обучСния.

НапослСдок, посмотритС, ΠΊΠ°ΠΊ UMAP смог Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Google News, состоящий ΠΈΠ· 3 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²-слов. ВрСмя обучСния составило 200 ΠΌΠΈΠ½ΡƒΡ‚, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ t-SNE Π½Π° это ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎΡΡŒ нСсколько Π΄Π½Π΅ΠΉ:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

ΠšΡΡ‚Π°Ρ‚ΠΈ, рисунок Π±Ρ‹Π» построСн с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ для Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… datashader, ΠΎ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ расскаТСм Π²Π°ΠΌ Π² ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… статСй!

Π‘Ρ€Π΅Π΄ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² сниТСния размСрности Π΅ΡΡ‚ΡŒ SVD, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ ΠΌΡ‹ удСляСм Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π² контСкстС построСния Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ Π½Π° нашСй ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ΅ β€œΠ‘ΠΏΠ΅Ρ†ΠΈΠ°Π»ΠΈΡΡ‚ ΠΏΠΎ большим Π΄Π°Π½Π½Ρ‹ΠΌ 8.0”, которая стартуСт ΡƒΠΆΠ΅ 22 ΠΌΠ°Ρ€Ρ‚Π°.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Как ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ количСство ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠΉ ΠΈ ΠΈΠ·Π²Π»Π΅Ρ‡ΡŒ ΠΈΠ· этого ΠΏΠΎΠ»ΡŒΠ·Ρƒ

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрностиБначала я Ρ…ΠΎΡ‚Π΅Π» чСстно ΠΈ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ Π½Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°Ρ… сниТСния размСрности Π΄Π°Π½Π½Ρ‹Ρ… β€” PCA, ICA, NMF, Π²Ρ‹Π²Π°Π»ΠΈΡ‚ΡŒ ΠΊΡƒΡ‡Ρƒ Ρ„ΠΎΡ€ΠΌΡƒΠ» ΠΈ ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊΡƒΡŽ ΠΆΠ΅ Π²Π°ΠΆΠ½ΡƒΡŽ Ρ€ΠΎΠ»ΡŒ ΠΈΠ³Ρ€Π°Π΅Ρ‚ SVD Π²ΠΎ всСм этом Π·ΠΎΠΎΠΏΠ°Ρ€ΠΊΠ΅. ΠŸΠΎΡ‚ΠΎΠΌ понял, Ρ‡Ρ‚ΠΎ получится тСкст, ΠΏΠΎΡ…ΠΎΠΆΠΈΠΉ Π½Π° Π²Ρ‹Ρ€Π΅Π·ΠΊΠΈ ΠΈΠ· опусов ΠΎΡ‚ Mathgen, поэтому количСство Ρ„ΠΎΡ€ΠΌΡƒΠ» свСл ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡƒ, Π½ΠΎ самоС любимоС β€” ΠΊΠΎΠ΄ ΠΈ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ β€” оставил Π² ΠΏΠΎΠ»Π½ΠΎΠΌ объСмС.

Π•Ρ‰Π΅ Π΄ΡƒΠΌΠ°Π» Π½Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ ΠΎΠ± автоэнкодСрах. Π’ R ΠΆΠ΅, ΠΊΠ°ΠΊ извСстно, Π±Π΅Π΄Π° с нСйросСтСвыми Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°ΠΌΠΈ: Π»ΠΈΠ±ΠΎ ΠΌΠ΅Π΄Π»Π΅Π½Π½Ρ‹Π΅, Π»ΠΈΠ±ΠΎ Π³Π»ΡŽΡ‡Π½Ρ‹Π΅, Π»ΠΈΠ±ΠΎ ΠΏΡ€ΠΈΠΌΠΈΡ‚ΠΈΠ²Π½Ρ‹Π΅. Π­Ρ‚ΠΎ ΠΈ понятно, вСдь Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΡ†Π΅Π½Π½ΠΎΠΉ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ GPU (ΠΈ Π² этом ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹ΠΉ минус R ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с Python) Ρ€Π°Π±ΠΎΡ‚Π° со сколь-Π½ΠΈΠ±ΡƒΠ΄ΡŒ слоТными Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹ΠΌΠΈ сСтями β€” ΠΈ Π² особСнности с Deep Learning β€” практичСски бСссмыслСнна (хотя Π΅ΡΡ‚ΡŒ ΠΏΠΎΠ΄Π°ΡŽΡ‰ΠΈΠΉ Π½Π°Π΄Π΅ΠΆΠ΄Ρ‹ Ρ€Π°Π·Π²ΠΈΠ²Π°ΡŽΡ‰ΠΈΠΉΡΡ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ MXNet ). Π˜Π½Ρ‚Π΅Ρ€Π΅ΡΠ΅Π½ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ свСТий Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ h2o, Π°Π²Ρ‚ΠΎΡ€ΠΎΠ² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΊΠΎΠ½ΡΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΠ΅Ρ‚ нСбСзызвСстный Trevor Hastie, Π° Cisco, eBay ΠΈ PayPal Π΄Π°ΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π΅Π³ΠΎ для создания своих ΠΏΠ»Π°Π½ΠΎΠ² ΠΏΠΎ ΠΏΠΎΡ€Π°Π±ΠΎΡ‰Π΅Π½ΠΈΡŽ чСловСчСства. Π€Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ написан Π½Π° Java (Π΄Π°-Π΄Π°, ΠΈ ΠΎΡ‡Π΅Π½ΡŒ Π»ΡŽΠ±ΠΈΡ‚ ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΡƒΡŽ ΠΏΠ°ΠΌΡΡ‚ΡŒ). К соТалСнию, ΠΎΠ½ Ρ‚ΠΎΠΆΠ΅ Π½Π΅ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρƒ с GPU, Ρ‚.ΠΊ. ΠΈΠΌΠ΅Π΅Ρ‚ нСсколько ΠΈΠ½ΡƒΡŽ Ρ†Π΅Π»Π΅Π²ΡƒΡŽ Π°ΡƒΠ΄ΠΈΡ‚ΠΎΡ€ΠΈΡŽ, Π½ΠΎ Π·Π°Ρ‚ΠΎ ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅Ρ‚ΡΡ ΠΈ прСдоставляСт интСрфСйс ΠΊ R ΠΈ Python (хотя Π»ΡŽΠ±ΠΈΡ‚Π΅Π»ΠΈ ΠΌΠ°Π·ΠΎΡ…ΠΈΠ·ΠΌΠ° ΠΌΠΎΠ³ΡƒΡ‚ Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΈ висящСм ΠΏΠΎ Π΄Π΅Ρ„ΠΎΠ»Ρ‚Ρƒ Π½Π° localhost:54321 web-интСрфСйсом).

Π’Π°ΠΊ Π²ΠΎΡ‚, Ссли ΡƒΠΆ Π²ΠΎΠ·Π½ΠΈΠΊ вопрос ΠΎ количСствС ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠΉ Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚ΠΎ это Π·Π½Π°Ρ‡ΠΈΡ‚, Ρ‡Ρ‚ΠΎ ΠΈΡ…, Π½Ρƒ, скаТСм Ρ‚Π°ΠΊ, довольно ΠΌΠ½ΠΎΠ³ΠΎ, ΠΈΠ·-Π·Π° Ρ‡Π΅Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния становится Π½Π΅ совсСм ΡƒΠ΄ΠΎΠ±Π½Ρ‹ΠΌ. А ΠΈΠ½ΠΎΠ³Π΄Π° Ρ‡Π°ΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… β€” всСго лишь ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ ΡˆΡƒΠΌ, бСсполСзный мусор. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ лишниС измСрСния ΠΆΠ΅Π»Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠ±Ρ€Π°Ρ‚ΡŒ, Π²Ρ‹Ρ‚Π°Ρ‰ΠΈΠ² ΠΈΠ· Π½ΠΈΡ… ΠΏΠΎ возмоТности всС самоС Ρ†Π΅Π½Π½ΠΎΠ΅. ΠšΡΡ‚Π°Ρ‚ΠΈ, ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡƒΡ‚ΡŒ ΠΈ обратная Π·Π°Π΄Π°Ρ‡Π° β€” Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ Π΅Ρ‰Π΅ ΠΈΠ·ΠΌΠ΅Ρ€Π΅Π½ΠΈΠΉ, Π° попросту β€” большС интСрСсных ΠΈ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… Ρ„ΠΈΡ‡. Π’Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ ΠΈ для Ρ†Π΅Π»Π΅ΠΉ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ (t-SNE Π½Π° это, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΈ ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½). Алгоритмы Π΄Π΅ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ интСрСсны ΠΈ сами ΠΏΠΎ сСбС Π² качСствС ΠΌΠ°ΡˆΠΈΠ½Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² обучСния Π±Π΅Π· учитСля, Ρ‡Ρ‚ΠΎ, ΡΠΎΠ³Π»Π°ΡΠΈΡ‚Π΅ΡΡŒ, ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈ вовсС привСсти ΠΊ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ.

ΠœΠ°Ρ‚Ρ€ΠΈΡ‡Π½Ρ‹Π΅ разлоТСния

Π’ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ΅, для сокращСния размСрности Π΄Π°Π½Π½Ρ‹Ρ… с Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒΡŽ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΡΠΏΠΎΡΠΎΠ±ΠΈΡ‚ΡŒ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² машинного обучСния β€” этим, собствСнно, ΠΎΠ½ΠΈ ΠΈ Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ΡΡ, отобраТая ΠΎΠ΄Π½ΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½Ρ‹Π΅ пространства Π² Π΄Ρ€ΡƒΠ³ΠΈΠ΅. НапримСр, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Ρ€Π°Π±ΠΎΡ‚Ρ‹ PCA ΠΈ K-means Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ смыслС эквивалСнтны. Но ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ хочСтся ΡΠΎΠΊΡ€Π°Ρ‰Π°Ρ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· особой Π²ΠΎΠ·Π½ΠΈ с поиском ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π‘Π°ΠΌΡ‹ΠΌ Π²Π°ΠΆΠ½Ρ‹ΠΌ срСди Ρ‚Π°ΠΊΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ ΠΆΠ΅, являСтся SVD. Β«ΠŸΠΎΡ‡Π΅ΠΌΡƒ SVD, Π° Π½Π΅ PCA?Β» β€” спроситС Π²Ρ‹. ΠŸΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ SVD, Π²ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, само ΠΏΠΎ сСбС являСтся ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠΉ Π²Π°ΠΆΠ½ΠΎΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΎΠΉ ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ разлоТСния ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ ΠΈΠΌΠ΅ΡŽΡ‚ Π²ΠΏΠΎΠ»Π½Π΅ ΠΎΡΠΌΡ‹ΡΠ»Π΅Π½Π½ΡƒΡŽ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΡŽ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния машинного обучСния; Π²ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для PCA ΠΈ с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΎΠ³ΠΎΠ²ΠΎΡ€ΠΊΠ°ΠΌΠΈ для NMF (ΠΊΠ°ΠΊ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†); Π²-Ρ‚Ρ€Π΅Ρ‚ΡŒΠΈΡ…, SVD ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΡΠΏΠΎΡΠΎΠ±ΠΈΡ‚ΡŒ для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Ρ€Π°Π±ΠΎΡ‚Ρ‹ ICA. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Ρƒ SVD Π½Π΅Ρ‚ Ρ‚Π°ΠΊΠΈΡ… Π½Π΅ΡƒΠ΄ΠΎΠ±Π½Ρ‹Ρ… свойств, ΠΊΠ°ΠΊ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΌ (разлоТСния LU, Schur) ΠΈΠ»ΠΈ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΌ симмСтричным ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°ΠΌ (Cholesky), ΠΈΠ»ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°ΠΌ, элСмСнты ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ (NMF). ЕстСствСнно, Π·Π° ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ приходится ΠΏΠ»Π°Ρ‚ΠΈΡ‚ΡŒ β€” сингулярноС Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ довольно ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΠ΅; поэтому, ΠΊΠΎΠ³Π΄Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ слишком большиС, ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ Ρ€Π°Π½Π΄ΠΎΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹.

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π§Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚, Ссли ΠΈΠ· исходного изобраТСния Π²Ρ‹Ρ‡Π΅ΡΡ‚ΡŒ срСдниС значСния ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ столбца, Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ Π½Π° ΠΊΠΎΡ€Π΅Π½ΡŒ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΈΠ· количСства столбцов Π² исходной ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π΅, Π° ΠΏΠΎΡ‚ΠΎΠΌ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ сингулярноС Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅? ΠžΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ столбцы ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ V Π² ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΠΎΠΌ Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠΈ Π² точности Π±ΡƒΠ΄ΡƒΡ‚ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ Π³Π»Π°Π²Π½Ρ‹ΠΌ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Π°ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ PCA (ΠΊ слову, Π² R для PCA ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ prcomp() )

ВСрнСмся ΠΊ вопросу Π²Ρ‹Π±ΠΎΡ€Π° количСства Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚. ΠšΠ°ΠΏΠΈΡ‚Π°Π½ΡΠΊΠΎΠ΅ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ Ρ‚Π°ΠΊΠΎΠ΅: Ρ‡Π΅ΠΌ большС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, Ρ‚Π΅ΠΌ большС диспСрсии ΠΎΠ½ΠΈ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚. Andrew Ng, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, совСтуСт ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π½Π° >90% диспСрсии. Π”Ρ€ΡƒΠ³ΠΈΠ΅ исслСдоватСли ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ это число ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈ 50%. Π”Π°ΠΆΠ΅ ΠΏΡ€ΠΈΠ΄ΡƒΠΌΠ°Π½ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Π₯ΠΎΡ€Π½Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ основываСтся Π½Π° симуляции ΠœΠΎΠ½Ρ‚Π΅-ΠšΠ°Ρ€Π»ΠΎ. Π’ R для этого ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚ Π΅ΡΡ‚ΡŒ. БовсСм простой ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ β€” ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ scree plot: Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ Π½Π°Π΄ΠΎ ΠΈΡΠΊΠ°Ρ‚ΡŒ Β«Π»ΠΎΠΊΠΎΡ‚ΡŒΒ» ΠΈ ΠΎΡ‚Π±Ρ€Π°ΡΡ‹Π²Π°Ρ‚ΡŒ всС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ ΠΏΠΎΠ»ΠΎΠ³ΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ этого «локтя». На рисункС Π½ΠΈΠΆΠ΅, я Π±Ρ‹ сказал, Π½Π°Π΄ΠΎ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ 6 ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π’ ΠΎΠ±Ρ‰Π΅ΠΌ, ΠΊΠ°ΠΊ Π²Ρ‹ Π²ΠΈΠ΄ΠΈΡ‚Π΅. вопрос Π½Π΅ΠΏΠ»ΠΎΡ…ΠΎ ΠΏΡ€ΠΎΡ€Π°Π±ΠΎΡ‚Π°Π½. Π’Π°ΠΊΠΆΠ΅ Π±Ρ‹Ρ‚ΡƒΠ΅Ρ‚ ΠΌΠ½Π΅Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ PCA ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ распрСдСлСнных Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ Wiki с этим Π½Π΅ согласна, ΠΈ SVD/PCA ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ любого распрСдСлСния, Π½ΠΎ, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ, Π½Π΅ всСгда Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΈΠ²Π½ΠΎ (Ρ‡Ρ‚ΠΎ выясняСтся эмпиричСски).

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎ интСрСсноС Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ β€” это факторизация Π½Π΅ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ°Ρ‚Ρ€ΠΈΡ†, которая, ΠΊΠ°ΠΊ слСдуСт ΠΈΠ· названия, примСняСтся для разлоТСния Π½Π΅ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠ°Ρ‚Ρ€ΠΈΡ† Π½Π° Π½Π΅ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹:
X=WH.
Π’ Ρ†Π΅Π»ΠΎΠΌ, такая Π·Π°Π΄Π°Ρ‡Π° Π½Π΅ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ (Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ SVD), ΠΈ для Ρ‘Ρ‘ вычислСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ числСнныС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹. Π—Π°Π΄Π°Ρ‡Ρƒ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠ³ΠΎ программирования β€” ΠΈ Π² этом смыслС ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ SVM. Π’ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ΅ ΠΆΠ΅ сокращСния размСрности пространства Π²Π°ΠΆΠ½Ρ‹ΠΌ являСтся Π²ΠΎΡ‚ Ρ‡Ρ‚ΠΎ: Ссли ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° Π₯ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ m x n, Ρ‚ΠΎ соотвСтствСнно ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ W ΠΈ H ΠΈΠΌΠ΅ΡŽΡ‚ размСрности m x k ΠΈ k x n, ΠΈ, выбирая k Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ мСньшС самих m ΠΈ n, ΠΌΠΎΠΆΠ½ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΡ€Π΅Π·Π°Ρ‚ΡŒ эту ΡΠ°ΠΌΡƒΡŽ ΠΈΡΡ…ΠΎΠ΄Π½ΡƒΡŽ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ. NMF Π»ΡŽΠ±ΡΡ‚ примСнят для Π°Π½Π°Π»ΠΈΠ·Π° тСкстовых Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΌ, Π³Π΄Π΅ Π½Π΅ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΡΠΎΠ³Π»Π°ΡΡƒΡŽΡ‚ΡΡ с самой ΠΏΡ€ΠΈΡ€ΠΎΠ΄ΠΎΠΉ Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ Π² Ρ†Π΅Π»ΠΎΠΌ спСктр примСнСния ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ Π½Π΅ уступаСт PCA. Π Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠ΅Ρ€Π²ΠΎΠΉ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ Π² R Π΄Π°Π΅Ρ‚ Ρ‚Π°ΠΊΠΎΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Если трСбуСтся Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Π±ΠΎΠ»Π΅Π΅ экзотичноС

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

КакоС ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π΅Ρ‚ ICA ΠΊ Π·Π°Π΄Π°Ρ‡Π΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности Π΄Π°Π½Π½Ρ‹Ρ…? ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ β€” Π²Π½Π΅ зависимости ΠΎΡ‚ ΠΈΡ… ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹ β€” ΠΊΠ°ΠΊ смСсь ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, Ρ‚ΠΎΠ³Π΄Π° ΠΌΠΎΠΆΠ½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ эту смСсь Π½Π° Ρ‚ΠΎ количСство «сигналов», ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π°ΠΌ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚. Особого критСрия, ΠΊΠ°ΠΊ Π² случаС с PCA, ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€Ρƒ количСства ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ Π½Π΅Ρ‚ β€” ΠΎΠ½ΠΎ подбираСтся ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎ.

Π’ самом простом прСдставлСнии автоэнкодСр ΠΌΠΎΠΆΠ½ΠΎ ΡΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ многослойный ΠΏΠ΅Ρ€Ρ†Π΅ΠΏΡ‚Ρ€ΠΎΠ½, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ количСство Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Π² Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌ слоС Ρ€Π°Π²Π½ΠΎ количСству Π²Ρ…ΠΎΠ΄ΠΎΠ². Из рисунка Π½ΠΈΠΆΠ΅ понятно, Ρ‡Ρ‚ΠΎ, выбирая ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹ΠΉ скрытый слой ΠΌΠ°Π»ΠΎΠΉ размСрности, ΠΌΡ‹ Ρ‚Π΅ΠΌ самым «сТимаСм» исходныС Π΄Π°Π½Π½Ρ‹Π΅.

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π’Ρ‹ΡˆΠ΅ΠΎΠ·Π½Π°Ρ‡Π΅Π½Π½Ρ‹ΠΉ автоэнкодСр нСслоТно ΠΏΡ€Π΅Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π² denoising autoencoder. Π’Π°ΠΊ ΠΊΠ°ΠΊ Ρ‚Π°ΠΊΠΎΠΌΡƒ Π°Π²Ρ‚ΠΎΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊΡƒ Π½Π° Π²Ρ…ΠΎΠ΄ Π½Π°Π΄ΠΎ ΠΏΠΎΠ΄Π°Π²Π°Ρ‚ΡŒ искаТСнныС ΠΎΠ±Ρ€Π°Π·Ρ‹, ΠΏΠ΅Ρ€Π΅Π΄ ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ скрытым слоСм достаточно Ρ€Π°Π·ΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ dropout слой. Благодаря Π΅ΠΌΡƒ с Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π±ΡƒΠ΄ΡƒΡ‚ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ Π² Β«Π²Ρ‹ΠΊΠ»ΡŽΡ‡Π΅Π½Π½ΠΎΠΌΒ» состоянии, Ρ‡Ρ‚ΠΎ Π°) Π±ΡƒΠ΄Π΅Ρ‚ Π²Π½ΠΎΡΠΈΡ‚ΡŒ искаТСния Π² ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ ΠΎΠ±Ρ€Π°Π·; Π±) Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ»ΡƒΠΆΠΈΡ‚ΡŒ своСобразной рСгуляризациСй ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ.
Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎ интСрСсноС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ автоэнкодСра β€” ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ Π² Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ ошибкС рСконструкции ΠΎΠ±Ρ€Π°Π·ΠΎΠ². Π’ Ρ†Π΅Π»ΠΎΠΌ, Ссли ΠΏΠΎΠ΄Π°Π²Π°Ρ‚ΡŒ Π½Π° Π²Ρ…ΠΎΠ΄ автоэнкодСра Π΄Π°Π½Π½Ρ‹Π΅ Π½Π΅ ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, Ρ‚ΠΎ, понятно, ошибка рСконструкции ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±Ρ€Π°Π·Π° ΠΈΠ· Π½ΠΎΠ²ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹ΡˆΠ΅ Ρ‚Π°ΠΊΠΎΠ²ΠΎΠΉ ΠΈΠ· Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, Π½ΠΎ Π±ΠΎΠ»Π΅Π΅-ΠΌΠ΅Π½Π΅Π΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ порядка. ΠŸΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ эта ошибка Π±ΡƒΠ΄Π΅Ρ‚ Π² дСсятки, Π° Ρ‚ΠΎ ΠΈ сотни Ρ€Π°Π· большС.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠŸΡ€Π΅ΠΏΠ°Ρ€ΠΈΡ€ΡƒΠ΅ΠΌ t-SNE

Работая Π½Π°Π΄ ΡΡ‚Π°Ρ‚ΡŒΠ΅ΠΉ Β«Π“Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° R. Β», я нСсколько Ρ€Π°Π· встрСчал ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π½ΠΈΠ΅ t-SNE β€” Π·Π°Π³Π°Π΄ΠΎΡ‡Π½ΠΎΠΉ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ сниТСния размСрности ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, здСсь), Π±Ρ‹Π» Π·Π°ΠΈΠ½Ρ‚Ρ€ΠΈΠ³ΠΎΠ²Π°Π½ ΠΈ Ρ€Π΅ΡˆΠΈΠ» Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ Π²ΠΎ всСм Π² дСталях. t-SNE это t-distributed stochastic neighbor embedding. Русский Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ с Β«Π²Π½Π΅Π΄Ρ€Π΅Π½ΠΈΠ΅ΠΌ сосСдСй» Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΠ΅Ρ€Π΅ Π·Π²ΡƒΡ‡ΠΈΡ‚ Π½Π΅Π»Π΅ΠΏΠΎ, поэтому дальшС Π±ΡƒΠ΄Ρƒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ английский Π°ΠΊΡ€ΠΎΠ½ΠΈΠΌ.

Алгоритм t-SNE, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ‚Π°ΠΊΠΆΠ΅ относят ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°ΠΌ мноТСствСнного обучСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Π±Ρ‹Π» ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ Π² 2008 Π³ΠΎΠ΄Ρƒ (ссылка 1 Π² ΠΊΠΎΠ½Ρ†Π΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ) голландским исслСдоватСлСм ЛоурСнсом Π²Π°Π½ Π΄Π΅Ρ€ ΠœΠ°Π°Ρ‚Π΅Π½ΠΎΠΌ (сСйчас Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Facebook AI Research) ΠΈ Ρ‡Π°Ρ€ΠΎΠ΄Π΅Π΅ΠΌ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Π”ΠΆΠ΅Ρ„Ρ„Ρ€ΠΈ Π₯ΠΈΠ½Ρ‚ΠΎΠ½ΠΎΠΌ. ΠšΠ»Π°ΡΡΠΈΡ‡Π΅ΡΠΊΠΈΠΉ SNE Π±Ρ‹Π» ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ Π₯ΠΈΠ½Ρ‚ΠΎΠ½ΠΎΠΌ ΠΈ РовСйсом Π² 2002 (ссылка 2). Π’ ΡΡ‚Π°Ρ‚ΡŒΠ΅ 2008 Π³ΠΎΠ΄Π° описываСтся нСсколько Β«Ρ‚Ρ€ΡŽΠΊΠΎΠ²Β», ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»ΠΈ ΡƒΠΏΡ€ΠΎΡΡ‚ΠΈΡ‚ΡŒ процСсс поиска Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠΎΠ², ΠΈ ΠΏΠΎΠ²Ρ‹ΡΠΈΡ‚ΡŒ качСство Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ. Одним ΠΈΠ· Π½ΠΈΡ… стала Π·Π°ΠΌΠ΅Π½Π° Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСния Π½Π° распрСдСлСниС Π‘Ρ‚ΡŒΡŽΠ΄Π΅Π½Ρ‚Π° для Π΄Π°Π½Π½Ρ‹Ρ… Π½ΠΈΠ·ΠΊΠΎΠΉ размСрности. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Π±Ρ‹Π»Π° сдСлана удачная рСализация Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° (Π² ΡΡ‚Π°Ρ‚ΡŒΠ΅ Π΅ΡΡ‚ΡŒ ссылка Π½Π° MatLab), которая ΠΏΠΎΡ‚ΠΎΠΌ ΠΏΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ Π² Π΄Ρ€ΡƒΠ³ΠΈΠ΅ популярныС срСды.

НСмного ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ

НачнСм с «классичСского» SNE ΠΈ сформулируСм Π·Π°Π΄Π°Ρ‡Ρƒ. Π£ нас Π΅ΡΡ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… с Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ, описываСмыми ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ с Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ пространства сущСствСнно большС Ρ‚Ρ€Π΅Ρ…. НСобходимо ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½ΠΎΠ²ΡƒΡŽ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ, ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΡƒΡŽ Π² Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠΌ ΠΈΠ»ΠΈ Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС, которая Π±Ρ‹ Π² максимальной стСпСни сохраняла структуру ΠΈ закономСрности Π² исходных Π΄Π°Π½Π½Ρ‹Ρ…. SNE начинаСтся с прСобразования ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΉ Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ дистанции ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π² условныС вСроятности, ΠΎΡ‚Ρ€Π°ΠΆΠ°ΡŽΡ‰ΠΈΠ΅ сходство Ρ‚ΠΎΡ‡Π΅ΠΊ. ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈ это выглядит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ (Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° 1):

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π­Ρ‚Π° Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, насколько Ρ‚ΠΎΡ‡ΠΊΠ° Xj Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ Ρ‚ΠΎΡ‡ΠΊΠ΅ Xi ΠΏΡ€ΠΈ гауссовом распрСдСлСнии Π²ΠΎΠΊΡ€ΡƒΠ³ Xi с Π·Π°Π΄Π°Π½Π½Ρ‹ΠΌ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ΠΌ Οƒ. Π‘ΠΈΠ³ΠΌΠ° Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½ΠΎΠΉ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ. Она выбираСтся Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ‚ΠΎΡ‡ΠΊΠΈ Π² областях с большСй ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ ΠΈΠΌΠ΅Π»ΠΈ ΠΌΠ΅Π½ΡŒΡˆΡƒΡŽ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ. Для этого ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΡ†Π΅Π½ΠΊΠ° пСрплСксии:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π“Π΄Π΅ H(Pi) – энтропия Π¨Π΅Π½Π½ΠΎΠ½Π° Π² Π±ΠΈΡ‚Π°Ρ… (Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° 2):

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС пСрплСксия ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΊΠ°ΠΊ сглаТСнная ΠΎΡ†Π΅Π½ΠΊΠ° эффСктивного количСства «сосСдСй» для Ρ‚ΠΎΡ‡ΠΊΠΈ Xi. Она задаСтся Π² качСствС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° ΠΌΠ΅Ρ‚ΠΎΠ΄Π°. Авторы Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΡŽΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π΅ ΠΎΡ‚ 5 Π΄ΠΎ 50. Π‘ΠΈΠ³ΠΌΠ° опрСдСляСтся для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠ°Ρ€Ρ‹ Xi ΠΈ Xj ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ поиска.

Для Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Ρ‚Ρ€Π΅Ρ…ΠΌΠ΅Ρ€Π½Ρ‹Ρ… Β«ΠΊΠΎΠ»Π»Π΅Π³Β» ΠΏΠ°Ρ€Ρ‹ Xi ΠΈ Xj, Π½Π°Π·ΠΎΠ²Π΅ΠΌ ΠΈΡ… для ясности Yi ΠΈ Yj, Π½Π΅ прСдставляСт Ρ‚Ρ€ΡƒΠ΄Π° ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ ΡƒΡΠ»ΠΎΠ²Π½ΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚Ρƒ ΠΆΠ΅ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ 1. Π‘Ρ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½ΠΎΠ΅ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ прСдлагаСтся ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Π² 1/√2:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Если Ρ‚ΠΎΡ‡ΠΊΠΈ отобраТСния Yi ΠΈ Yj ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΡŽΡ‚ сходство ΠΌΠ΅ΠΆΠ΄Ρƒ исходными Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ высокой размСрности Xi ΠΈ Xj, Ρ‚ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ условныС вСроятности pj|i ΠΈ qj|i Π±ΡƒΠ΄ΡƒΡ‚ эквивалСнтны. Π’ качСствС ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ качСства, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ qj|i ΠΎΡ‚Ρ€Π°ΠΆΠ°Π΅Ρ‚ pj|i, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ дивСргСнция ΠΈΠ»ΠΈ расстояниС ΠšΡƒΠ»ΡŒΠ±Π°ΠΊΠ°-Π›Π΅ΠΉΠ±Π»Π΅Ρ€Π°. SNE ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ сумму Ρ‚Π°ΠΊΠΈΡ… расстояний для всСх Ρ‚ΠΎΡ‡Π΅ΠΊ отобраТСния ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска. Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ для Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒΡΡ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΎΠΉ 3:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

ΠŸΡ€ΠΈ этом Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ выглядит Π½Π° ΡƒΠ΄ΠΈΠ²Π»Π΅Π½ΠΈΠ΅ просто:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Авторы ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΡƒΡŽ Ρ„ΠΈΠ·ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ аналогию для процСсса ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ: ВсС Ρ‚ΠΎΡ‡ΠΊΠΈ отобраТСния соСдинСны ΠΏΡ€ΡƒΠΆΠΈΠ½Π°ΠΌΠΈ. Π–Π΅ΡΡ‚ΠΊΠΎΡΡ‚ΡŒ ΠΏΡ€ΡƒΠΆΠΈΠ½Ρ‹, ΡΠΎΠ΅Π΄ΠΈΠ½ΡΡŽΡ‰Π΅ΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ i ΠΈ j зависит ΠΎΡ‚ разности ΠΌΠ΅ΠΆΠ΄Ρƒ сходством Π΄Π²ΡƒΡ… Ρ‚ΠΎΡ‡Π΅ΠΊ Π² ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС ΠΈ Π΄Π²ΡƒΡ… Ρ‚ΠΎΡ‡Π΅ΠΊ Π² пространствС отобраТСния. Π’ этой Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ β€” это Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ сила, Π΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‰Π°Ρ Π½Π° Ρ‚ΠΎΡ‡ΠΊΡƒ Π² пространствС отобраТСния. Если систСму Β«ΠΎΡ‚ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒΒ», Ρ‡Π΅Ρ€Π΅Π· ΠΊΠ°ΠΊΠΎΠ΅-Ρ‚ΠΎ врСмя ΠΎΠ½Π° ΠΏΡ€ΠΈΠ΄Π΅Ρ‚ Π² равновСсиС, это ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ искомоС распрСдСлСниС. АлгоритмичСски, поиск равновСсия прСдлагаСтся Π΄Π΅Π»Π°Ρ‚ΡŒ с ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ ΠΌΠΎΠΌΠ΅Π½Ρ‚ΠΎΠ²:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π³Π΄Π΅ Ξ· – ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠΉ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния (Π΄Π»ΠΈΠ½Ρƒ шага), Π° Ξ± – коэффициСнт ΠΈΠ½Π΅Ρ€Ρ†ΠΈΠΈ. ИспользованиС классичСского SNE позволяСт ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅ΠΏΠ»ΠΎΡ…ΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, Π½ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ связано с трудностями Π² ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ скучСнности (Π² ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π΅ – crowding problem). t-SNE Ссли ΠΈ Π½Π΅ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ эти ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ совсСм, Ρ‚ΠΎ сущСствСнно ΠΎΠ±Π»Π΅Π³Ρ‡Π°Π΅Ρ‚. Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ t-SNE ΠΈΠΌΠ΅Π΅Ρ‚ Π΄Π²Π° ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… отличая. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Ρƒ t-SNE симмСтричная Ρ„ΠΎΡ€ΠΌΠ° сходства Π² ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС ΠΈ Π±ΠΎΠ»Π΅Π΅ простой Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, вмСсто гауссова распрСдСлСния для Ρ‚ΠΎΡ‡Π΅ΠΊ ΠΈΠ· пространства отобраТСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ t-распрСдСлСниС (Π‘Ρ‚ΡŒΡŽΠ΄Π΅Π½Ρ‚Π°), «тяТСлыС» хвосты ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΎΠ±Π»Π΅Π³Ρ‡Π°ΡŽΡ‚ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΈ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ скучСнности.

Π’ качСствС Π°Π»ΡŒΡ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Ρ‹ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ суммы Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΠΉ ΠšΡƒΠ»ΡŒΠ±Π°ΠΊΠ°-Π›Π΅ΠΉΠ±Π»Π΅Ρ€Π° ΠΌΠ΅ΠΆΠ΄Ρƒ условными вСроятностями pi|j ΠΈ qi|j прСдлагаСтся ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½ΠΎΡ‡Π½ΡƒΡŽ Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ ΠΌΠ΅ΠΆΠ΄Ρƒ совмСстной Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ P Π² ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС ΠΈ совмСстной Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ Q Π² пространствС отобраТСния:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π³Π΄Π΅ pii ΠΈ qii = 0, pij = pji, qij = qji для Π»ΡŽΠ±Ρ‹Ρ… i ΠΈ j, Π° pij опрСдСляСтся ΠΏΠΎ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π³Π΄Π΅ n β€” количСство Ρ‚ΠΎΡ‡Π΅ΠΊ Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ для симмСтричного SNE получаСтся сущСствСнно ΠΏΡ€ΠΎΡ‰Π΅, Ρ‡Π΅ΠΌ для классичСского:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° скучСнности Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ расстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ двумя Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π² пространствС отобраТСния, ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΌΠΈ Π΄Π²ΡƒΠΌ срСднСудалСнным Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌ Π² ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС, Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ сущСствСнно большС, Π½Π΅ΠΆΠ΅Π»ΠΈ расстояниС, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ позволяСт ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ гауссово распрСдСлСниС. ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ хвосты Π‘Ρ‚ΡŒΡŽΠ΄Π΅Π½Ρ‚Π°. Π’ t-SNE ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ t-распрСдСлСниС с ΠΎΠ΄Π½ΠΎΠΉ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ свободы. БовмСстная Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ для пространства отобраТСния Π² этом случаС Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒΡΡ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΎΠΉ 4:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

А ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ – Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ΠΌ 5:

Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности. Π€ΠΎΡ‚ΠΎ Для Ρ‡Π΅Π³ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΠ΅ размСрности

Π’ΠΎΠ·Π²Ρ€Π°Ρ‰Π°ΡΡΡŒ ΠΊ физичСской Π°Π½Π°Π»ΠΎΠ³ΠΈΠΈ, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ сила, опрСдСляСмая Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΎΠΉ 5, Π±ΡƒΠ΄Π΅Ρ‚ сущСствСнным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΡΡ‚ΡΠ³ΠΈΠ²Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠΈ пространства отобраТСния для Π±Π»ΠΈΠ·Π»Π΅ΠΆΠ°Ρ‰ΠΈΡ… Ρ‚ΠΎΡ‡Π΅ΠΊ ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ пространства, ΠΈ ΠΎΡ‚Ρ‚Π°Π»ΠΊΠΈΠ²Π°Ρ‚ΡŒ β€” для ΡƒΠ΄Π°Π»Π΅Π½Π½Ρ‹Ρ….

Алгоритм

Алгоритм t-SNE Π² ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½Π½ΠΎΠΌ Π²ΠΈΠ΄Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ псСвдокодом:

Π§Ρ‚ΠΎΠ±Ρ‹ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ прСдлагаСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π²Π° Ρ‚Ρ€ΡŽΠΊΠ°. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ Π°Π²Ρ‚ΠΎΡ€Ρ‹ Π½Π°Π·Π²Π°Π»ΠΈ Β«Ρ€Π°Π½Π½Π΅ΠΉ компрСссиСй». Π•Π³ΠΎ Π·Π°Π΄Π°Ρ‡Π° – Π·Π°ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠΈ Π² пространствС отобраТСния Π² Π½Π°Ρ‡Π°Π»Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π±Ρ‹Ρ‚ΡŒ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π±Π»ΠΈΠΆΠ΅ Π΄Ρ€ΡƒΠ³ ΠΊ Π΄Ρ€ΡƒΠ³Ρƒ. Когда дистанция ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ отобраТСния Π½Π΅Π²Π΅Π»ΠΈΠΊΠ°, ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Ρ‰Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½ кластСр Ρ‡Π΅Ρ€Π΅Π· Π΄Ρ€ΡƒΠ³ΠΎΠΉ сущСствСнно Π»Π΅Π³Ρ‡Π΅. Π’Π°ΠΊ Π³ΠΎΡ€Π°Π·Π΄ΠΎ ΠΏΡ€ΠΎΡ‰Π΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚ΡŒ пространство ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΈ Β«Π½Π°Ρ†Π΅Π»ΠΈΡ‚ΡŒΡΡΒ» Π½Π° Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡ‹. Ранняя компрСссия создаСтся Π·Π° счСт Π΄ΠΎΠ±Π°Π²ΠΎΡ‡Π½ΠΎΠ³ΠΎ L2-ΡˆΡ‚Ρ€Π°Ρ„Π° Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΎΠ½Π°Π»Π΅Π½ суммС ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² дистанций Ρ‚ΠΎΡ‡Π΅ΠΊ отобраТСния ΠΎΡ‚ Π½Π°Ρ‡Π°Π»Π° ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ (Π² исходном ΠΊΠΎΠ΄Π΅ этого Π½Π΅ нашСл).

Π’Ρ‚ΠΎΡ€ΠΎΠΉ Ρ‚Ρ€ΡŽΠΊ ΠΌΠ΅Π½Π΅Π΅ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹ΠΉ β€” Β«Ρ€Π°Π½Π½Π΅Π΅ гипСрусилСниС» (Π² ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π΅ – Β«early exaggerationΒ»). Π—Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ ΠΎΠ½ Π² ΡƒΠΌΠ½ΠΎΠΆΠ΅Π½ΠΈΠΈ Π² Π½Π°Ρ‡Π°Π»Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ всСх pij Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Ρ†Π΅Π»ΠΎΠ΅ число, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π½Π° 4. Бмысл Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… pij ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ бόльшиС qij. Π­Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ для кластСров Π² исходных Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΏΠ»ΠΎΡ‚Π½Ρ‹Π΅ ΠΈ ΡˆΠΈΡ€ΠΎΠΊΠΎ разнСсСнныС кластСры Π² пространствС отобраТСния.

РСализация Π½Π° R

Π’ качСствС исходного ΠΊΠΎΠ΄Π° я взял ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΡƒΡŽ MatLab Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Π²Π°Π½ Π΄Π΅Ρ€ ΠœΠ°Π°Ρ‚Π΅Π½Π°. Однако акадСмичСская лицСнзия Π½Π° MatLab Ρƒ мСня Π΄Π°Π²Π½ΠΎ Π·Π°ΠΊΠΎΠ½Ρ‡ΠΈΠ»Π°ΡΡŒ, поэтому вСсь ΠΊΠΎΠ΄ я ΠΏΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Π» Π½Π° R. Код доступСн Π² Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚Π°Ρ€ΠΈΠΈ. Π’Π°ΠΊΠΆΠ΅ Π² ΠΌΠΎΠ΅ΠΌ распоряТСнии Π±Ρ‹Π» ΠΊΠΎΠ΄ ΠΈΠ· Π°Ρ€Ρ…ΠΈΠ²Π° R-ΠΏΠ°ΠΊΠ΅Ρ‚Π° tsne, взял ΠΎΡ‚Ρ‚ΡƒΠ΄Π° ΠΏΠ°Ρ€Ρƒ ΠΈΠ΄Π΅ΠΉ.

Для экспСримСнтов прСдлагаСтся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹:
ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ: 1000;
ΠŸΠ΅Ρ€ΠΏΠ»Π΅ΠΊΡΠΈΡ: 40;
Π Π°Π½Π½Π΅Π΅ гипСрусилСниС: Ρ…4 для ΠΏΠ΅Ρ€Π²Ρ‹Ρ… 50 ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ;
ΠœΠΎΠΌΠ΅Π½Ρ‚ Ξ±: 0.5 для ΠΏΠ΅Ρ€Π²Ρ‹Ρ… 250 ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ, 0.8 для ΠΎΡΡ‚Π°Π²ΡˆΠΈΡ…ΡΡ 750;
Π‘ΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния Ξ·: ΠΏΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ 100 (Π² ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΌ ΠΊΠΎΠ΄Π΅ β€” 500) ΠΈ измСняСтся послС ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ Π² соотвСтствиС со схСмой, описанной Π ΠΎΠ±Π΅Ρ€Ρ‚ΠΎΠΌ ДТСкобсом Π² 1988 (ссылка 3).

ΠŸΡ€ΠΎΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ самыС Π²Π°ΠΆΠ½Ρ‹Π΅ конструкции. ΠŸΡ€Π΅ΠΆΠ΄Π΅ всСго, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ дистанции для исходного Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…. Для этого Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ rdist() ΠΈΠ· ΠΏΠ°ΠΊΠ΅Ρ‚Π° fields. Она Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π°Π·Ρ‹ быстрСС, Ρ‡Π΅ΠΌ популярная dist() ΠΈΠ· Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚Π° stats. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, это ΠΏΠΎ Ρ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΈΠΌΠ΅Π½Π½ΠΎ для Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²ΠΎΠΉ дистанции. Π”Π°Π»Π΅Π΅ Π½ΡƒΠΆΠ½ΠΎ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ пространство отобраТСния. Π­Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ rnorm() с Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌ ΠΌΠ°Ρ‚. ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅ΠΌ ΠΈ стандартным ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ΠΌ 1Π΅-4.

РасчСт Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌΠ° пСрплСксии ΠΈ гауссового ядра выглядит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ПослСднСС Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ получаСтся, Ссли Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ (1) для pj|i ΠΏΠΎΠ΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ (2) для пСрплСксии. ΠŸΡƒΡΡ‚ΡŒ n Π±ΡƒΠ΄Π΅Ρ‚ количСством Ρ‚ΠΎΡ‡Π΅ΠΊ Π² исходных Π΄Π°Π½Π½Ρ‹Ρ…. Di – Π²Π΅ΠΊΡ‚ΠΎΡ€ Π΄Π»ΠΈΠ½Ρ‹ n-1, с ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π°ΠΌΠΈ ΠΏΠΎΠΏΠ°Ρ€Π½Ρ‹Ρ… дистанций для строки исходного Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ΡΡ ΠΎΠ½ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ конструкции Di

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *