ๆ•ฐๆฎ้™็ปด

ๆ–นๆณ•็‰นๆ€งไธŽๆตๅฝขไป‹็ป

ๆ–นๆณ•็‰นๆ€ง

็ผบๅคฑๅ€ผๆฏ”็އ๏ผšๅฆ‚ๆžœๆ•ฐๆฎ้›†็š„็ผบๅคฑๅ€ผๅคชๅคš๏ผŒๆˆ‘ไปฌๅฏไปฅ็”จ่ฟ™็งๆ–นๆณ•ๅ‡ๅฐ‘ๅ˜้‡ๆ•ฐใ€‚

ไฝŽๆ–นๅทฎๆปคๆณข๏ผš่ฟ™ไธชๆ–นๆณ•ๅฏไปฅไปŽๆ•ฐๆฎ้›†ไธญ่ฏ†ๅˆซๅ’Œๅˆ ้™คๅธธ้‡ๅ˜้‡๏ผŒๆ–นๅทฎๅฐ็š„ๅ˜้‡ๅฏน็›ฎๆ ‡ๅ˜้‡ๅฝฑๅ“ไธๅคง๏ผŒๆ‰€ไปฅๅฏไปฅๆ”พๅฟƒๅˆ ๅŽปใ€‚

้ซ˜็›ธๅ…ณๆปคๆณข๏ผšๅ…ทๆœ‰้ซ˜็›ธๅ…ณๆ€ง็š„ไธ€ๅฏนๅ˜้‡ไผšๅขžๅŠ ๆ•ฐๆฎ้›†ไธญ็š„ๅคš้‡ๅ…ฑ็บฟๆ€ง๏ผŒๆ‰€ไปฅ็”จ่ฟ™็งๆ–นๆณ•ๅˆ ๅŽปๅ…ถไธญไธ€ไธชๆ˜ฏๆœ‰ๅฟ…่ฆ็š„ใ€‚

้šๆœบๆฃฎๆž—๏ผš่ฟ™ๆ˜ฏๆœ€ๅธธ็”จ็š„้™็ปดๆ–นๆณ•ไน‹ไธ€๏ผŒๅฎƒไผšๆ˜Ž็กฎ็ฎ—ๅ‡บๆ•ฐๆฎ้›†ไธญๆฏไธช็‰นๅพ็š„้‡่ฆๆ€งใ€‚ ๅ‰ๅ‘็‰นๅพ้€‰ๆ‹ฉๅ’Œๅๅ‘

็‰นๅพๆถˆ้™ค๏ผš่ฟ™ไธค็งๆ–นๆณ•่€—ๆ—ถ่พƒไน…๏ผŒ่ฎก็ฎ—ๆˆๆœฌไนŸ้ƒฝๅพˆ้ซ˜๏ผŒๆ‰€ไปฅๅช้€‚็”จไบŽ่พ“ๅ…ฅๅ˜้‡่พƒๅฐ‘็š„ๆ•ฐๆฎ้›†ใ€‚

ๅ› ๅญๅˆ†ๆž๏ผš่ฟ™็งๆ–นๆณ•้€‚ๅˆๆ•ฐๆฎ้›†ไธญๅญ˜ๅœจ้ซ˜ๅบฆ็›ธๅ…ณ็š„ๅ˜้‡้›†็š„ๆƒ…ๅ†ตใ€‚

PCA๏ผš่ฟ™ๆ˜ฏๅค„็†็บฟๆ€งๆ•ฐๆฎๆœ€ๅนฟๆณ›ไฝฟ็”จ็š„ๆŠ€ๆœฏไน‹ไธ€ใ€‚

ICA๏ผšICA้ž้™ไฝŽ็ปดๅบฆ๏ผŒ่€Œๆ˜ฏๅฐ†ๆ•ฐๆฎ่ฝฌๆขไธบ็‹ฌ็ซ‹็š„ๅˆ†้‡๏ผŒไฝฟ็”จๆ›ดๅฐ‘็š„ๅˆ†้‡ๆฅๆ่ฟฐๆ•ฐๆฎใ€‚

kPCA๏ผš้€‚ๅˆ้ž็บฟๆ€งๆ•ฐๆฎ๏ผŒๅฐ†ๆ•ฐๆฎๆ˜ ๅฐ„่‡ณ้ซ˜็ปดๅฏๅˆ†ๅŽๅ†็”จPCAใ€‚

MDS๏ผšๅŽŸๅง‹้ซ˜็ปด็ฉบ้—ดไธญๆ ทๆœฌ่ท็ฆปๅœจไฝŽ็ปดไธญ็ปง็ปญไฟๆŒใ€‚

ISOMAP๏ผš้€‚ๅˆ้ž็บฟๆ€งๆ•ฐๆฎๅค„็†๏ผŒๆตๅฝขๅญฆไน ๏ผŒ่ฏ•ๅ›พไฟๆŒ่ฟ‘้‚ปๆ ทๆœฌไน‹้—ด็š„่ท็ฆปไธๅŒใ€‚

LLE๏ผš้€‚ๅˆ้ž็บฟๆ€งๆ•ฐๆฎๅค„็†๏ผŒๆตๅฝขๅญฆไน ๏ผŒ่ฏ•ๅ›พไฟๆŒ้‚ปๅŸŸๅ†…ๆ ทๆœฌไน‹้—ด็š„็บฟๆ€งๅ…ณ็ณปใ€‚

t-SNE๏ผš้€‚ๅˆ้ž็บฟๆ€งๆ•ฐๆฎๅค„็†๏ผŒๅฏๅฐ†ๆ•ฐๆฎ้™่‡ณ2็ปดๆˆ–3็ปดๅบฆๆ–นไพฟๅฏ่ง†ๅŒ–ใ€‚

ๆตๅฝขไป‹็ป

ๆตๅฝขๅญฆไน (manifold learning)ๆ˜ฏไธ€็ฑปๅ€Ÿ้‰ดๆ‹“ๆ‰‘ๆตๅฝขๆฆ‚ๅฟต็š„้™็ปดๆ–นๆณ•ใ€‚โ€œๆตๅฝขโ€ๆ˜ฏๅœจๅฑ€้ƒจไธŽๆฌงๆฐ็ฉบ้—ดๅŒ่ƒš็š„็ฉบ้—ด๏ผŒๆข่จ€ไน‹๏ผŒๅฎƒๅœจๅฑ€้ƒจๅ…ทๆœ‰ๆฌงๆฐ็ฉบ้—ด็š„ๆ€ง่ดจ๏ผŒ่ƒฝ็”จๆฌงๆฐ่ท็ฆปๆฅ่ฟ›่กŒ่ท็ฆป่ฎก็ฎ—ใ€‚่ฟ™็ป™้™็ปดๆ–นๆณ•ๅธฆๆฅไบ†ๅพˆๅคง็š„ๅฏๅ‘๏ผš่‹ฅไฝŽ็ปดๆตๅฝขๅตŒๅ…ฅๅˆฐ้ซ˜็ปด็ฉบ้—ดไธญ๏ผŒๅˆ™ๆ•ฐๆฎๆ ทๆœฌๅœจ้ซ˜็ปดๅบฆ็ฉบ้—ด็š„ๅˆ†ๅธƒ่™ฝ็„ถ็œ‹ไธŠๅŽป้žๅธธๅคๆ‚๏ผŒไฝ†ๅœจๅฑ€้ƒจไธŠไปๅ…ทๆœ‰ๆฌงๆฐ็ฉบ้—ด็š„ๆ€ง่ดจใ€‚ๅ› ๆญค๏ผŒๅฏไปฅๅฎนๆ˜“ๅœฐๅœจๅฑ€้ƒจๅปบ็ซ‹้™็ปดๆ˜ ๅฐ„ๅ…ณ็ณป๏ผŒ็„ถๅŽๅ†่ฎพๆณ•ๅฐ†ๅฑ€้ƒจๆ˜ ๅฐ„ๅ…ณ็ณปๆŽจๅนฟๅˆฐๅ…จๅฑ€ใ€‚ๅฝ“็ปดๆ•ฐ่ขซ้™่‡ณไบŒ็ปดๆˆ–ไธ‰็ปดๆ—ถ๏ผŒ่ƒฝๅฏนๆ•ฐๆฎ่ฟ›่กŒๅฏ่ง†ๅŒ–ๅฑ•็คบ๏ผŒๅ› ๆญคๆตๅฝขๅญฆไน ไนŸๅฏไปฅ่ขซ็”จไบŽๅฏ่ง†ๅŒ–ใ€‚

ๆตๅฝข๏ผˆ่‹ฑ่ฏญ๏ผšManifolds๏ผ‰๏ผŒๆ˜ฏๅฑ€้ƒจๅ…ทๆœ‰ๆฌงๅ‡ ้‡Œๅพ—็ฉบ้—ดๆ€ง่ดจ็š„็ฉบ้—ด๏ผŒๆ˜ฏๆฌงๅ‡ ้‡Œๅพ—็ฉบ้—ดไธญ็š„ๆ›ฒ็บฟใ€ๆ›ฒ้ข็ญ‰ๆฆ‚ๅฟต็š„ๆŽจๅนฟใ€‚ๆฌงๅ‡ ้‡Œๅพ—็ฉบ้—ดๅฐฑๆ˜ฏๆœ€็ฎ€ๅ•็š„ๆตๅฝข็š„ๅฎžไพ‹ใ€‚ๅœฐ็ƒ่กจ้ข่ฟ™ๆ ท็š„็ƒ้ขๅˆ™ๆ˜ฏไธ€ไธช็จๅพฎๅคๆ‚็š„ไพ‹ๅญใ€‚ไธ€่ˆฌ็š„ๆตๅฝขๅฏไปฅ้€š่ฟ‡ๆŠŠ่ฎธๅคšๅนณ็›ด็š„็‰‡ๆŠ˜ๅผฏๅนถ็ฒ˜่ฟž่€Œๆˆใ€‚ๆฏ”ๅฆ‚ไธ‹ๅ›พ๏ผŒๅœฐ็ƒๆ˜ฏไธ‰็ปด็š„๏ผŒๆˆ‘ไปฌๅฏไปฅๆƒณ่ฑกๆˆๅคšไธชๆžๅฐไบŒ็ปด็บธ็‰‡๏ผˆๅœฐๅ›พ๏ผ‰ๆ‹ผๆŽฅ่€Œๆˆใ€‚

็ผบๅคฑๅ€ผๆฏ”็އ(Missing Value Ratio)

ๅฝ“็ผบๅคฑๅ€ผๅœจๆ•ฐๆฎ้›†ไธญ็š„ๅ ๆฏ”่ฟ‡้ซ˜ๆ—ถ๏ผŒไธ€่ˆฌไผš้€‰ๆ‹ฉ็›ดๆŽฅๅˆ ้™ค่ฟ™ไธชๅ˜้‡๏ผŒๅ› ไธบๅฎƒๅŒ…ๅซ็š„ไฟกๆฏๅคชๅฐ‘ไบ†ใ€‚ไฝ†ๅ…ทไฝ“ๅˆ ไธๅˆ ใ€ๆ€Žไนˆๅˆ ้œ€่ฆ่ง†ๆƒ…ๅ†ต่€Œๅฎš๏ผŒๆˆ‘ไปฌๅฏไปฅ่ฎพ็ฝฎไธ€ไธช้˜ˆๅ€ผ๏ผŒๅฆ‚ๆžœ็ผบๅคฑๅ€ผๅ ๆฏ”้ซ˜ไบŽ้˜ˆๅ€ผ๏ผŒๅˆ ้™คๅฎƒๆ‰€ๅœจ็š„ๅˆ—ใ€‚้˜ˆๅ€ผ่ถŠ้ซ˜๏ผŒ้™็ปดๆ–นๆณ•่ถŠ็งฏๆžใ€‚

ไฝŽๆ–นๅทฎๆปคๆณข(Low Variance Filter)

ๅฆ‚ๆžœๆˆ‘ไปฌๆœ‰ไธ€ไธชๆ•ฐๆฎ้›†๏ผŒๅ…ถไธญๆŸๅˆ—็š„ๆ•ฐๅ€ผๅŸบๆœฌไธ€่‡ด๏ผŒไนŸๅฐฑๆ˜ฏๅฎƒ็š„ๆ–นๅทฎ้žๅธธไฝŽ๏ผŒ้‚ฃไนˆ่ฟ™ไธชๅ˜้‡่ฟ˜ๆœ‰ไปทๅ€ผๅ—๏ผŸๅ’ŒไธŠไธ€็งๆ–นๆณ•็š„ๆ€่ทฏไธ€่‡ด๏ผŒๆˆ‘ไปฌ้€šๅธธ่ฎคไธบไฝŽๆ–นๅทฎๅ˜้‡ๆบๅธฆ็š„ไฟกๆฏ้‡ไนŸๅพˆๅฐ‘๏ผŒๆ‰€ไปฅๅฏไปฅๆŠŠๅฎƒ็›ดๆŽฅๅˆ ้™คใ€‚

ๆ”พๅˆฐๅฎž่ทตไธญ๏ผŒๅฐฑๆ˜ฏๅ…ˆ่ฎก็ฎ—ๆ‰€ๆœ‰ๅ˜้‡็š„ๆ–นๅทฎๅคงๅฐ๏ผŒ็„ถๅŽๅˆ ๅŽปๅ…ถไธญๆœ€ๅฐ็š„ๅ‡ ไธชใ€‚้œ€่ฆๆณจๆ„็š„ไธ€็‚นๆ˜ฏ๏ผšๆ–นๅทฎไธŽๆ•ฐๆฎ่Œƒๅ›ด็›ธๅ…ณ็š„๏ผŒๅ› ๆญคๅœจ้‡‡็”จ่ฏฅๆ–นๆณ•ๅ‰้œ€่ฆๅฏนๆ•ฐๆฎๅšๅฝ’ไธ€ๅŒ–ๅค„็†ใ€‚

้ซ˜็›ธๅ…ณๆปคๆณข(High Correlation filter)

ๅฆ‚ๆžœไธคไธชๅ˜้‡ไน‹้—ดๆ˜ฏ้ซ˜ๅบฆ็›ธๅ…ณ็š„๏ผŒ่ฟ™ๆ„ๅ‘ณ็€ๅฎƒไปฌๅ…ทๆœ‰็›ธไผผ็š„่ถ‹ๅŠฟๅนถไธ”ๅฏ่ƒฝๆบๅธฆ็ฑปไผผ็š„ไฟกๆฏใ€‚ๅŒ็†๏ผŒ่ฟ™็ฑปๅ˜้‡็š„ๅญ˜ๅœจไผš้™ไฝŽๆŸไบ›ๆจกๅž‹็š„ๆ€ง่ƒฝ๏ผˆไพ‹ๅฆ‚็บฟๆ€งๅ’Œ้€ป่พ‘ๅ›žๅฝ’ๆจกๅž‹๏ผ‰ใ€‚ไธบไบ†่งฃๅ†ณ่ฟ™ไธช้—ฎ้ข˜๏ผŒๆˆ‘ไปฌๅฏไปฅ่ฎก็ฎ—็‹ฌ็ซ‹ๆ•ฐๅ€ผๅ˜้‡ไน‹้—ด็š„็›ธๅ…ณๆ€งใ€‚ๅฆ‚ๆžœ็›ธๅ…ณ็ณปๆ•ฐ่ถ…่ฟ‡ๆŸไธช้˜ˆๅ€ผ๏ผŒๅฐฑๅˆ ้™คๅ…ถไธญไธ€ไธชๅ˜้‡ใ€‚

้šๆœบๆฃฎๆž—(Random Forest)

้šๆœบๆฃฎๆž—ๆ˜ฏไธ€็งๅนฟๆณ›ไฝฟ็”จ็š„็‰นๅพ้€‰ๆ‹ฉ็ฎ—ๆณ•๏ผŒๅฎƒไผš่‡ชๅŠจ่ฎก็ฎ—ๅ„ไธช็‰นๅพ็š„้‡่ฆๆ€ง๏ผŒๆ‰€ไปฅๆ— ้œ€ๅ•็‹ฌ็ผ–็จ‹ใ€‚่ฟ™ๆœ‰ๅŠฉไบŽๆˆ‘ไปฌ้€‰ๆ‹ฉ่พƒๅฐ็š„็‰นๅพๅญ้›†ใ€‚

ๅœจๅผ€ๅง‹้™็ปดๅ‰๏ผŒๆˆ‘ไปฌๅ…ˆๆŠŠๆ•ฐๆฎ่ฝฌๆขๆˆๆ•ฐๅญ—ๆ ผๅผ๏ผŒๅ› ไธบ้šๆœบๆฃฎๆž—ๅชๆŽฅๅ—ๆ•ฐๅญ—่พ“ๅ…ฅใ€‚ๅŒๆ—ถ๏ผŒID่ฟ™ไธชๅ˜้‡่™ฝ็„ถๆ˜ฏๆ•ฐๅญ—๏ผŒไฝ†ๅฎƒ็›ฎๅ‰ๅนถไธ้‡่ฆ๏ผŒๆ‰€ไปฅๅฏไปฅๅˆ ๅŽปใ€‚

ๅๅ‘็‰นๅพๆถˆ้™ค(Backward Feature Elimination)

ไปฅไธ‹ๆ˜ฏๅๅ‘็‰นๅพๆถˆ้™ค็š„ไธป่ฆๆญฅ้ชค๏ผš

  1. ๅ…ˆ่Žทๅ–ๆ•ฐๆฎ้›†ไธญ็š„ๅ…จ้ƒจnไธชๅ˜้‡๏ผŒ็„ถๅŽ็”จๅฎƒไปฌ่ฎญ็ปƒไธ€ไธชๆจกๅž‹ใ€‚

  2. ่ฎก็ฎ—ๆจกๅž‹็š„ๆ€ง่ƒฝใ€‚

  3. ๅœจๅˆ ้™คๆฏไธชๅ˜้‡๏ผˆnๆฌก๏ผ‰ๅŽ่ฎก็ฎ—ๆจกๅž‹็š„ๆ€ง่ƒฝ๏ผŒๅณๆˆ‘ไปฌๆฏๆฌก้ƒฝๅŽปๆމไธ€ไธชๅ˜้‡๏ผŒ็”จๅ‰ฉไฝ™็š„n-1ไธชๅ˜้‡่ฎญ็ปƒๆจกๅž‹ใ€‚

  4. ็กฎๅฎšๅฏนๆจกๅž‹ๆ€ง่ƒฝๅฝฑๅ“ๆœ€ๅฐ็š„ๅ˜้‡๏ผŒๆŠŠๅฎƒๅˆ ้™คใ€‚

  5. ้‡ๅคๆญค่ฟ‡็จ‹๏ผŒ็›ดๅˆฐไธๅ†่ƒฝๅˆ ้™คไปปไฝ•ๅ˜้‡ใ€‚

ๅ‰ๅ‘็‰นๅพ้€‰ๆ‹ฉ(Forward Feature Selection)

ๅ‰ๅ‘็‰นๅพ้€‰ๆ‹ฉๅ…ถๅฎžๅฐฑๆ˜ฏๅๅ‘็‰นๅพๆถˆ้™ค็š„็›ธๅ่ฟ‡็จ‹๏ผŒๅณๆ‰พๅˆฐ่ƒฝๆ”นๅ–„ๆจกๅž‹ๆ€ง่ƒฝ็š„ๆœ€ไฝณ็‰นๅพ๏ผŒ่€Œไธๆ˜ฏๅˆ ้™คๅผฑๅฝฑๅ“็‰นๅพใ€‚ๅฎƒ่ƒŒๅŽ็š„ๆ€่ทฏๅฆ‚ไธ‹ๆ‰€่ฟฐ๏ผš

  1. ้€‰ๆ‹ฉไธ€ไธช็‰นๅพ๏ผŒ็”จๆฏไธช็‰นๅพ่ฎญ็ปƒๆจกๅž‹nๆฌก๏ผŒๅพ—ๅˆฐnไธชๆจกๅž‹ใ€‚

  2. ้€‰ๆ‹ฉๆจกๅž‹ๆ€ง่ƒฝๆœ€ไฝณ็š„ๅ˜้‡ไฝœไธบๅˆๅง‹ๅ˜้‡ใ€‚

  3. ๆฏๆฌกๆทปๅŠ ไธ€ไธชๅ˜้‡็ปง็ปญ่ฎญ็ปƒ๏ผŒ้‡ๅคไธŠไธ€่ฟ‡็จ‹๏ผŒๆœ€ๅŽไฟ็•™ๆ€ง่ƒฝๆๅ‡ๆœ€ๅคง็š„ๅ˜้‡ใ€‚

  4. ไธ€็›ดๆทปๅŠ ๏ผŒไธ€็›ด็ญ›้€‰๏ผŒ็›ดๅˆฐๆจกๅž‹ๆ€ง่ƒฝไธๅ†ๆœ‰ๆ˜Žๆ˜พๆ้ซ˜ใ€‚

ๅ› ๅญๅˆ†ๆž(Factor Analysis)

ๅ› ๅญๅˆ†ๆžๆ˜ฏไธ€็งๅธธ่ง็š„็ปŸ่ฎกๆ–นๆณ•๏ผŒๅฎƒ่ƒฝไปŽๅคšไธชๅ˜้‡ไธญๆๅ–ๅ…ฑๆ€งๅ› ๅญ๏ผŒๅนถๅพ—ๅˆฐๆœ€ไผ˜่งฃใ€‚ๅ‡่ฎพๆˆ‘ไปฌๆœ‰ไธคไธชๅ˜้‡๏ผšๆ”ถๅ…ฅๅ’Œๆ•™่‚ฒใ€‚ๅฎƒไปฌๅฏ่ƒฝๆ˜ฏ้ซ˜ๅบฆ็›ธๅ…ณ็š„๏ผŒๅ› ไธบๆ€ปไฝ“ๆฅ็œ‹๏ผŒๅญฆๅކ้ซ˜็š„ไบบไธ€่ˆฌๆ”ถๅ…ฅไนŸๆ›ด้ซ˜๏ผŒๅไน‹ไบฆ็„ถใ€‚ๆ‰€ไปฅๅฎƒไปฌๅฏ่ƒฝๅญ˜ๅœจไธ€ไธชๆฝœๅœจ็š„ๅ…ฑๆ€งๅ› ๅญ๏ผŒๆฏ”ๅฆ‚โ€œ่ƒฝๅŠ›โ€ใ€‚

ๅœจๅ› ๅญๅˆ†ๆžไธญ๏ผŒๆˆ‘ไปฌๅฐ†ๅ˜้‡ๆŒ‰ๅ…ถ็›ธๅ…ณๆ€งๅˆ†็ป„๏ผŒๅณ็‰นๅฎš็ป„ๅ†…ๆ‰€ๆœ‰ๅ˜้‡็š„็›ธๅ…ณๆ€ง่พƒ้ซ˜๏ผŒ็ป„้—ดๅ˜้‡็š„็›ธๅ…ณๆ€ง่พƒไฝŽใ€‚ๆˆ‘ไปฌๆŠŠๆฏไธช็ป„็งฐไธบไธ€ไธชๅ› ๅญ๏ผŒๅฎƒๆ˜ฏๅคšไธชๅ˜้‡็š„็ป„ๅˆใ€‚ๅ’ŒๅŽŸๅง‹ๆ•ฐๆฎ้›†็š„ๅ˜้‡็›ธๆฏ”๏ผŒ่ฟ™ไบ›ๅ› ๅญๅœจๆ•ฐ้‡ไธŠๆ›ดๅฐ‘๏ผŒไฝ†ๆบๅธฆ็š„ไฟกๆฏๅŸบๆœฌไธ€่‡ดใ€‚

็บฟๆ€ง้™็ปดๆ–นๆณ•

็บฟๆ€ง้™็ปด็š„ๆ–นๆณ•ๅฏไปฅๅบ”ๅฏนๅƒไธ‹ๅ›พ่ฟ™ๆ ท็ฎ€ๅ•็š„ๆ•ฐๆฎ(ๆฏ”ๅฆ‚PCAๆ‰พๆ–นๅทฎๅคง็š„็ปดๅบฆ่ฟ›่กŒไฟ็•™)

ไธปๆˆๅˆ†ๅˆ†ๆž(PCA)

ไธปๆˆๅˆ†ๅˆ†ๆž(Principal Component Analysis๏ผŒ็ฎ€็งฐPCA)ๆ˜ฏๆœ€ๅธธ็”จ็š„ไธ€็ง้™็ปดๆ–นๆณ•๏ผŒๆ—จๅœจๆ‰พๅˆฐๆ•ฐๆฎไธญ็š„ไธปๆˆๅˆ†๏ผŒๅนถๅˆฉ็”จ่ฟ™ไบ›ไธปๆˆๅˆ†่กจๅพๅŽŸๅง‹ๆ•ฐๆฎ๏ผŒไปŽ่€Œ่พพๅˆฐ้™็ปด็š„็›ฎ็š„ใ€‚ๅฎƒๅฑžไบŽไธ€็ง็บฟๆ€งใ€้ž็›‘็ฃใ€ๅ…จๅฑ€็š„้™็ปด็ฎ—ๆณ•

ๅœจไป‹็ปPCAไน‹ๅ‰๏ผŒไธๅฆจๅ…ˆ่€ƒ่™‘่ฟ™ๆ ทไธ€ไธช้—ฎ้ข˜๏ผšๅฏนไบŽๆญฃไบคๅฑžๆ€ง็ฉบ้—ดไธญ็š„ๆ ทๆœฌ็‚น๏ผŒๅฆ‚ไฝ•็”จไธ€ไธช่ถ…ๅนณ้ขๅฏนๆ‰€ๆœ‰ๆ ทๆœฌ่ฟ›่กŒๆฐๅฝ“็š„่กจ่พพ๏ผŸๅฎนๆ˜“ๆƒณๅˆฐ๏ผŒ่‹ฅๅญ˜ๅœจ่ฟ™ๆ ท็š„่ถ…ๅนณ้ข๏ผŒ้‚ฃไนˆๅฎƒๅคงๆฆ‚ๅบ”่ฏฅๆœ‰่ฟ™ๆ ท็š„ๆ€ง่ดจ๏ผš

  1. ๆœ€ๅคงๅฏๅˆ†ๆ€ง๏ผšๆ ทๆœฌ็‚นๅœจ่ฟ™ไธช่ถ…ๅนณ้ขไธŠ็š„ๆŠ•ๅฝฑ่ƒฝๅฐฝๅฏ่ƒฝๅˆ†ๅผ€๏ผˆๆœ€ๅคงๆ–นๅทฎ็†่ฎบ๏ผ‰

  2. ๆœ€่ฟ‘้‡ๆž„ๆ€ง๏ผšๆ ทๆœฌ็‚นๅˆฐ่ฟ™ไธช่ถ…ๅนณ้ข็š„่ท็ฆป้ƒฝ่ถณๅคŸ่ฟ‘๏ผˆๆœ€ๅฐๅนณๆ–น่ฏฏๅทฎ็†่ฎบ๏ผ‰

ๅŸบไบŽ่ฟ™ไธคไธชๆ€ง่ดจ้ƒฝๅฏไปฅๆŽจๅฏผๅ‡บPCA๏ผŒ่ฟ™้‡Œไปฅๆœ€ๅคงๅฏๅˆ†ๆ€งๆฅๆŽจๅฏผใ€‚

ไธปๆˆๅˆ†ๅˆ†ๆž้กพๅๆ€ไน‰๏ผŒๅฐฑๆ˜ฏๆ‰พๅ‡บๆ•ฐๆฎ้‡Œๆœ€ไธป่ฆ็š„ๆ–น้ข๏ผŒ็”จๆ•ฐๆฎ้‡Œๆœ€ไธป่ฆ็š„ๆ–น้ขๆฅไปฃๆ›ฟๅŽŸๅง‹ๆ•ฐๆฎใ€‚ๅ…ทไฝ“็š„๏ผŒๅ‡ๅฆ‚ๆˆ‘ไปฌ็š„ๆ•ฐๆฎ้›†ๆ˜ฏnn็ปด็š„๏ผŒๅ…ฑๆœ‰mm ไธชๆ•ฐๆฎ(x1,x2,โ€ฆ,xm)(x_1,x_2,\dots,x_m)ใ€‚ๆˆ‘ไปฌๅธŒๆœ›ๅฐ†่ฟ™mmไธชๆ•ฐๆฎ็š„็ปดๅบฆไปŽnn็ปด้™ๅˆฐnโ€ฒn'็ปด๏ผŒๅธŒๆœ›่ฟ™mmไธชnโ€ฒn'็ปด็š„ๆ•ฐๆฎ้›†ๅฐฝๅฏ่ƒฝ็š„ไปฃ่กจๅŽŸๅง‹ๆ•ฐๆฎ้›†ใ€‚ๆˆ‘ไปฌ็Ÿฅ้“ๆ•ฐๆฎไปŽnn็ปด้™ๅˆฐnโ€ฒn'็ปด่‚ฏๅฎšไผšๆœ‰ๆŸๅคฑ๏ผŒไฝ†ๆ˜ฏๆˆ‘ไปฌๅธŒๆœ›ๆŸๅคฑๅฐฝๅฏ่ƒฝ็š„ๅฐใ€‚้‚ฃไนˆๅฆ‚ไฝ•่ฎฉ่ฟ™nโ€ฒn'็ปด็š„ๆ•ฐๆฎๅฐฝๅฏ่ƒฝ่กจ็คบๅŽŸๆฅ็š„ๆ•ฐๆฎๅ‘ข๏ผŸ

ๆˆ‘ไปฌๅ…ˆ็œ‹็œ‹ๆœ€็ฎ€ๅ•็š„ๆƒ…ๅ†ต๏ผŒไนŸๅฐฑๆ˜ฏn=2n=2๏ผŒnโ€ฒ=1n'=1,ไนŸๅฐฑๆ˜ฏๅฐ†ๆ•ฐๆฎไปŽไบŒ็ปด้™็ปดๅˆฐไธ€็ปดใ€‚ๆ•ฐๆฎๅฆ‚ไธ‹ๅ›พใ€‚ๆˆ‘ไปฌๅธŒๆœ›ๆ‰พๅˆฐๆŸไธ€ไธช็ปดๅบฆๆ–นๅ‘๏ผŒๅฎƒๅฏไปฅไปฃ่กจ่ฟ™ไธคไธช็ปดๅบฆ็š„ๆ•ฐๆฎใ€‚ๅ›พไธญๅˆ—ไบ†ไธคไธชๅ‘้‡ๆ–นๅ‘๏ผŒu1u_1ๅ’Œu2u_2๏ผŒ้‚ฃไนˆๅ“ชไธชๅ‘้‡ๅฏไปฅๆ›ดๅฅฝ็š„ไปฃ่กจๅŽŸๅง‹ๆ•ฐๆฎ้›†ๅ‘ข๏ผŸ ไพ‹ๅฆ‚ไธ‹ๅ›พ๏ผŒไปŽ็›ด่ง‚ไธŠไนŸๅฏไปฅ็œ‹ๅ‡บ๏ผŒu1u_1ๆฏ”u2u_2ๅฅฝ๏ผŒ่ฟ™ๅฐฑๆ˜ฏๆˆ‘ไปฌๆ‰€่ฏด็š„ๆœ€ๅคงๅฏๅˆ†ๆ€ง

ไธŠๅ›พๆ˜ฏไบŒ็ปด็ฉบ้—ดไธญ็ป่ฟ‡ไธญๅฟƒๅŒ–็š„ไธ€็ป„ๆ•ฐๆฎ๏ผŒๆˆ‘ไปฌๅพˆๅฎนๆ˜“็œ‹ๅ‡บไธปๆˆๅˆ†ๆ‰€ๅœจ็š„่ฝด(ไปฅไธ‹็งฐไธบไธป่ฝด)็š„ๅคง่‡ดๆ–นๅ‘๏ผŒๅณไธŠๅ›พไธญu1u_1ๆ‰€ๅœจ็š„่ฝดใ€‚ๅ› ไธบu1u_1ๆ‰€ๅค„็š„่ฝดไธŠ๏ผŒๆ•ฐๆฎๅˆ†ๅธƒ็š„ๆ›ดไธบๅˆ†ๆ•ฃ๏ผŒ่ฟ™ไนŸๆ„ๅ‘ณ็€ๆ•ฐๆฎๅœจ่ฟ™ไธชๆ–นๅ‘ไธŠๆ–นๅทฎๆ›ดๅคงใ€‚ๅœจไฟกๅทๅค„็†้ข†ๅŸŸ๏ผŒๆˆ‘ไปฌ่ฎคไธบไฟกๅทๅ…ทๆœ‰่พƒๅคงๆ–นๅทฎ๏ผŒๅ™ชๅฃฐๅ…ทๆœ‰่พƒๅฐๆ–นๅทฎ๏ผŒไฟกๅทไธŽๅ™ชๅฃฐไน‹ๆฏ”็งฐไธบไฟกๅ™ชๆฏ”ใ€‚ไฟกๅ™ชๆฏ”่ถŠๅคงๆ„ๅ‘ณ็€ๆ•ฐๆฎ็š„่ดจ้‡่ถŠๅฅฝ๏ผŒๅไน‹๏ผŒไฟกๅ™ชๆฏ”่ถŠๅฐๆ„ๅ‘ณ็€ๆ•ฐๆฎ็š„่ดจ้‡่ถŠๅฐใ€‚็”ฑๆญคๆˆ‘ไปฌไธ้šพๅผ•ๅ‡บPCA็š„็›ฎๆ ‡๏ผŒๅณๆœ€ๅคงๅŒ–ๆŠ•ๅฝฑๆ–นๅทฎ๏ผŒไนŸๅฐฑๆ˜ฏ่ฎฉๆ•ฐๆฎๅœจไธป่ฝดไธŠๆŠ•ๅฝฑ็š„ๆ–นๅทฎๆœ€ๅคงใ€‚

ๅฏนไบŽ็ป™ๅฎš็š„ไธ€็ป„ๆ•ฐๆฎ็‚น{v1,v2,โ€ฆ,vn}\{v_1,v_2,\dots,v_n\}๏ผŒๅ…ถไธญๆ‰€ๆœ‰ๅ‘้‡ๅ‡ไธบๅˆ—ๅ‘้‡๏ผŒไธญๅฟƒๅŒ–ๅŽ็š„่กจ็คบไธบ{x1,x2,โ€ฆ,xn}={v1โˆ’ฮผ,v2โˆ’ฮผ,โ€ฆ,vnโˆ’ฮผ}\{x_1,x_2,\dots,x_n\}=\{v_1-\mu,v_2-\mu,\dots,v_n-\mu\}๏ผŒๅ…ถไธญฮผ=1nโˆ‘i=1nvi\mu = \frac{1}{n}\sum\limits_{i=1}^nv_i๏ผŒๅณๆฏไธชๆ•ฐๆฎ็‚นๅ‡ๆ ทๆœฌ้›†ๅ‡ๅ€ผใ€‚ๆˆ‘ไปฌ็Ÿฅ้“๏ผŒๅ‘้‡ๅ†…็งฏๅœจๅ‡ ไฝ•ไธŠ่กจ็คบไธบ็ฌฌไธ€ไธชๅ‘้‡ๆŠ•ๅฝฑๅˆฐ็ฌฌไบŒไธชๅ‘้‡ไธŠ็š„้•ฟๅบฆ๏ผŒๅ› ๆญคๅ‘้‡xix_iๅœจww(ๅ•ไฝๆ–นๅ‘ๅ‘้‡)ไธŠ็š„ๆŠ•ๅฝฑๅๆ ‡ๅฏไปฅ่กจ็คบไธบ(xi,w)=xiTw(x_i,w)=x_i^Twใ€‚ๆ‰€ไปฅ็›ฎๆ ‡ๆ˜ฏๆ‰พๅˆฐไธ€ไธชๆŠ•ๅฝฑๆ–นๅ‘ww๏ผŒไฝฟx1,x2,โ€ฆ,xnx_1,x_2,\dots,x_nๅœจwwไธŠ็š„ๆŠ•ๅฝฑๆ–นๅทฎๅฐฝๅฏ่ƒฝๅคงใ€‚ๆ˜“็Ÿฅ๏ผŒๆŠ•ๅฝฑไน‹ๅŽๅ‡ๅ€ผไธบ00(ๅ› ไธบฮผโ€ฒ=1nโˆ‘i=1nxiTw=(1nโˆ‘i=1nxiT)w=0\mu'=\frac{1}{n}\sum\limits_{i=1}^nx_i^Tw=(\frac{1}{n}\sum\limits_{i=1}^nx_i^T)w=0๏ผŒ่ฟ™ไนŸๆ˜ฏๆˆ‘ไปฌ่ฟ›่กŒไธญๅฟƒๅŒ–็š„ๆ„ไน‰)๏ผŒๅ› ๆญคๆŠ•ๅฝฑๅŽ็š„ๆ–นๅทฎๅฏไปฅ่กจ็คบไธบ๏ผš

D(x)=1nโˆ‘i=1n(xiTw)2=1nโˆ‘i=1n(xiTw)T(xiTw)=1nโˆ‘i=1nwTxixiTw=wT(1nโˆ‘i=1nxixiT)wD(x)=\frac{1}{n}\sum\limits_{i=1}^n(x_i^Tw)^2=\frac{1}{n}\sum\limits_{i=1}^n(x_i^Tw)^T(x_i^Tw)=\frac{1}{n}\sum\limits_{i=1}^nw^Tx_ix_i^Tw = w^T(\frac{1}{n}\sum\limits_{i=1}^nx_ix_i^T)w

1nโˆ‘i=1nwTxixiTw\frac{1}{n}\sum\limits_{i=1}^nw^Tx_ix_i^Twๅ…ถๅฎžๅฐฑๆ˜ฏๆ ทๆœฌ็š„ๅๆ–นๅทฎ็Ÿฉ้˜ต๏ผŒๆˆ‘ไปฌๅฐ†ๅ…ถๅ†™ไฝœโˆ‘\sum๏ผŒไธ”็”ฑไบŽwwๆ˜ฏๅ•ไฝๆ–นๅ‘ๅ‘้‡๏ผŒๅณwTw=1w^Tw=1ใ€‚ๆ‰€ไปฅ๏ผŒๆˆ‘ไปฌ่ฆ่งฃๅ†ณ็š„ๆœ€ๅคงๅŒ–้—ฎ้ข˜ๅฏ่กจ็คบไธบ๏ผš

max{wTโˆ‘w},ย ย ย ย s.t.ย ย wTw=1max\{w^T\sum w\},\ \ \ \ s.t.\ \ w^Tw=1

ๅผ•ๅ…ฅๆ‹‰ๆ ผๆœ—ๆ—ฅไน˜ๅญ๏ผŒๅนถๅฏนwwๆฑ‚ๅฏผไปคๅ…ถ็ญ‰ไบŽ00๏ผŒไพฟๅฏไปฅๆŽจๅ‡บโˆ‘w=ฮปw\sum w=\lambda w๏ผŒๆญคๆ—ถ๏ผš

D(x)=wTโˆ‘w=ฮปwTw=ฮปD(x)=w^T\sum w = \lambda w^Tw=\lambda

็†Ÿๆ‚‰็บฟๆ€งไปฃๆ•ฐ็š„้ฉฌไธŠไผšๅ‘็Žฐ๏ผŒๅŽŸๆฅxxๆŠ•ๅฝฑๅŽ็š„ๆ–นๅทฎๅฐฑๆ˜ฏๅๆ–นๅทฎ็Ÿฉ้˜ต็š„็‰นๅพๅ€ผใ€‚ๆˆ‘ไปฌ่ฆๆ‰พๅˆฐๆœ€ๅคง็š„ๆ–นๅทฎไนŸๅฐฑๆ˜ฏๅๆ–นๅทฎ็Ÿฉ้˜ตๆœ€ๅคง็š„็‰นๅพๅ€ผ๏ผŒๆœ€ไฝณๆŠ•ๅฝฑๆ–นๅ‘ๅฐฑๆ˜ฏๆœ€ๅคง็‰นๅพๅ€ผๅฏนๅบ”็š„็‰นๅพๅ‘้‡ใ€‚ๆฌกไฝณๆŠ•ๅฝฑๆ–นๅ‘ไฝไบŽๆœ€ไฝณๆŠ•ๅฝฑๆ–นๅ‘็š„ๆญฃไบค็ฉบ้—ดไธญ๏ผŒๆ˜ฏ็ฌฌไบŒๅคง็‰นๅพๅ€ผๅฏนๅบ”็š„็‰นๅพๅ‘้‡๏ผŒไปฅๆญค็ฑปๆŽจใ€‚ๆ‰€ไปฅๆœ‰ไปฅไธ‹PCAๆฑ‚่งฃๆ–นๆณ•๏ผš

  1. ๅฏนๆ ทๆœฌๆ•ฐๆฎ่ฟ›่กŒไธญๅฟƒๅŒ–ๅค„็†

  2. ๆฑ‚ๆ ทๆœฌๅๆ–นๅทฎ็Ÿฉ้˜ต

  3. ๅฏนๅๆ–นๅทฎ็Ÿฉ้˜ต่ฟ›่กŒ็‰นๅพๅ€ผๅˆ†่งฃ(SVD)๏ผŒๅฐ†็‰นๅพๅ€ผไปŽๅคงๅˆฐๅฐๆŽ’ๅˆ—

  4. ๅ–็‰นๅพๅ€ผๅ‰ddๅคงๅฏนๅบ”็š„็‰นๅพๅ‘้‡w1,w2,โ€ฆ,wdw_1,w_2,\dots,w_d๏ผŒ้€š่ฟ‡ไปฅไธ‹ๆ˜ ๅฐ„ๅฐ†nn็ปดๆ ทๆœฌๆ˜ ๅฐ„ๅˆฐdd็ปด๏ผš

  5. xiโ€ฒ=[w1Txiw2Txi..wdTxi]x'_i = \left[ \begin{matrix} w_1^Tx_i\\ w_2^Tx_i \\ . \\ .\\ w_d^Tx_i \end{matrix} \right]

ๆ–ฐ็š„xiโ€ฒx_i'็š„็ฌฌdd็ปดๅฐฑๆ˜ฏxix_iๅœจ็ฌฌddไธชไธปๆˆๅˆ†wdw_dๆ–นๅ‘ไธŠ็š„ๆŠ•ๅฝฑ๏ผŒ้€š่ฟ‡้€‰ๅ–ๆœ€ๅคง็š„ddไธช็‰นๅพๅ€ผๅฏนๅบ”็š„็‰นๅพๅ‘้‡๏ผŒๆˆ‘ไปฌๅฐ†ๆ–นๅทฎ่พƒๅฐ็š„็‰นๅพ(ๅ™ชๅฃฐ)ๆŠ›ๅผƒ๏ผŒไฝฟๅพ—ๆฏไธชnn็ปดๅˆ—ๅ‘้‡xix_i่ขซๆ˜ ๅฐ„ไธบdd็ปดๅˆ—ๅ‘้‡xiโ€ฒx'_i๏ผŒๅฎšไน‰้™็ปดๅŽ็š„ไฟกๆฏๅ ๆฏ”ไธบ๏ผš ฮท=โˆ‘i=1dฮปi2โˆ‘i=1nฮปi2\eta=\sqrt{\frac{\sum\limits_{i=1}^d\lambda_i^2}{\sum\limits_{i=1}^n\lambda_i^2}}

็บฟๆ€งๅˆคๅˆซๅˆ†ๆž(LDA)

็บฟๆ€งๅˆคๅˆซๅˆ†ๆž(Linear Discriminant Analysis ,LDA)ๆ˜ฏไธ€็ง็›‘็ฃๅญฆไน ็š„้™็ปดๆŠ€ๆœฏไนŸๅฏไปฅๅšๅˆ†็ฑปไปปๅŠก๏ผŒไนŸๅฐฑๆ˜ฏ่ฏดๅฎƒ็š„ๆ•ฐๆฎ้›†็š„ๆฏไธชๆ ทๆœฌๆ˜ฏๆœ‰็ฑปๅˆซ่พ“ๅ‡บ็š„๏ผŒ่ฟ™็‚นๅ’ŒPCAไธๅŒใ€‚PCAๆ˜ฏไธ่€ƒ่™‘ๆ ทๆœฌ็ฑปๅˆซ่พ“ๅ‡บ็š„ๆ— ็›‘็ฃ้™็ปดๆŠ€ๆœฏใ€‚LDA็š„ๆ€ๆƒณๅฏไปฅ็”จไธ€ๅฅ่ฏๆฆ‚ๆ‹ฌ๏ผŒๅฐฑๆ˜ฏโ€œๆŠ•ๅฝฑๅŽ็ฑปๅ†…ๆ–นๅทฎๆœ€ๅฐ๏ผŒ็ฑป้—ดๆ–นๅทฎๆœ€ๅคงโ€๏ผŒๅฆ‚ไธ‹ๅ›พๆ‰€็คบใ€‚ ๆˆ‘ไปฌ่ฆๅฐ†ๆ•ฐๆฎๅœจไฝŽ็ปดๅบฆไธŠ่ฟ›่กŒๆŠ•ๅฝฑ๏ผŒๆˆ‘ไปฌๆŠ•ๅฝฑๅŽๅธŒๆœ›

  1. ๆฏไธ€็ง็ฑปๅˆซๆ•ฐๆฎ็š„ๆŠ•ๅฝฑ็‚นๅฐฝๅฏ่ƒฝ็š„ๆŽฅ่ฟ‘

  2. ไธๅŒ็ฑปๅˆซ็š„ๆ•ฐๆฎ็š„็ฑปๅˆซไธญๅฟƒไน‹้—ด็š„่ท็ฆปๅฐฝๅฏ่ƒฝ็š„ๅคง

็ป™ๅฎšๆ•ฐๆฎ้›† D={(xi,yi)}i=1m,ย ย yiโˆˆ{0,1}D=\{(x_i,y_i)\}_{i=1}^m,\ \ y_i\in\{0,1\}๏ผŒ

็ฌฌ ii ็ฑป็š„้›†ๅˆ XiX_i๏ผŒ็ฌฌ ii ็ฑป็š„ๅ‡ๅ€ผๅ‘้‡ ฮผi\mu_i ๏ผŒ็ฌฌ ii ็ฑป็š„ๅๆ–นๅทฎ็Ÿฉ้˜ต โˆ‘i\sum_i๏ผŒ iโˆˆ{0,1}i\in\{0,1\} ๅณไธ€ๅ…ฑๅฐฑไธค็ฑป

ไธค็ฑปๆ ทๆœฌ็š„ไธญๅฟƒๅœจ็›ด็บฟ ww ไธŠ็š„ๆŠ•ๅฝฑ๏ผŒๅณ็›ด็บฟไธŽๅŽŸๅ‡ๅ€ผๅ‘้‡็š„ๅ†…็งฏ wTฮผ0w^T\mu_0 ๅ’Œ wTฮผ1w^T\mu_1ใ€‚ๆ‰€ๆœ‰ๆ ทๆœฌ็‚น้ƒฝๆŠ•ๅฝฑๅˆฐ็›ด็บฟไธŠ๏ผŒๅˆ™ไธค็ฑปๆ ทๆœฌ็š„ๅๆ–นๅทฎไธบ wTโˆ‘0ww^T\sum_0wๅ’Œ wTโˆ‘1ww^T\sum_1w

  1. ๆŠ•ๅฝฑๅŽ็ฑปๅ†…ๆ–นๅทฎๆœ€ๅฐ๏ผŒๅณ wTโˆ‘0w+wTโˆ‘1ww^T\sum_0w+w^T\sum_1w ๅฐฝๅฏ่ƒฝๅฐ

  2. ็ฑป้—ดๆ–นๅทฎๆœ€ๅคง๏ผŒๅณ โˆฃโˆฃwTฮผ0โˆ’wTฮผ1โˆฃโˆฃ22||w^T\mu_0-w^T\mu_1||_2^2 ๅฐฝๅฏ่ƒฝๅคง

ๅŒๆ—ถ่€ƒ่™‘ไผ˜ๅŒ–ไบŒ่€…๏ผŒๅˆ™ๅฏๅพ—ๅˆฐๆฌฒๆœ€ๅคงๅŒ–็š„็›ฎๆ ‡๏ผš

J=โˆฃโˆฃwTฮผ0โˆ’wTฮผ1โˆฃโˆฃ22wTโˆ‘0w+wTโˆ‘1w=wT(ฮผ0โˆ’ฮผ1)(ฮผ0โˆ’ฮผ1)TwwT(โˆ‘0+โˆ‘1)wJ=\frac{||w^T\mu_0-w^T\mu_1||_2^2}{w^T\sum_0w+w^T\sum_1w}=\frac{w^T(\mu_0-\mu_1)(\mu_0-\mu_1)^Tw}{w^T(\sum_0+\sum_1)w}

ๅฎšไน‰โ€œ็ฑปๅ†…ๆ•ฃๅบฆ็Ÿฉ้˜ตโ€๏ผšSw=โˆ‘0+โˆ‘1=โˆ‘xโˆˆX0(xโˆ’ฮผ0)(xโˆ’ฮผ0)T+โˆ‘xโˆˆX1(xโˆ’ฮผ1)(xโˆ’ฮผ1)TS_w=\sum_0+\sum_1=\sum\limits_{x\in X_0}(x-\mu_0)(x-\mu_0)^T+\sum\limits_{x\in X_1}(x-\mu_1)(x-\mu_1)^T

ๅฎšไน‰โ€œ็ฑป้—ดๆ•ฃๅบฆ็Ÿฉ้˜ตโ€๏ผš Sb=(ฮผ0โˆ’ฮผ1)(ฮผ0โˆ’ฮผ1)TS_b=(\mu_0-\mu_1)(\mu_0-\mu_1)^T

ๆ‰€ไปฅ๏ผŒๆˆ‘ไปฌๅฏๅฐ†ๆœ€ๅคงๅŒ–็›ฎๆ ‡ๅ‡ฝๆ•ฐ JJ ๅ†™ไธบ๏ผš

J=wTSbwwTSwwJ=\frac{w^TS_bw}{w^TS_ww}

่ฟ™ๅฐฑๆ˜ฏLDAๆฌฒๆœ€ๅคงๅŒ–็š„็›ฎๆ ‡๏ผŒๅณ SbS_b ไธŽ SwS_w ็š„โ€œๅนฟไน‰็‘žๅˆฉๅ•†โ€(Generalized Rayleigh Quotient)

ๅฆ‚ไฝ•็กฎๅฎš ww ๅ‘ข๏ผŸๆณจๆ„ๅˆฐไธŠๅผ็š„ๅˆ†ๅญๅ’Œๅˆ†ๆฏ้ƒฝๆ˜ฏๅ…ณไบŽ ww ็š„ไบŒๆฌก้กน๏ผŒๅ› ๆญคไธŠๅผ็š„่งฃ ww ็š„้•ฟๅบฆๆ— ๅ…ณ๏ผŒๅชไธŽๅ…ถๆ–นๅ‘ๆœ‰ๅ…ณใ€‚ไธๅคฑไธ€่ˆฌๆ€ง๏ผŒไปค wTSww=1w^TS_ww=1 ๏ผŒไธŠๅผ็ญ‰ไปทไบŽ

minw(โˆ’wTSbw)ย ย ย ย s.t.ย ย wTSww=1\mathop{min}\limits_w( -w^TS_bw)\ \ \ \ s.t.\ \ w^TS_ww=1

็”ฑๆ‹‰ๆ ผๆœ—ๆ—ฅไน˜ๅญๆณ•๏ผŒไธŠๅผ็ญ‰ไปทไบŽ

Sbw=ฮปSwwS_bw=\lambda S_ww

ๅ…ถไธญ ฮป\lambda ๆ˜ฏๆ‹‰ๆ ผๆœ—ๆ—ฅไน˜ๅญใ€‚ๆณจๆ„ๅˆฐ SbwS_bw ็š„ๆ–นๅ‘ๆ’ไธบ ฮผ0โˆ’ฮผ1\mu_0-\mu_1 ๏ผŒไธๅฆจไปค Sbw=ฮป(ฮผ0โˆ’ฮผ1)S_bw=\lambda(\mu_0-\mu_1) ไปฃๅ…ฅไธŠๅผ

w=Swโˆ’1(ฮผ0โˆ’ฮผ1)w=S_w^{-1}(\mu_0-\mu_1)

่€ƒ่™‘ๅˆฐๆ•ฐๅ€ผ่งฃ็š„็จณๅฎšๆ€ง๏ผŒๅœจๅฎž่ทตไธญ้€šๅธธๆ˜ฏๅฏน SwS_w ่ฟ›่กŒๅฅ‡ๅผ‚ๅ€ผๅˆ†่งฃ๏ผŒๅณ Sw=Uโˆ‘VTS_w=U\sum V^T ๏ผŒ่ฟ™้‡Œ โˆ‘\sum ๆ˜ฏไธ€ไธชๅฏน่ง’็Ÿฉ้˜ต๏ผŒๅ…ถๅฏน่ง’็บฟไธŠ็š„ๅ…ƒ็ด ๆ˜ฏ SwS_w ็š„ๅฅ‡ๅผ‚ๅ€ผ๏ผŒ็„ถๅŽๅ†็”ฑ Swโˆ’1=Vโˆ‘UTS_w^{-1}=V\sum U^T ๅพ—ๅˆฐ Swโˆ’1S_w^{-1} ใ€‚ๅ€ผๅพ—ไธ€ๆ็š„ๆ˜ฏ๏ผŒLDAๅฏไปŽ่ดๅถๆ–ฏๅ†ณ็ญ–็†่ฎบ็š„่ง’ๅบฆๆฅ้˜่ฟฐ๏ผŒๅนถๅฏ่ฏๆ˜Ž๏ผŒๅฝ“ไธค็ฑปๆ•ฐๆฎๅŒๅ…ˆ้ชŒ๏ผŒๆปก่ถณ้ซ˜ๆ–ฏๅˆ†ๅธƒไธ”ๅๆ–นๅทฎ็›ธ็ญ‰ๆ—ถ๏ผŒLDAๅฏ่พพๅˆฐๆœ€ไผ˜ๅˆ†็ฑปใ€‚

ๅคš็ฑปๅˆซๆ˜ ๅฐ„(ๅˆ†็ฑป)

่‹ฅๆœ‰ๅพˆๅคš็ฑปๅˆซ๏ผŒ่ฟ˜ๆ˜ฏๅŸบไบŽLDAๅŸบๆœฌๆ€ๆƒณ๏ผŒๆฏไธช็ฑป้—ด่ท็ฆปๆœ€ๅคง๏ผŒ็ฑปๅ†…่ท็ฆปๆœ€ๅฐใ€‚ๅ‡ๅฎšๅญ˜ๅœจ NN ไธช็ฑป๏ผŒไธ”็ฌฌ ii ็ฑป็คบไพ‹ๆ•ฐไธบ mim_i ๏ผŒๆˆ‘ไปฌๅ…ˆๅฎšไน‰โ€œๅ…จๅฑ€ๆ•ฃๅบฆ็Ÿฉ้˜ตโ€๏ผš

St=Sb+Sw=โˆ‘i=1m(xiโˆ’ฮผ)(xiโˆ’ฮผ)TS_t=S_b+S_w=\sum\limits_{i=1}^m(x_i-\mu)(x_i-\mu)^T

ๅ…ถไธญ ฮผ\mu ๆ˜ฏๆ‰€ๆœ‰็คบไพ‹็š„ๅ‡ๅ€ผๅ‘้‡๏ผŒๅฐ†็ฑปๅ†…ๆ•ฃๅบฆ็Ÿฉ้˜ต SwS_w ้‡ๆ–ฐๅฎšไน‰ไธบๆฏไธช็ฑปๅˆซ็š„ๆ•ฃๅบฆ็Ÿฉ้˜ตไน‹ๅ’Œ๏ผŒๅณ

Sw=โˆ‘i=1NSwi,ย ย ย ย Swi=โˆ‘xโˆˆXi(xโˆ’ฮผi)(xโˆ’ฮผi)TS_w=\sum \limits_{i=1}^NS_{w_i}, \ \ \ \ S_{w_i}=\sum\limits_{x\in X_i}(x-\mu_i)(x-\mu_i)^T

ๆ•ด็†ไธŠ้ขไธคๅผๅฏๅพ—

Sb=Stโˆ’Sw=โˆ‘i=1Nmi(ฮผiโˆ’ฮผ)(ฮผiโˆ’ฮผ)TS_b=S_t-S_w=\sum\limits_{i=1}^Nm_i(\mu_i-\mu)(\mu_i-\mu)^T

ๆ˜พ็„ถ๏ผŒๅคšๅˆ†็ฑปLDAๅฏไปฅๆœ‰ๅคš็งๅฎž็Žฐๆ–นๆณ•๏ผšไฝฟ็”จ SbS_b , SwS_w , StS_t ไธ‰่€…ไธญ็š„ไปปไฝ•ไธคไธชๅณๅฏ๏ผŒๅธธ่ง็š„ไธ€็งๅฎž็Žฐๆ˜ฏ้‡‡็”จไผ˜ๅŒ–็›ฎๆ ‡๏ผš

maxWย tr(WTSbW)tr(WTSwW\mathop{max}\limits_W\ \frac{tr(W^TS_bW)}{tr(W^TS_wW}

ๅ…ถไธญ WโˆˆRdร—(Nโˆ’1)W\in \mathbb{R}^{d\times(N-1)}๏ผŒไธŠๅผๅฏ้€š่ฟ‡ๅนฟไน‰็‰นๅพๅ€ผ้—ฎ้ข˜ๆฑ‚่งฃ๏ผš SbW=ฮปSwWS_bW=\lambda S_wW ใ€‚WW็š„้—ญๅผ่งฃๅˆ™ๆ˜ฏ Swโˆ’1SbS_w^{-1}S_b ็š„ dโ€ฒd' ไธชๆœ€ๅคง้ž้›ถๅนฟไน‰็‰นๅพๅ€ผๆ‰€ๅฏนๅบ”็š„็‰นๅพๅ‘้‡็ป„ๆˆ็š„็Ÿฉ้˜ต๏ผŒ dโ€ฒโ‰คNโˆ’1d'\leq N-1 ใ€‚

่‹ฅๅฐ† WW ่ง†ไธบไธ€ไธชๆŠ•ๅฝฑ็Ÿฉ้˜ต๏ผŒๅˆ™ๅคšๅˆ†็ฑปLDAๅฐ†ๆ ทๆœฌๆŠ•ๅฝฑๅˆฐ dโ€ฒd' ็ปด็ฉบ้—ดใ€‚ dโ€ฒd' ้€šๅธธ่ฟœๅฐไบŽๆ•ฐๆฎๅŽŸๆœ‰็š„ๅฑžๆ€งๆ•ฐ dd ไบŽๆ˜ฏ๏ผŒๅฏ้€š่ฟ‡่ฟ™ไธชๆŠ•ๅฝฑๆฅๅ‡ๅฐ‘ๆ ทๆœฌ็‚น็š„็ปดๆ•ฐ๏ผŒไธ”ๆŠ•ๅฝฑ่ฟ‡็จ‹ไธญ้‡‡็”จไบ†็ฑปๅˆซไฟกๆฏ๏ผŒๅ› ๆญคLDAไนŸๅธธ่ขซ่ง†ไธบไธ€็ง็ปๅ…ธ็š„็›‘็ฃ้™็ปดๆŠ€ๆœฏใ€‚

PCA vs. LDA

็›ธๅŒ็‚น

1๏ผ‰ไธค่€…ๅ‡ๅฏไปฅๅฏนๆ•ฐๆฎ่ฟ›่กŒ้™็ปดใ€‚

2๏ผ‰ไธค่€…ๅœจ้™็ปดๆ—ถๅ‡ไฝฟ็”จไบ†็Ÿฉ้˜ต็‰นๅพๅˆ†่งฃ็š„ๆ€ๆƒณใ€‚

3๏ผ‰ไธค่€…้ƒฝๅ‡่ฎพๆ•ฐๆฎ็ฌฆๅˆ้ซ˜ๆ–ฏๅˆ†ๅธƒใ€‚

ไธๅŒ็‚น

1๏ผ‰LDAๆ˜ฏๆœ‰็›‘็ฃ็š„้™็ปดๆ–นๆณ•๏ผŒ่€ŒPCAๆ˜ฏๆ— ็›‘็ฃ็š„้™็ปดๆ–นๆณ•

2๏ผ‰LDA้™็ปดๆœ€ๅคš้™ๅˆฐ็ฑปๅˆซๆ•ฐk-1็š„็ปดๆ•ฐ๏ผŒ่€ŒPCAๆฒกๆœ‰่ฟ™ไธช้™ๅˆถใ€‚

3๏ผ‰LDA้™คไบ†ๅฏไปฅ็”จไบŽ้™็ปด๏ผŒ่ฟ˜ๅฏไปฅ็”จไบŽๅˆ†็ฑปใ€‚

4๏ผ‰LDA้€‰ๆ‹ฉๅˆ†็ฑปๆ€ง่ƒฝๆœ€ๅฅฝ็š„ๆŠ•ๅฝฑๆ–นๅ‘๏ผŒ่€ŒPCA้€‰ๆ‹ฉๆ ทๆœฌ็‚นๆŠ•ๅฝฑๅ…ทๆœ‰ๆœ€ๅคงๆ–นๅทฎ็š„ๆ–นๅ‘ใ€‚่ฟ™็‚นๅฏไปฅไปŽไธ‹ๅ›พๅฝข่ฑก็š„็œ‹ๅ‡บ๏ผŒๅœจๆŸไบ›ๆ•ฐๆฎๅˆ†ๅธƒไธ‹LDAๆฏ”PCA้™็ปด่พƒไผ˜ใ€‚

็‹ฌ็ซ‹ๅˆ†้‡ๅˆ†ๆž(Independent Component Analysis, ICA)็š„ๆœ€้‡่ฆ็š„ๅ‡่ฎพๅฐฑๆ˜ฏไฟกๅทๆบ็ปŸ่ฎก็‹ฌ็ซ‹๏ผŒๅฐ†ๆ•ฐๆฎ่ฝฌๆขไธบ็‹ฌ็ซ‹็š„ๅˆ†้‡๏ผŒไฝฟ็”จๆ›ดๅฐ‘็š„ๅˆ†้‡ๆฅๆ่ฟฐๆ•ฐๆฎใ€‚่ฟ™ไธชๅ‡่ฎพๅœจๅคงๅคšๆ•ฐ็›ฒไฟกๅทๅˆ†็ฆป็š„ๆƒ…ๅ†ตไธญ็ฌฆๅˆๅฎž้™…ๆƒ…ๅ†ตใ€‚ๅณไฝฟๅฝ“่ฏฅๅ‡่ฎพไธๆปก่ถณๆ—ถ๏ผŒไป็„ถๅฏไปฅ็”จ็‹ฌ็ซ‹ๆˆๅˆ†ๅˆ†ๆžๆฅๆŠŠ่ง‚ๅฏŸไฟกๅท็ปŸ่ฎก็‹ฌ็ซ‹ๅŒ–๏ผŒไปŽ่€Œ่ฟ›ไธ€ๆญฅๅˆ†ๆžๆ•ฐๆฎ็š„็‰นๆ€งใ€‚็‹ฌ็ซ‹ๆˆๅˆ†ๅˆ†ๆž็š„็ปๅ…ธ้—ฎ้ข˜ๆ˜ฏโ€œ้ธกๅฐพ้…’ไผš้—ฎ้ข˜โ€๏ผˆCocktail Party Problem๏ผ‰ใ€‚่ฏฅ้—ฎ้ข˜ๆ่ฟฐ็š„ๆ˜ฏ็ป™ๅฎšๆททๅˆไฟกๅท๏ผŒๅฆ‚ไฝ•ๅˆ†็ฆปๅ‡บ้ธกๅฐพ้…’ไผšไธญๅŒๆ—ถ่ฏด่ฏ็š„ๆฏไธชไบบ็š„็‹ฌ็ซ‹ไฟกๅทใ€‚ๅฝ“ๆœ‰ NN ไธชไฟกๅทๆบๆ—ถ๏ผŒ้€šๅธธๅ‡่ฎพ่ง‚ๅฏŸไฟกๅทไนŸๆœ‰ NN ไธช๏ผˆไพ‹ๅฆ‚ NN ไธช้บฆๅ…‹้ฃŽๆˆ–่€…ๅฝ•้Ÿณๆœบ๏ผ‰ใ€‚่ฏฅๅ‡่ฎพๆ„ๅ‘ณ็€ๆททๅˆ็Ÿฉ้˜ตๆ˜ฏไธชๆ–น้˜ต๏ผŒๅณ J=DJ = D ๏ผŒๅ…ถไธญ DD ๆ˜ฏ่พ“ๅ…ฅๆ•ฐๆฎ็š„็ปดๆ•ฐ๏ผŒ JJ ๆ˜ฏ็ณป็ปŸๆจกๅž‹็š„็ปดๆ•ฐใ€‚ๅฏนไบŽ J<DJ<D ๅ’Œ J>DJ>D ็š„ๆƒ…ๅ†ต๏ผŒๅญฆๆœฏ็•ŒไนŸๅˆ†ๅˆซๆœ‰ไธๅŒ็ ”็ฉถใ€‚

PCAๅ’ŒICAไน‹้—ด็š„ไธป่ฆๅŒบๅˆซๅœจไบŽ๏ผŒPCAๅฏปๆ‰พไธ็›ธๅ…ณ็š„ๅ› ็ด ๏ผŒ่€ŒICAๅฏปๆ‰พ็‹ฌ็ซ‹ๅ› ็ด ใ€‚ๅฆ‚ๆžœไธคไธชๅ˜้‡ไธ็›ธๅ…ณ๏ผŒๅฎƒไปฌไน‹้—ดๅฐฑๆฒกๆœ‰็บฟๆ€งๅ…ณ็ณปใ€‚ๅฆ‚ๆžœๅฎƒไปฌๆ˜ฏ็‹ฌ็ซ‹็š„๏ผŒๅฎƒไปฌๅฐฑไธไพ่ต–ไบŽๅ…ถไป–ๅ˜้‡ใ€‚ไพ‹ๅฆ‚๏ผŒไธ€ไธชไบบ็š„ๅนด้พ„ๅ’Œไป–ๅƒไบ†ไป€ไนˆ/็œ‹ไบ†ไป€ไนˆ็”ต่ง†ๆ— ๅ…ณใ€‚่ฏฅ็ฎ—ๆณ•ๅ‡่ฎพ็ป™ๅฎšๅ˜้‡ๆ˜ฏไธ€ไบ›ๆœช็Ÿฅๆฝœๅœจๅ˜้‡็š„็บฟๆ€งๆททๅˆใ€‚ๅฎƒ่ฟ˜ๅ‡่ฎพ่ฟ™ไบ›ๆฝœๅœจๅ˜้‡ๆ˜ฏ็›ธไบ’็‹ฌ็ซ‹็š„๏ผŒๅณๅฎƒไปฌไธไพ่ต–ไบŽๅ…ถไป–ๅ˜้‡๏ผŒๅ› ๆญคๅฎƒไปฌ่ขซ็งฐไธบ่ง‚ๅฏŸๆ•ฐๆฎ็š„็‹ฌ็ซ‹ๅˆ†้‡ใ€‚

็ปๅ…ธ็š„้ธกๅฐพ้…’ๅฎดไผš้—ฎ้ข˜๏ผˆcocktail party problem๏ผ‰ใ€‚ๅ‡่ฎพๅœจpartyไธญๆœ‰ nn ไธชไบบ๏ผŒไป–ไปฌๅฏไปฅๅŒๆ—ถ่ฏด่ฏ๏ผŒๆˆ‘ไปฌไนŸๅœจๆˆฟ้—ดไธญไธ€ไบ›่ง’่ฝ้‡Œๅ…ฑๆ”พ็ฝฎไบ† nn ไธชๅฃฐ้ŸณๆŽฅๆ”ถๅ™จ๏ผˆMicrophone๏ผ‰็”จๆฅ่ฎฐๅฝ•ๅฃฐ้Ÿณใ€‚ๅฎดไผš่ฟ‡ๅŽ๏ผŒๆˆ‘ไปฌไปŽ nn ไธช้บฆๅ…‹้ฃŽไธญๅพ—ๅˆฐไบ†ไธ€็ป„ๆ•ฐๆฎ {x(i)(x1(i),x2(i),โ€ฆ,xn(i));i=1,โ€ฆ,m}\{x^{(i)}(x^{(i)}_1,x^{(i)}_2,\dots,x^{(i)}_n);i=1,\dots,m\} ๏ผŒ ii ่กจ็คบ้‡‡ๆ ท็š„ๆ—ถ้—ด้กบๅบ๏ผŒไนŸๅฐฑๆ˜ฏ่ฏดๅ…ฑๅพ—ๅˆฐไบ† mm ็ป„้‡‡ๆ ท๏ผŒๆฏไธ€็ป„้‡‡ๆ ท้ƒฝๆ˜ฏ nn ็ปด็š„ใ€‚ๆˆ‘ไปฌ็š„็›ฎๆ ‡ๆ˜ฏๅ•ๅ•ไปŽ่ฟ™ mm ็ป„้‡‡ๆ ทๆ•ฐๆฎไธญๅˆ†่พจๅ‡บๆฏไธชไบบ่ฏด่ฏ็š„ไฟกๅทใ€‚ๆœ‰ nn ไธชไบบ่ฏด่ฏ๏ผŒๅฐฑๆ˜ฏๆœ‰ nn ไธชไฟกๅทๆบ s(s1,s2,โ€ฆ,sn)T,ย sโˆˆRns(s_1,s_2,\dots,s_n)^T,\ s\in \mathbb{R}^n ๆฏไธ€็ปด้ƒฝๆ˜ฏไธ€ไธชไบบ็š„ๅฃฐ้Ÿณไฟกๅท๏ผŒๆฏไธชไบบๅ‘ๅ‡บ็š„ๅฃฐ้Ÿณไฟกๅท็‹ฌ็ซ‹ใ€‚ AA ๆ˜ฏไธ€ไธชๆœช็Ÿฅ็š„ๆททๅˆ็Ÿฉ้˜ต๏ผˆmixing matrix๏ผ‰๏ผŒ็”จๆฅ็ป„ๅˆๅ ๅŠ ไฟกๅท ss ๏ผŒ้‚ฃไนˆ

x=Asx = As

่ฟ™้‡Œ็š„ xx ไธๆ˜ฏไธ€ไธชๅ‘้‡๏ผŒๆ˜ฏไธ€ไธช็Ÿฉ้˜ตใ€‚ๅ…ถไธญๆฏไธชๅˆ—ๅ‘้‡ๆ˜ฏ x(i),x(i)=As(i)x^{(i)},x{(i)}=As^{(i)}๏ผŒๅณไธ‹ๅ›พ

x(i)x^{(i)} ็š„ๆฏไธชๅˆ†้‡้ƒฝ็”ฑ s(i)s^{(i)} ็š„ๅˆ†้‡็บฟๆ€ง่กจ็คบใ€‚ AA ๅ’Œ ss ้ƒฝๆ˜ฏๆœช็Ÿฅ็š„๏ผŒ xx ๆ˜ฏๅทฒ็Ÿฅ็š„๏ผŒๆˆ‘ไปฌ่ฆๆƒณๅŠžๆณ•ๆ นๆฎ xx ๆฅๆŽจๅ‡บ ss ใ€‚่ฟ™ไธช่ฟ‡็จ‹ไนŸ็งฐไฝœ็›ฒไฟกๅทๅˆ†็ฆปใ€‚ไปค W=Aโˆ’1W = A^{-1} ๏ผŒๅˆ™

s(i)=A(โˆ’1)x(i)=Wx(i)s^{(i)}=A^{(-1)}x^{(i)}=Wx^{(i)}

W=[โˆ’ย w1Tย โˆ’...โˆ’ย wnTย โˆ’]W = \left[ \begin{matrix} -\ w^T_1\ -\\ . \\ . \\ .\\ -\ w_n^T\ - \end{matrix} \right]

ๆœ€็ปˆๅพ—ๅˆฐ

sj(i)=wjTx(i)s_j^{(i)}=w_j^Tx^{(i)} ๏ผŒๅ…ถ sj(i)s_j^{(i)} ๅณ่ฏด่ฏไบบ jj ๅœจ ii ๆ—ถๅˆปๅ‘ๅ‡บ็š„ไฟกๅท

ๆˆ‘ไปฌ้œ€่ฆ็Ÿฅ้“ไธคไธช้‡ๆ‰่ƒฝๆฑ‚ๅ‡บๅฆๅค–ไธ€ไธช๏ผŒไธ‹้ขๆˆ‘ไปฌ่ฟ›ไธ€ๆญฅๅˆ†ๆž๏ผŒๅ…ˆ้ข„ๅค„็†(ไธญๅฟƒๅŒ–ใ€ๆผ‚็™ฝ)ไธ€ไธ‹ๆ•ฐๆฎ

ไธญๅฟƒๅŒ–๏ผšๆฑ‚ๅ‡บ xx ๅ‡ๅ€ผ๏ผŒ็„ถๅŽๆ‰€ๆœ‰ xx ๅ‡ๅŽปๅ‡ๅ€ผ

ๆผ‚็™ฝ๏ผš็›ฎ็š„ๆ˜ฏไธบไบ†่ฎฉ xx ็›ธไบ’็‹ฌ็ซ‹ใ€‚ๅฐ† xx ไน˜ไปฅไธ€ไธช็Ÿฉ้˜ตๅ˜ๆˆ x~\widetilde{x} (ๅ…ถๅๆ–นๅทฎ็Ÿฉ้˜ตๆ˜ฏ II )

x~=EDโˆ’1/2ETx\widetilde{x}=ED^{-1/2}E^Tx ๏ผŒๅ…ถไธญ E{x~x~T}=IE\{\widetilde{x}\widetilde{x}^T\} = I

ไฝฟ็”จ็‰นๅพๅ€ผๅˆ†่งฃๆฅๅพ—ๅˆฐ EE ๏ผˆ็‰นๅพๅ‘้‡็Ÿฉ้˜ต๏ผ‰ๅ’Œ DD ๏ผˆ็‰นๅพๅ€ผๅฏน่ง’็Ÿฉ้˜ต๏ผ‰ ๏ผŒๅ…ฌๅผไธบ E{xx~}=EDETE\{x\widetilde{x}\}=EDE^T

ICA็ฎ—ๆณ•

ๆˆ‘ไปฌๅ‡่ฎพๆฏ sis_i ๆœ‰ๆฆ‚็އๅฏ†ๅบฆ psp_s ๏ผŒ้‚ฃไนˆ็ป™ๅฎšๆ—ถๅˆปๅŽŸไฟกๅท็š„่”ๅˆๅˆ†ๅธƒๅฐฑๆ˜ฏ

p(s)=โˆi=1nps(si)p(s) = \prod_{i=1}^np_s(s_i) ๏ผŒๆฏไธชไบบๅ‘ๅ‡บ็š„ๅฃฐ้Ÿณไฟกๅท ss ๅ„่‡ช็‹ฌ็ซ‹

็„ถๅŽ๏ผŒๆˆ‘ไปฌๅฐฑๅฏไปฅๆฑ‚ๅพ— p(x)p(x)

p(x)=ps(Wx)โˆฃWโˆฃ=โˆฃWโˆฃโˆi=1nps(wiTx)p(x)=p_s(Wx)|W| = |W|\prod_{i=1}^np_s(w_i^Tx)

็Žฐๅœจ๏ผŒๆˆ‘ไปฌ้œ€่ฆ็Ÿฅ้“ p(s)p(s) ๅ’Œ ww ๏ผŒๆ‰่ƒฝๆฑ‚ๅพ— p(x)p(x)๏ผŒ้ฆ–ๅ…ˆๆˆ‘ไปฌๅ‡่ฎพ ss ็š„็ดฏ็งฏๅˆ†ๅธƒๅ‡ฝๆ•ฐ็ฌฆๅˆsigmoidๅ‡ฝๆ•ฐ

g(s)=11+eโˆ’sg(s) = \frac{1}{1+e^{-s}} ๏ผŒๆฑ‚ๅฏผๅŽ ps(s)=gโ€ฒ(s)=es(1+es)2p_s(s)=g'(s)=\frac{e^s}{(1+e^s)^2} ๏ผŒ่ฟ™ๅฐฑๆ˜ฏ ss ็š„ๅฏ†ๅบฆๅ‡ฝๆ•ฐ

็„ถๅŽ๏ผŒๆˆ‘ไปฌๅฐฑๅ‰ฉไธ‹ WW ้œ€่ฆๆฑ‚่งฃไบ†๏ผŒไฝฟ็”จๆœ€ๅคงไผผ็„ถไผฐ่ฎก็š„ๆ–นๆณ•ๆฑ‚่งฃ๏ผŒไฝฟ็”จๅ‰้ขๅพ—ๅˆฐ็š„ xx ็š„ๆฆ‚็އๅฏ†ๅบฆๅ‡ฝๆ•ฐ

ไธŠๅผๆ‹ฌๅท้‡Œ็š„ๅ…ถๅฎžๅฐฑๆ˜ฏ p(x(i))p(x^{(i)}) ๏ผŒๆœ€็ปˆ๏ผŒๆˆ‘ไปฌๅฏๆฑ‚ๅพ—

W:=W+ฮฑ([1โˆ’2g(w1Tx(i))1โˆ’2g(w2Tx(i))..1โˆ’2g(wnTx(i))]x(i)T+(WT)โˆ’1)W: =W+\alpha ( \left[ \begin{matrix} 1-2g(w_1^Tx^{(i)})\\ 1-2g(w_2^Tx^{(i)}) \\ . \\ .\\ 1-2g(w_n^Tx^{(i)}) \end{matrix} \right]x^{(i)^T}+(W^T)^{-1}) ๏ผŒๅ…ถไธญ ฮฑ\alpha ๆ˜ฏๆขฏๅบฆไธŠๅ‡้€Ÿ็އ๏ผŒไบบไธบๆŒ‡ๅฎš

่ฟญไปฃๆฑ‚ๅ‡บ WW ๅŽ๏ผŒๆˆ‘ไปฌๅฐฑๅฏไปฅ่ฟ˜ๅŽŸๅ‡บๅŽŸๅง‹ไฟกๅท

s(i)=Wx(i)s^{(i)}= Wx^{(i)}

้ž็บฟๆ€ง้™็ปดๆ–นๆณ•

ๅฏนไบŽๅƒไธ‹ๅ›พ่ฟ™ๆ ทๅคๆ‚ไธ€ไบ›็š„ๆ•ฐๆฎ(ๆฏ”ๅฆ‚ๆˆ‘ไปฌๆœ‰ไบ›"curvy"ๆ•ฐๆฎ)๏ผŒ็บฟๆ€ง้™็ปด็š„ๆ–นๆณ•ๅฐฑ่งฃๅ†ณไธไบ†

ๅ‡่ฎพๆˆ‘ไปฌๆœ‰ NN ไธช DD ็ปด็บฟๆ€งไธๅฏๅˆ†็š„ๆ•ฐๆฎ xnโˆˆRD,n={1,2,โ€ฆ,N}x_n\in \mathbb{R}^D, n=\{1,2,\dots,N\}ใ€‚ๆˆ‘ไปฌๅผ•ๅ…ฅไธ€ไธช้ž็บฟๆ€งๆ˜ ๅฐ„ๅ‡ฝๆ•ฐ ฯ•\phi: RDโ†’RM,ย xโˆฃโ†’z=ฯ•(x),ย M>D\mathbb{R}^D\to \mathbb{R}^M,\ x|\to z = \phi(x),\ M>D ๏ผŒ้€š่ฟ‡่ฟ™ไธช้ž็บฟๆ€งๆ˜ ๅฐ„ๅ‡ฝๆ•ฐๅฏไปฅๅฐ†ๅŽŸๆฅ็š„็บฟๆ€งไธๅฏๅˆ†็š„ๆ ทๆœฌๆ˜ ๅฐ„ๅˆฐๆ›ด้ซ˜็ปดๅบฆ๏ผŒๅœจ่ฟ™ไธช้ซ˜็ปด็ฉบ้—ดไธญ๏ผŒๆœฌๆฅๅœจๅŽŸ็ฉบ้—ดไธญ็บฟๆ€งไธๅฏๅˆ†็š„ๆ ทๆœฌ็Žฐๅœจ็บฟๆ€งๅฏๅˆ†ไบ†

ๆ•ฐๆฎๅœจ่ฟ™ไธช้ซ˜็ปดๅบฆ็ฉบ้—ดไธญ็บฟๆ€งๅฏๅˆ†ไบ†๏ผŒ่ฟ™ๆ—ถๅ€™ๆˆ‘ไปฌๅ†็”จPCA๏ผŒ้—ฎ้ข˜่งฃๅ†ณใ€‚ๅณ

ๆฏไธช็‰นๅพๅ€ผๅ‘้‡ viv_i ้ƒฝ่ƒฝไปŽ่พ“ๅ…ฅๆ•ฐๆฎ็š„็บฟๆ€ง็ป„ๅˆๅพ—ๅˆฐ๏ผš vi=โˆ‘nai,nฯ•(xn)v_i=\sum \limits_n a_{i,n}\phi(x_n) ๏ผŒไปฃๅ…ฅไธŠๅผๅณๅฏๅพ—้ซ˜็ปดๅบฆ็‰นๅพๅˆ†่งฃ็š„่กจ่พพๅผ๏ผš

Cโ‹…vi=ฮปiviโ‡’1Nโˆ‘nฯ•(xn)ฯ•(xn)Tโ‹…(โˆ‘mai,mฯ•(xm))=ฮปi(โˆ‘mai,mฯ•(xm))C\cdot v_i = \lambda_iv_i \Rightarrow \frac{1}{N}\sum \limits_n \phi(x_n)\phi(x_n)^T\cdot(\sum \limits_m a_{i,m}\phi(x_m)) = \lambda_i(\sum \limits_m a_{i,m}\phi(x_m))

ไธค่พนๅŒๆ—ถๅทฆไน˜ ฯ•(xl)\phi(x_l)๏ผŒๅนถๅผ•ๅ…ฅไธ€ไธชNร—NN\times N็š„ๆ ธๅ‡ฝๆ•ฐ KK ๏ผŒๅณๅฏๅพ—ไฝŽ็ปดๅบฆ็‰นๅพๅˆ†่งฃ่กจ่พพๅผ๏ผš

1Nโˆ‘nK(xl,xn)โˆ‘mai,mK(xl,xm)=ฮปiโˆ‘mai,mK(xlxm)\frac{1}{N}\sum \limits_nK(x_l,x_n)\sum\limits_ma_{i,m}K(x_l,x_m)=\lambda_i\sum\limits_ma_{i,m}K(x_lx_m)

a=ba = b

โ‡’Kโ‹…ai=ฮปiNโ‹…ai\Rightarrow K\cdot a_i = \lambda_iN\cdot a_i ๏ผŒๅ…ถไธญ KK ๆ˜ฏ Nร—NN\times N ็ปดๆ ธ็Ÿฉ้˜ต๏ผŒ aia_i ๆ˜ฏ NN ็ปดๅˆ—ๅ‘้‡

ๆฑ‚่งฃๅ…ฌๅผ็š„ๅซไน‰ๅฐฑๆ˜ฏๆฑ‚Kๆœ€ๅคง็š„ๅ‡ ไธช็‰นๅพๅ€ผๆ‰€ๅฏนๅบ”็š„็‰นๅพๅ‘้‡๏ผŒ็”ฑไบŽ KK ไธบๅฏน็งฐ็Ÿฉ้˜ต๏ผŒๆ‰€ๅพ—็š„่งฃๅ‘้‡ๅฝผๆญคไน‹้—ด่‚ฏๅฎšๆ˜ฏๆญฃไบค็š„ใ€‚ ไฝ†ๆ˜ฏ๏ผŒ่ฏทๆณจๆ„๏ผŒ่ฟ™้‡Œ็š„ aa ๅชๆ˜ฏ KK ็š„็‰นๅพๅ‘้‡๏ผŒไฝ†ๆ˜ฏๅ…ถไธๆ˜ฏ้ซ˜็ปด็ฉบ้—ดไธญ็š„็‰นๅพๅ‘้‡๏ผŒๅ›ž็œ‹ vi=โˆ‘nai,nฯ•(xn)v_i=\sum \limits_n a_{i,n}\phi(x_n) ๅ…ฌๅผ๏ผŒ้ซ˜็ปด็ฉบ้—ดไธญ็š„็‰นๅพๅ‘้‡ vv ๅบ”่ฏฅๆ˜ฏ็”ฑ aa ่ฟ›ไธ€ๆญฅๆฑ‚ๅ‡บใ€‚

ไธ‹้ข่ฟ™ๅผ ๅ›พไฝไบŽ็ฌฌไธ€ใ€ไบŒ่ฑก้™ๅ†…ใ€‚ๆˆ‘ไปฌๅ…ณๆณจ็บข่‰ฒ็š„้—จ๏ผŒไปฅๅŠโ€œๅŒ—ไบฌๅ››ๅˆ้™ขโ€่ฟ™ๅ‡ ไธชๅญ—ไธ‹้ข็š„็ดซ่‰ฒ็š„ๅญ—ๆฏใ€‚ๆˆ‘ไปฌๆŠŠ็บข่‰ฒ็š„้—จไธŠ็š„็‚น็œ‹ๆˆๆ˜ฏโ€œ+โ€ๆ•ฐๆฎ๏ผŒ็ดซ่‰ฒๅญ—ๆฏไธŠ็š„็‚น็œ‹ๆˆๆ˜ฏโ€œ-โ€ๆ•ฐๆฎ๏ผŒๅฎƒไปฌ็š„ๆจชใ€็บตๅๆ ‡ๆ˜ฏไธคไธช็‰นๅพใ€‚ๆ˜พ็„ถ๏ผŒๅœจ่ฟ™ไธชไบŒ็ปด็ฉบ้—ดๅ†…๏ผŒโ€œ+โ€โ€œ-โ€ไธค็ฑปๆ•ฐๆฎไธๆ˜ฏ็บฟๆ€งๅฏๅˆ†็š„ใ€‚

ๆˆ‘ไปฌ็Žฐๅœจ่€ƒ่™‘ๆ ธๅ‡ฝๆ•ฐ K(v1,v2)=<v1,v2>2K(v_1,v_2)=<v_1,v_2>^2 ๏ผŒๅณโ€œๅ†…็งฏๅนณๆ–นโ€ใ€‚่ฟ™้‡Œ้ข v1=(x1,y1),v2=(x2,y2)v_1=(x_1,y_1),v_2=(x_2,y_2) ๆ˜ฏไบŒ็ปด็ฉบ้—ดไธญ็š„ไธคไธช็‚นใ€‚

่ฟ™ไธชๆ ธๅ‡ฝๆ•ฐๅฏนๅบ”็€ไบŒ็ปดๅˆฐไธ‰็ปด็ฉบ้—ด็š„ๆ˜ ๅฐ„๏ผŒๅฎƒ็š„่กจ่พพๅผๆ˜ฏ๏ผš P(x,y)=(x2,2xy,y2)P(x,y)=(x^2,\sqrt{2}xy,y^2)๏ผŒๅฏไปฅ้ชŒ่ฏ๏ผš <P(v1),P(v2)>=<(x12,2x1y1,y12),(x22,2x2y2,y22)><P(v_1),P(v_2)>=<(x_1^2,\sqrt{2}x_1y_1,y_1^2),(x_2^2,\sqrt{2}x_2y_2,y_2^2)>

=x12x22+2x1x2y1y2+y12y22=(x1x2+y1y2)2=<v1,v2>2=K(v1,v2)=x_1^2x_2^2+2x_1x_2y_1y_2+y_1^2y_2^2=(x_1x_2+y_1y_2)^2 = <v_1,v_2>^2=K(v_1,v_2)

ๅœจP่ฟ™ไธชๆ˜ ๅฐ„ไธ‹๏ผŒๅŽŸๆฅไบŒ็ปด็ฉบ้—ดไธญ็š„ๅ›พๅœจไธ‰็ปด็ฉบ้—ดไธญ็š„ๅƒๆ˜ฏ่ฟ™ไธชๆ ทๅญ๏ผš

ๅ‰ๅŽ่ฝดไธบx่ฝด๏ผŒๅทฆๅณ่ฝดไธบy่ฝด๏ผŒไธŠไธ‹่ฝดไธบz่ฝด

ๆณจๆ„ๅˆฐ็ปฟ่‰ฒ็š„ๅนณ้ขๅฏไปฅๅฎŒ็พŽๅœฐๅˆ†ๅ‰ฒ็บข่‰ฒๅ’Œ็ดซ่‰ฒ๏ผŒไนŸๅฐฑๆ˜ฏ่ฏด๏ผŒไธค็ฑปๆ•ฐๆฎๅœจไธ‰็ปด็ฉบ้—ดไธญๅ˜ๆˆ็บฟๆ€งๅฏๅˆ†็š„ไบ†ใ€‚

่€Œไธ‰็ปดไธญ็š„่ฟ™ไธชๅˆคๅ†ณ่พน็•Œ๏ผŒๅ†ๆ˜ ๅฐ„ๅ›žไบŒ็ปด็ฉบ้—ดไธญๆ˜ฏ่ฟ™ๆ ท็š„๏ผš

่ฟ™ๆ˜ฏไธ€ๆกๅŒๆ›ฒ็บฟ๏ผŒๅฎƒไธๆ˜ฏ็บฟๆ€ง็š„ใ€‚ๆ ธๅ‡ฝๆ•ฐ็š„ไฝœ็”จๅฐฑๆ˜ฏ้šๅซ็€ไธ€ไธชไปŽไฝŽ็ปด็ฉบ้—ดๅˆฐ้ซ˜็ปด็ฉบ้—ด็š„ๆ˜ ๅฐ„๏ผŒ่€Œ่ฟ™ไธชๆ˜ ๅฐ„ๅฏไปฅๆŠŠไฝŽ็ปด็ฉบ้—ดไธญ็บฟๆ€งไธๅฏๅˆ†็š„ไธค็ฑป็‚นๅ˜ๆˆ็บฟๆ€งๅฏๅˆ†็š„ใ€‚ๅฎƒไปฌๆ˜ ๅฐ„ๅˆฐ็š„้ซ˜็ปด็ฉบ้—ด็š„็ปดๆ•ฐไนŸๆฏ”ไพ‹ๅญ๏ผˆไธ‰็ปด๏ผ‰้ซ˜ๅพ—ๅคš๏ผŒ็”š่‡ณๆ˜ฏๆ— ็ฉท็ปด็š„ใ€‚่ฟ™ๆ ท๏ผŒๅฐฑๅฏไปฅๆœŸๅพ…ๅŽŸๆฅๅนถไธ็บฟๆ€งๅฏๅˆ†็š„ไธค็ฑป็‚นๅ˜ๆˆ็บฟๆ€งๅฏๅˆ†็š„ไบ†ใ€‚

ๅœจๆœบๅ™จๅญฆไน ไธญๅธธ็”จ็š„ๆ ธๅ‡ฝๆ•ฐ๏ผŒไธ€่ˆฌๆœ‰่ฟ™ไนˆๅ‡ ็ฑป๏ผŒไนŸๅฐฑๆ˜ฏLibSVMไธญ่‡ชๅธฆ็š„่ฟ™ๅ‡ ็ฑป๏ผš 1) ็บฟๆ€ง๏ผšK(v_1,v_2)=<v_1,v_2> 2) ๅคš้กนๅผ๏ผšK(v_1,v_2)=(\gamma<v_1,v_2>+c)^n 3) Radial basis function๏ผšK(v_1,v_2)=\exp(-\gamma||v_1-v_2||^2) 4) Sigmoid๏ผšK(v_1,v_2)=\tanh(\gamma<v_1,v_2>+c)

ไธŠ้ข็š„ไพ‹ๅญๆ˜ฏ 2)ๅคš้กนๅผๆ ธๅ‡ฝๆ•ฐไธญ\gamma=1, c=0, n=2็š„ๆƒ…ๅ†ตใ€‚

ๆ ธๅ‡ฝๆ•ฐ่ฆๆปก่ถณ็š„ๆกไปถ็งฐไธบMercer's conditionใ€‚ๅœจๅฎž็”จไธญ๏ผŒๅŸบๆœฌๆ˜ฏ่ฏ•้ชŒๅ„็งๆ ธๅ‡ฝๆ•ฐ๏ผŒๅนถๆ‰ซๆๅ…ถไธญ็š„ๅ‚ๆ•ฐ๏ผŒ้€‰ๆ‹ฉๆ•ˆๆžœๆœ€ๅฅฝ็š„ใ€‚ๆ‰€ไปฅ่ฏด๏ผŒ่‡ณไบŽไป€ไนˆๆ ท็š„ๆ ธๅ‡ฝๆ•ฐ้€‚็”จไบŽไป€ไนˆๆ ท็š„้—ฎ้ข˜่ฟ˜ๆœ‰ๅพ…่ฎจ่ฎบใ€‚

ๅคš็ปด็ผฉๆ”พ(MDS)

่‹ฅ่ฆๆฑ‚ๅŽŸๅง‹็ฉบ้—ดไธญๆ ทๆœฌ็š„่ท็ฆปๅœจไฝŽ็ปด็ฉบ้—ดไธญๅพ—ไปฅไฟๆŒ๏ผŒๅฆ‚ไธŠๅ›พๆ‰€็คบ๏ผŒๅณๅพ—ๅˆฐๅคš็ปด็ผฉๆ”พ(Multiple Dimensional Scaling, MDS)ใ€‚ๅ‡ๅฎš mm ไธชๆ ทๆœฌๅœจๅŽŸๅง‹็ฉบ้—ด็š„่ท็ฆป็Ÿฉ้˜ตไธบ DโˆˆRmร—mD\in \mathbb{R}^{m\times m} ๏ผŒๅ…ถ็ฌฌ ii ่กŒ jj ๅˆ—็š„ๅ…ƒ็ด  distijdist_{ij} ไธบๆ ทๆœฌ xix_i ๅˆฐ xjx_j ็š„่ท็ฆปใ€‚ๆˆ‘ไปฌ็š„็›ฎๆ ‡ๆ˜ฏ่Žทๅพ—ๆ ทๆœฌๅœจ dโ€ฒd' ็ปด็ฉบ้—ด็š„่กจ็คบ ZโˆˆRdโ€ฒร—m,ย dโ€ฒโ‰คdZ\in \mathbb{R}^{d'\times m},\ d'\leq d ๏ผŒไธ”ไปปๆ„ไธคไธชๆ ทๆœฌๅœจ dโ€ฒd' ็ปด็ฉบ้—ดไธญๆฌงๆฐ่ท็ฆป็ญ‰ไบŽๅŽŸๅง‹็ฉบ้—ดไธญ็š„่ท็ฆป๏ผŒๅณ โˆฃโˆฃziโˆ’zjโˆฃโˆฃ=distij||z_i-z_j||=dist_{ij}

ไปค B=ZTZโˆˆRmร—mB=Z^TZ\in \mathbb{R}^{m\times m} ๏ผŒๅ…ถไธญ BB ไธบ้™็ปดๅŽๆ ทๆœฌ็š„ๅ†…็งฏ็Ÿฉ้˜ต๏ผŒ bij=ziTzjb_{ij}=z_i^Tz_j ๏ผŒๆœ‰

distij2=โˆฃโˆฃziโˆฃโˆฃ2+โˆฃโˆฃzjโˆฃโˆฃ2โˆ’2ziTzj=bii+bjjโˆ’2bijdist_{ij}^2=||z_i||^2+||z_j||^2-2z_i^Tz_j=b_{ii}+b_{jj}-2b_{ij}

ไปค้™็ปดๅŽ็š„ๆ ทๆœฌ ZZ ่ขซไธญๅฟƒๅŒ–๏ผŒๅณ โˆ‘i=1mzi=0\sum_{i=1}^mz_i=0 ใ€‚ๆ˜พ็„ถ๏ผŒ็Ÿฉ้˜ต BB ็š„่กŒไธŽๅˆ—ไน‹ๅ’Œๅ‡ไธบ้›ถ๏ผŒๅณ โˆ‘i=1mbij=โˆ‘j=1mbij=0\sum_{i=1}^mb_{ij}=\sum_{j=1}^mb_{ij}=0 ๏ผŒๆ˜“็Ÿฅ

โˆ‘i=1mdistij2=tr(B)+mbjj\sum\limits_{i=1}^mdist_{ij}^2=tr(B)+mb_{jj} โˆ‘j=1mdistij2=tr(B)+mbii\sum\limits_{j=1}^mdist_{ij}^2=tr(B)+mb_{ii} โˆ‘i=1mโˆ‘j=1mdistij2=2mย tr(B)\sum\limits_{i=1}^m\sum\limits_{j=1}^m dist_{ij}^2=2m\ tr(B)

ๅ…ถไธญ tr(โ‹…)tr(\cdot) ่กจ็คบ็Ÿฉ้˜ต็š„่ฟน(trace)๏ผŒ tr(B)=โˆ‘i=1mโˆฃโˆฃziโˆฃโˆฃ2tr(B)=\sum_{i=1}^m||z_i||^2 ๏ผŒไปค

disti.2=1mโˆ‘j=1mdistij2dist_{i.}^2=\frac{1}{m}\sum\limits_{j=1}^mdist_{ij}^2 dist.j2=1mโˆ‘i=1mdistij2dist_{.j}^2=\frac{1}{m}\sum\limits_{i=1}^mdist_{ij}^2 dist..2=1m2โˆ‘i=1mโˆ‘j=1mdistij2dist{..}^2=\frac{1}{m^2}\sum\limits_{i=1}^m\sum\limits_{j=1}^mdist_{ij}^2

็”ฑไธŠ้ขๆ‰€ๆœ‰ๅผๅญๅฏๅพ—

bij=โˆ’12(distij2โˆ’disti.2โˆ’dist.j2+dist..2)b_{ij}=-\frac{1}{2}(dist_{ij}^2-dist_{i.}^2-dist_{.j}^2+dist_{..}^2)

็”ฑๆญคๅณๅฏ้€š่ฟ‡้™็ปดๅ‰ๅŽไฟๆŒไธๅ˜็š„่ท็ฆป็Ÿฉ้˜ต DD ๆฑ‚ๅ–ๅ†…็งฏ็Ÿฉ้˜ต BB

ๅฏน็Ÿฉ้˜ต BB ๅš็‰นๅพๅ€ผๅˆ†่งฃ๏ผŒ B=Vฮ›VTB=V\Lambda V^T ๏ผŒๅ…ถไธญ ฮ›=diag(ฮป1,ฮป2,โ€ฆ,ฮปd)\Lambda = diag(\lambda_1,\lambda_2,\dots,\lambda_d) ไธบ็‰นๅพๅ€ผๆž„ๆˆ็š„ๅฏน่ง’็Ÿฉ้˜ต๏ผŒ ฮป1โ‰ฅฮป2โ‰ฅโ‹ฏโ‰ฅฮปd\lambda_1\geq \lambda_2\geq \dots \geq \lambda_d๏ผŒ VV ไธบ็‰นๅพๅ‘้‡็Ÿฉ้˜ตใ€‚ๅ‡ๅฎšๅ…ถไธญๆœ‰ dโˆ—d^* ไธช้ž้›ถ็‰นๅพๅ€ผ๏ผŒๅฎƒไปฌๆž„ๆˆ็š„ๅฏน่ง’็Ÿฉ้˜ต ฮ›โˆ—=diag(ฮป1,ฮป2,โ€ฆ,ฮปdโˆ—)\Lambda_*=diag(\lambda_1,\lambda_2,\dots,\lambda_{d^*}) ๏ผŒไปค Vโˆ—V_* ่กจ็คบ็›ธๅบ”็š„็‰นๅพๅ‘้‡็Ÿฉ้˜ต๏ผŒๅˆ™ ZZ ๅฏ่กจ่พพไธบ

Z=ฮ›โˆ—1/2Vโˆ—TโˆˆRdโˆ—ร—mZ=\Lambda_*^{1/2}V_*^T\in\mathbb{R}^{d^*\times m}

ๅœจ็Žฐๅฎžๅบ”็”จไธญไธบไบ†ๆœ‰ๆ•ˆ้™็ปด๏ผŒๅพ€ๅพ€ไป…้œ€้™็ปดๅŽ็š„่ท็ฆปไธŽๅŽŸๅง‹็ฉบ้—ดไธญ็š„่ท็ฆปๅฐฝๅฏ่ƒฝๆŽฅ่ฟ‘๏ผŒ่€Œไธๅฟ…ไธฅๆ ผ็›ธ็ญ‰ใ€‚ๆญคๆ—ถๅฏๅ– dโ€ฒโ‰ชdd'\ll d ไธชๆœ€ๅคง็‰นๅพๅ€ผๆž„ๆˆ็š„ๅฏน่ง’็Ÿฉ้˜ต ฮ›~=diag(ฮป1,ฮป2,โ€ฆ,ฮปdโ€ฒ)\widetilde{\Lambda}=diag(\lambda_1,\lambda_2,\dots,\lambda_{d'}) ๏ผŒไปค V~\widetilde{V} ่กจ็คบ็›ธๅบ”็š„็‰นๅพๅ‘้‡็Ÿฉ้˜ต๏ผŒๅˆ™ ZZ ๅฏ่กจ่พพไธบ

Z=ฮ›~1/2V~TโˆˆRdโˆ—ร—mZ=\widetilde{\Lambda}^{1/2}\widetilde{V}^T\in\mathbb{R}^{d^*\times m}

็ฎ—ๆณ•ๆญฅ้ชค

  1. ่พ“ๅ…ฅ๏ผš่ท็ฆป็Ÿฉ้˜ต DโˆˆRmร—mD\in \mathbb{R}^{m\times m}๏ผŒๅ…ถๅ…ƒ็ด  distijdist_{ij}๏ผŒไธบๆ ทๆœฌ xix_i ๅˆฐ xjx_j ็š„่ท็ฆป๏ผ›ไฝŽ็ปด็ฉบ้—ด็ปดๆ•ฐ dโ€ฒd'

  2. ่ฟ‡็จ‹๏ผš

  3. 1๏ผšๆ นๆฎไธŠ้ขๅ…ฌๅผ่ฎก็ฎ— disti.2dist_{i.}^2 ๏ผŒ dist.j2dist_{.j}^2 ๏ผŒ dist..2dist_{..}^2

  4. 2๏ผš่ฎก็ฎ—ๅ†…็งฏ็Ÿฉ้˜ต BB

  5. 3๏ผšๅฏน็Ÿฉ้˜ต BB ๅš็‰นๅพๅˆ†่งฃ

  6. 4๏ผšๅ– ฮ›~\widetilde{\Lambda} ไธบ dโ€ฒd' ไธชๆœ€ๅคง็‰นๅพๆ‰€ๆž„ๆˆ็š„ๅฏน่ง’็Ÿฉ้˜ต๏ผŒ V~\widetilde{V} ไธบ็›ธๅบ”็š„็‰นๅพๅ‘้‡็Ÿฉ้˜ต

  7. ่พ“ๅ‡บ๏ผš็Ÿฉ้˜ต V~Tฮ›~1/2โˆˆRmร—dโ€ฒ\widetilde{V}^T\widetilde{\Lambda}^{1/2}\in\mathbb{R}^{m\times d'} ๏ผŒๆฏ่กŒๆ˜ฏไธ€ไธชๆ ทๆœฌ็š„ไฝŽ็ปดๅๆ ‡

็ญ‰ๅบฆ้‡ๆ˜ ๅฐ„(ISOMAP)

็ญ‰ๅบฆ้‡ๆ˜ ๅฐ„(Isometric Mapping, Isomap)็š„ๅŸบๆœฌๅ‡บๅ‘็‚น๏ผŒๆ˜ฏ่ฎคไธบไฝŽ็ปดๆตๅฝขๅตŒๅ…ฅๅˆฐ้ซ˜็ปด็ฉบ้—ดไน‹ๅŽ๏ผŒ็›ดๆŽฅๅœจ้ซ˜็ปด็ฉบ้—ดไธญ่ฎก็ฎ—็›ด็บฟ่ท็ฆปๅ…ทๆœ‰่ฏฏๅฏผๆ€ง๏ผŒๅ› ไธบ้ซ˜็ปด็ฉบ้—ดไธญ็š„็›ด็บฟ่ท็ฆปๅœจไฝŽ็ปดๅตŒๅ…ฅๆตๅฝขไธŠๆ˜ฏไธๅฏ่พพ็š„ใ€‚ๆˆ‘ไปฌๅˆฉ็”จๆตๅฝขๅœจๅฑ€้ƒจไธŠไธŽๆฌงๆฐ็ฉบ้—ดๅŒ่ƒš่ฟ™ไธชๆ€ง่ดจ๏ผŒๅฏนๆฏไธช็‚นๅŸบไบŽๆฌงๆฐ่ท็ฆปๆ‰พๅ‡บๅ…ถ่ฟ‘้‚ป็‚น๏ผŒ็„ถๅŽๅฐฑ่ƒฝๅปบ็ซ‹ไธ€ไธช่ฟ‘้‚ป่ฟžๆŽฅๅ›พ๏ผŒๅ›พไธญ่ฟ‘้‚ปไน‹้—ดๅญ˜ๅœจ่ฟžๆŽฅ๏ผŒ่€Œ้ž่ฟ‘้‚ป็‚นไน‹้—ดไธๅญ˜ๅœจ่ฟžๆŽฅ๏ผŒไบŽๆ˜ฏ๏ผŒ่ฎก็ฎ—ไธค็‚นไน‹้—ดๆต‹ๅœฐ็บฟ่ท็ฆป็š„้—ฎ้ข˜๏ผŒๅฐฑ่ฝฌๅ˜ไธบ่ฎก็ฎ—่ฟ‘้‚ป่ฟžๆŽฅๅ›พไธŠไธค็‚นไน‹้—ด็š„ๆœ€็Ÿญ่ทฏๅพ„้—ฎ้ข˜ใ€‚

ๅœจ่ฟ‘้‚ป่ฟžๆŽฅๅ›พไธŠ่ฎก็ฎ—ไธค็‚น้—ด็š„ๆœ€็Ÿญ่ทฏๅพ„๏ผŒๅฏ้‡‡็”จ่‘—ๅDijkstra็ฎ—ๆณ•ๆˆ–Floyd็ฎ—ๆณ•๏ผŒๅœจๅพ—ๅˆฐไปปๆ„ไธค็‚น็š„่ท็ฆปไน‹ๅŽ๏ผŒๅฐฑๅฏไปฅ้€š่ฟ‡MDSๆฅ่Žทๅพ—ๆ ทๆœฌ็‚นๅœจไฝŽ็ปด็ฉบ้—ดไธญ็š„ๅๆ ‡ใ€‚

็ฎ—ๆณ•ๆญฅ้ชค

  1. ่พ“ๅ…ฅ๏ผšๆ ทๆœฌ้›† D={x1,x2,โ€ฆ,xm}D=\{x_1,x_2,\dots,x_m\} ๏ผ›่ฟ‘้‚ปๅ‚ๆ•ฐ kk ๏ผ›ไฝŽ็ปด็ฉบ้—ด็ปดๆ•ฐ dโ€ฒd'

  2. ่ฟ‡็จ‹๏ผš

  3. for i=1,2,โ€ฆ,mi=1,2,\dots,m do

  4. ็กฎๅฎš xix_i ็š„ kk ่ฟ‘้‚ป

  5. xix_i ไธŽ kk ่ฟ‘้‚ป็‚นไน‹้—ด็š„่ท็ฆป่ฎพ็ฝฎไธบๆฌงๆฐ่ท็ฆป๏ผŒไธŽๅ…ถไป–ๅบ—็š„่ท็ฆป่ฎพ็ฝฎไธบๆ— ็ฉทๅคง

  6. end for

  7. ่ฐƒ็”จๆœ€็Ÿญ่ทฏๅพ„็ฎ—ๆณ•(eg. Dijkstra)่ฎก็ฎ—ไปปๆ„ไธคๆ ทๆœฌ็‚นไน‹้—ด่ท็ฆป dist(xi,xj)dist(x_i,x_j)

  8. ๅฐ† dist(xi,xj)dist(x_i,x_j) ไฝœไธบMDS็ฎ—ๆณ•็š„่พ“ๅ…ฅ

  9. return MDS็ฎ—ๆณ•็š„่พ“ๅ‡บ

  10. ่พ“ๅ‡บ๏ผšๆ ทๆœฌ้›† DD ๅœจไฝŽ็ปด็ฉบ้—ด็š„ๆŠ•ๅฝฑ Z={z1,z2,โ€ฆ,zm}Z=\{z_1,z_2,\dots,z_m\}

ๅฑ€้ƒจ็บฟๆ€งๅตŒๅ…ฅ(Locally Linear Embedding, LLE)ไธŽIsomap่ฏ•ๅ›พไฟๆŒ่ฟ‘้‚ปๆ ทๆœฌไน‹้—ด็š„่ท็ฆปไธๅŒ๏ผŒLLE่ฏ•ๅ›พไฟๆŒ้‚ปๅŸŸๆ ทๆœฌไน‹้—ด็š„็บฟๆ€งๅ…ณ็ณปใ€‚

ๅณๆ ทๆœฌ็‚น xix_i ็š„ๅๆ ‡่ƒฝ้€š่ฟ‡ๅฎƒ็š„้ข†ๅŸŸๆ ทๆœฌ xjx_j ๏ผŒ xkx_k ๏ผŒ xlx_l ็š„ๅๆ ‡้€š่ฟ‡็บฟๆ€ง็ป„ๅˆ่€Œ้‡ๆž„ๅ‡บๆฅ๏ผŒ่€Œ่ฟ™้‡Œ็š„ๆƒๅ€ผๅ‚ๆ•ฐๅœจไฝŽ็ปดๅ’Œ้ซ˜็ปด็ฉบ้—ดๆ˜ฏไธ€่‡ด็š„๏ผŒๅณ

xi=wijxj+wikxk+wilxlx_i=w_{ij}x_j+w_{ik}x_k+w_{il}x_l

็ฌฌไธ€ๆญฅ๏ผŒๅ…ˆไธบๆฏไธชๆ ทๆœฌ xix_i ๆ‰พๅˆฐๅ…ถ่ฟ‘้‚ปไธ‹ๆ ‡้›†ๅˆ QiQ_i๏ผŒ็„ถๅŽ่ฎก็ฎ—ๅ‡บๅŸบไบŽ QiQ_i ไธญ็š„ๆ‰€ๆœ‰็š„ๆ ทๆœฌ็‚นๅฏน xix_i ่ฟ›่กŒ็บฟๆ€ง้‡ๆž„็ณปๆ•ฐ wiw_i ๏ผŒไนŸๅฐฑๆ˜ฏๆ‰พๅ‡บๆฏไธ€ไธชๆ ทๆœฌๅ’Œๅ…ถ้ข†ๅŸŸๅ†…็š„ๆ ทๆœฌไน‹้—ด็š„็บฟๆ€งๅ…ณ็ณป

็ฌฌไบŒๆญฅ๏ผŒๅœจไฝŽ็ปด็ฉบ้—ด้ข†ๅŸŸ้‡ๆž„็ณปๆ•ฐ wiw_i ไธๅ˜๏ผŒๅŽปๆฑ‚ๆฏไธชๆ ทๆœฌๅœจไฝŽ็ปด็ฉบ้—ด็š„ๅๆ ‡

ๅˆฉ็”จM็Ÿฉ้˜ต๏ผŒๅฏไปฅๅฐ†้—ฎ้ข˜ๅ†™ๆˆ

minZtr(ZMZT)ย ย ย ย s.t.ZZT=I\mathop{min}\limits_Z tr(ZMZ^T)\ \ \ \ s.t.ZZ^T=I

้—ฎ้ข˜ๅฐฑๆˆไบ†ๅฏน MM ็Ÿฉ้˜ต่ฟ›่กŒ็‰นๅพๅˆ†่งฃ๏ผŒ็„ถๅŽๅ–ๆœ€ๅฐ็š„ dโ€ฒd' ไธช็‰นๅพๅ€ผๅฏนๅบ”็š„็‰นๅพๅ‘้‡็ป„ๆˆไฝŽ็ปด็ฉบ้—ด็š„ๅๆ ‡ ZZ

t-SNE(t-distributed stochastic neighbor embedding)ๆ˜ฏไธ€็ง้ž็บฟๆ€ง้™็ปด็ฎ—ๆณ•๏ผŒ้žๅธธ้€‚็”จไบŽ้ซ˜็ปดๆ•ฐๆฎ้™็ปดๅˆฐ2็ปดๆˆ–่€…3็ปด๏ผŒ่ฟ›่กŒๅฏ่ง†ๅŒ–ใ€‚ๆˆ‘ไปฌ็œ‹ๅˆฐt-SNEๆจกๅž‹ๆ˜ฏ้ž็›‘็ฃ็š„้™็ปด๏ผŒไป–่ทŸkmeans็ญ‰ไธๅŒ๏ผŒไป–ไธ่ƒฝ้€š่ฟ‡่ฎญ็ปƒๅพ—ๅˆฐไธ€ไบ›ไธœ่ฅฟไน‹ๅŽๅ†็”จไบŽๅ…ถๅฎƒๆ•ฐๆฎ(ๆฏ”ๅฆ‚kmeansๅฏไปฅ้€š่ฟ‡่ฎญ็ปƒๅพ—ๅˆฐkไธช็‚น๏ผŒๅ†็”จไบŽๅ…ถๅฎƒๆ•ฐๆฎ้›†๏ผŒ่€Œt-SNEๅช่ƒฝๅ•็‹ฌ็š„ๅฏนๆ•ฐๆฎๅšๆ“ไฝœ๏ผŒไนŸๅฐฑๆ˜ฏ่ฏดไป–ๅชๆœ‰fit_transform๏ผŒ่€Œๆฒกๆœ‰fitๆ“ไฝœ)ใ€‚t-SNEๆ˜ฏ็”ฑSNE(Stochastic Neighbor Embedding, SNE)ๅ‘ๅฑ•่€Œๆฅใ€‚ๆˆ‘ไปฌๅ…ˆไป‹็ปSNE็š„ๅŸบๆœฌๅŽŸ็†๏ผŒไน‹ๅŽๅ†ๆ‰ฉๅฑ•ๅˆฐt-SNEใ€‚

SNE(Stochastic Neighbor Embedding)

SNEๆ˜ฏ้€š่ฟ‡ไปฟๅฐ„(affinitie)ๅ˜ๆขๅฐ†ๆ•ฐๆฎ็‚นๆ˜ ๅฐ„ๅˆฐๆฆ‚็އๅˆ†ๅธƒไธŠ๏ผŒไธป่ฆๅŒ…ๆ‹ฌไธคไธชๆญฅ้ชค๏ผš

  1. 1ใ€SNEๆž„ๅปบไธ€ไธช้ซ˜็ปดๅฏน่ฑกไน‹้—ด็š„ๆฆ‚็އๅˆ†ๅธƒ๏ผŒไฝฟๅพ—็›ธไผผ็š„ๅฏน่ฑกๆœ‰ๆ›ด้ซ˜็š„ๆฆ‚็އ่ขซ้€‰ๆ‹ฉ๏ผŒ่€Œไธ็›ธไผผ็š„ๅฏน่ฑกๆœ‰่พƒไฝŽ็š„ๆฆ‚็އ่ขซ้€‰ๆ‹ฉใ€‚

  2. 2ใ€SNEๅœจไฝŽ็ปด็ฉบ้—ด้‡Œๅœจๆž„ๅปบ่ฟ™ไบ›็‚น็š„ๆฆ‚็އๅˆ†ๅธƒ๏ผŒไฝฟๅพ—่ฟ™ไธคไธชๆฆ‚็އๅˆ†ๅธƒไน‹้—ดๅฐฝๅฏ่ƒฝ็š„็›ธไผผใ€‚

SNEๅ…ˆๅฐ†ๆฌงๆฐ่ท็ฆป่ฝฌๆขไธบๆกไปถๆฆ‚็އๆฅ่กจ่พพ็‚นไธŽ็‚นไน‹้—ด็š„็›ธไผผๅบฆใ€‚ๅ…ทไฝ“ๆฅ่ฏด๏ผŒ็ป™ๅฎš NN ไธช้ซ˜็ปดๆ•ฐๆฎ x1,x2,โ€ฆ,xNx_1,x_2,\dots,x_N๏ผŒๅ…ˆ่ฎก็ฎ—ๆฆ‚็އ pijp_{ij}๏ผŒๆญฃๆฏ”ไบŽ xix_i ๅ’Œ xjx_j ไน‹้—ด็š„็›ธไผผๅบฆ(่ฟ™็งๆฆ‚็އๆ˜ฏๆˆ‘ไปฌ่‡ชๅทฑๆž„ๅปบ็š„)๏ผŒๅณ

pjโˆฃi=exp(โˆ’โˆฃโˆฃxiโˆ’xjโˆฃโˆฃ2/(2ฯƒi2))โˆ‘kโ‰ iexp(โˆ’โˆฃโˆฃxiโˆ’xkโˆฃโˆฃ2/(2ฯƒi2))p_{j|i} = \frac{exp(-||x_i-x_j||^2/(2\sigma_i^2))}{\sum_{k\neq i}exp(-||x_i-x_k||^2/(2\sigma_i^2))}

ฯƒi\sigma_i ไพๆฎไธๅŒ็š„ xix_i ๅ–ๅ€ผไธๅŒ๏ผŒๆญคๅค–ๅ› ไธบๆˆ‘ไปฌๅ…ณๆณจ็š„ๆ˜ฏไธคไธคไน‹้—ด็š„็›ธไผผๅบฆ๏ผŒๆ‰€ไปฅ่ฎพ็ฝฎ pxโˆฃx=0p_{x|x}=0 ใ€‚ๅฏนไบŽไฝŽ็ปดๅบฆไธ‹็š„ yiy_i ๏ผŒๆˆ‘ไปฌๅฏไปฅๆŒ‡ๅฎš้ซ˜ๆ–ฏๅˆ†ๅธƒ็š„ๆ–นๅทฎไธบ 12\frac{1}{\sqrt{2}} ๏ผŒๅ› ๆญคๅฎƒไปฌไน‹้—ด็š„็›ธไผผๅบฆๅฆ‚ไธ‹

qjโˆฃi=exp(โˆ’โˆฃโˆฃxiโˆ’xjโˆฃโˆฃ2)โˆ‘kโ‰ iexp(โˆ’โˆฃโˆฃxiโˆ’xkโˆฃโˆฃ2)q_{j|i} = \frac{exp(-||x_i-x_j||^2)}{\sum_{k\neq i}exp(-||x_i-x_k||^2)} ๏ผŒๅŒๆ ท่ฎพๅฎš qxโˆฃx=0q_{x|x}=0

ๅฆ‚ๆžœๅงœ็ปด็š„ๆ•ˆๆžœๆฏ”่พƒๅฅฝ๏ผŒๅฑ€้ƒจ็‰นๅพไฟ็•™ๅฎŒๆ•ด๏ผŒ้‚ฃไนˆ piโˆฃj=qiโˆฃjp_{i|j}=q_{i|j} ๏ผŒๅ› ๆญคๆˆ‘ไปฌไผ˜ๅŒ–ไธคไธชๅˆ†ๅธƒไน‹้—ด็š„่ท็ฆป KLKL ๆ•ฃๅบฆ๏ผŒ้‚ฃไนˆ็›ฎๆ ‡ๅ‡ฝๆ•ฐๅฆ‚ไธ‹

C=โˆ‘iKL(PiโˆฃโˆฃQi)=โˆ‘iโˆ‘jpjโˆฃilogpjโˆฃiqjโˆฃiC=\sum\limits_iKL(P_i||Q_i)=\sum\limits_i\sum\limits_jp_{j|i}log\frac{p_{j|i}}{q_{j|i}}

่ฟ™้‡Œ็š„ PiP_i ่กจ็คบไบ†็ป™ๅฎš xix_i ไธ‹๏ผŒๅ…ถไป–ๆ‰€ๆœ‰ๆ•ฐๆฎ็‚น็š„ๆกไปถๆฆ‚็އๅˆ†ๅธƒใ€‚้œ€่ฆๆณจๆ„็š„ๆ˜ฏKLๆ•ฃๅบฆๅ…ทๆœ‰ไธๅฏน็งฐๆ€ง๏ผŒๅœจไฝŽ็ปดๆ˜ ๅฐ„ไธญไธๅŒ่ท็ฆปๅฏนๅบ”็š„ๆƒฉ็ฝšๆƒ้‡ๆ˜ฏไธๅŒ็š„๏ผŒๅ…ทไฝ“ๆฅ่ฏด๏ผš่ท็ฆป่พƒ่ฟœ็š„ไธคไธช็‚นๆฅ่กจ่พพ่ท็ฆป่พƒ่ฟ‘็š„ไธคไธช็‚นไผšไบง็”Ÿๆ›ดๅคง็š„cost๏ผŒ็›ธๅ๏ผŒ็”จ่พƒ่ฟ‘็š„ไธคไธช็‚นๆฅ่กจ่พพ่พƒ่ฟœ็š„ไธคไธช็‚นไบง็”Ÿ็š„cost็›ธๅฏน่พƒๅฐ๏ผŒๅณ็”จ่พƒๅฐ็š„ qjโˆฃi=0.2q_{j|i}=0.2 ๆฅๅปบๆจก่พƒๅคง็š„ pjโˆฃi=0.8p_{j|i}=0.8 ๏ผŒcostไธบ plog(pq)=1.11plog(\frac{p}{q})=1.11 ๏ผŒๅŒๆ ท็”จ่พƒๅคง็š„ qjโˆฃi=0.8q_{j|i}=0.8 ๆฅๅปบๆจก่พƒๅคง็š„ pjโˆฃi=0.2p_{j|i}=0.2 ๏ผŒcostไธบ plog(pq)=โˆ’0.277plog(\frac{p}{q})=-0.277๏ผŒๅ› ๆญค๏ผŒSNEไผšๅ€พๅ‘ไบŽไฟ็•™ๆ•ฐๆฎไธญ็š„ๅฑ€้ƒจ็‰นๅพใ€‚

้ฆ–ๅ…ˆ๏ผŒไธๅŒ็š„็‚นๅ…ทๆœ‰ไธๅŒ็š„ ฯƒi\sigma_i ๏ผŒ PiP_i ็š„็†ตไผš้š็€ ฯƒi\sigma_i ็š„ๅขžๅŠ ่€ŒๅขžๅŠ ใ€‚SNEไฝฟ็”จๅ›ฐๆƒ‘ๅบฆ็š„ๆฆ‚ๅฟต๏ผŒ็”จไบŒๅˆ†ๆœ็ดข็š„ๆ–นๅผๆฅๅฏปๆ‰พไธ€ไธชๆœ€ไฝณ็š„ ฯƒ\sigmaใ€‚

ๅ›ฐๆƒ‘ๅบฆ๏ผš Perp(Pi)=2H(pi)Perp(P_i)=2^{H(p_i)} ๏ผŒ็†ต๏ผš H(pi)=โˆ’โˆ‘jpjโˆฃilog2pjโˆฃiH(p_i)=-\sum\limits_jp_{j|i}log_2p_{j|i}

ๅ›ฐๆƒ‘ๅบฆๅฏไปฅ่งฃ้‡Šไธบไธ€ไธช็‚น้™„่ฟ‘็š„ๆœ‰ๆ•ˆ่ฟ‘้‚ป็‚นไธชๆ•ฐใ€‚SNEๅฏนๅ›ฐๆƒ‘ๅบฆ็š„่ฐƒๆ•ดๆฏ”่พƒๆœ‰้ฒๆฃ’ๆ€ง๏ผŒ้€šๅธธ้€‰ๅœจ 55 ่‡ณ 5050 ไน‹้—ด๏ผŒ็ป™ๅฎšไน‹ๅŽ๏ผŒไฝฟ็”จไบŒๅˆ†ๆœ็ดข็š„ๆ–นๅผๅฏปๆ‰พๅˆ้€‚็š„ ฯƒ\sigma

้‚ฃไนˆๆ ธๅฟƒ้—ฎ้ข˜ๅฐฑๆ˜ฏๅฆ‚ไฝ•ๆฑ‚่งฃๆขฏๅบฆไบ†๏ผŒ็›ฎๆ ‡ๅ‡ฝๆ•ฐ็ญ‰ไปทไบŽ โˆ‘โˆ‘โˆ’plog(q)\sum\sum-plog(q) ่ฟ™ไธชๅผๅญไธŽsoftmax้žๅธธ็›ธไผผ๏ผŒๆˆ‘ไปฌ็Ÿฅ้“softmax็š„็›ฎๆ ‡ๅ‡ฝๆ•ฐๆ˜ฏ โˆ‘โˆ‘โˆ’ylog(p)\sum\sum-ylog(p) ๏ผŒๅฏนๅบ”็š„ๆขฏๅบฆๆ˜ฏ yโˆ’py-p (ๆณจ๏ผš่ฟ™้‡Œ็š„softmaxไธญy่กจ็คบlabel๏ผŒp่กจ็คบ้ข„ไผฐๅ€ผ)ใ€‚ ๅŒๆ ทๆˆ‘ไปฌๅฏไปฅๆŽจๅฏผSNE็š„็›ฎๆ ‡ๅ‡ฝๆ•ฐไธญ็š„ ii ๅœจ jj ไธ‹็š„ๆกไปถๆฆ‚็އๆƒ…ๅ†ต็š„ๆขฏๅบฆๆ˜ฏ 2(piโˆฃjโˆ’qiโˆฃj)(yiโˆ’yj)2(p_{i|j}-q_{i|j})(y_i-y_j)๏ผŒ ๅŒๆ ทjๅœจiไธ‹็š„ๆกไปถๆฆ‚็އ็š„ๆขฏๅบฆๆ˜ฏ 2(pjโˆฃiโˆ’qjโˆฃi)(yiโˆ’yj)2(pjโˆฃiโˆ’qjโˆฃi)(yiโˆ’yj)2(p_{j|i}โˆ’q_{j|i})(y_iโˆ’y_j)2(p_{j|i}โˆ’q_{j|i})(y_iโˆ’y_j) , ๆœ€ๅŽๅพ—ๅˆฐๅฎŒๆ•ด็š„ๆขฏๅบฆๅ…ฌๅผๅฆ‚ไธ‹๏ผš

ฮดCฮดyi=2โˆ‘j(pjโˆฃiโˆ’qjโˆฃi+piโˆฃjโˆ’qiโˆฃj)(yiโˆ’yj)\frac{\delta C}{\delta y_i} = 2\sum\limits_j(p_{j|i}-q_{j|i}+p_{i|j}-q_{i|j})(y_i-y_j)

ๅœจๅˆๅง‹ๅŒ–ไธญ๏ผŒๅฏไปฅ็”จ่พƒๅฐ็š„ ฯƒ\sigma ไธ‹็š„้ซ˜ๆ–ฏๅˆ†ๅธƒๆฅ่ฟ›่กŒๅˆๅง‹ๅŒ–ใ€‚ไธบไบ†ๅŠ ้€Ÿไผ˜ๅŒ–่ฟ‡็จ‹ๅ’Œ้ฟๅ…้™ทๅ…ฅๅฑ€้ƒจๆœ€ไผ˜่งฃ๏ผŒๆขฏๅบฆไธญ้œ€่ฆไฝฟ็”จไธ€ไธช็›ธๅฏน่พƒๅคง็š„ๅŠจ้‡ใ€‚ๅณๅ‚ๆ•ฐๆ›ดๆ–ฐไธญ้™คไบ†ๅฝ“ๅ‰ๆขฏๅบฆ๏ผŒ่ฟ˜่ฆๅผ•ๅ…ฅไน‹ๅ‰็š„ๆขฏๅบฆ็ดฏๅŠ ็š„ๆŒ‡ๆ•ฐ่กฐ้€€้กน๏ผŒๅฆ‚ไธ‹๏ผš

Y(t)=Y(tโˆ’1)+ฮทฮดCฮดY+ฮฑ(t)(Y(tโˆ’1)โˆ’Y(tโˆ’2))Y^{(t)}=Y^{(t-1)}+\eta\frac{\delta C}{\delta Y}+\alpha(t)(Y^{(t-1)}-Y^{(t-2)})

่ฟ™้‡Œ็š„ Y(t)Y^{(t)} ่กจ็คบ่ฟญไปฃ tt ๆฌก็š„่งฃ๏ผŒ ฮท\eta ่กจ็คบๅญฆไน ้€Ÿ็އ๏ผŒ ฮฑ(t)\alpha(t) ่กจ็คบ่ฟญไปฃ tt ๆฌก็š„ๅŠจ้‡ใ€‚

ๆญคๅค–๏ผŒๅœจๅˆๅง‹ไผ˜ๅŒ–็š„้˜ถๆฎต๏ผŒๆฏๆฌก่ฟญไปฃไธญๅฏไปฅๅผ•ๅ…ฅไธ€ไบ›้ซ˜ๆ–ฏๅ™ชๅฃฐ๏ผŒไน‹ๅŽๅƒๆจกๆ‹Ÿ้€€็ซไธ€ๆ ท้€ๆธๅ‡ๅฐ่ฏฅๅ™ชๅฃฐ๏ผŒๅฏไปฅ็”จๆฅ้ฟๅ…้™ทๅ…ฅๅฑ€้ƒจๆœ€ไผ˜่งฃใ€‚ๅ› ๆญค๏ผŒSNEๅœจ้€‰ๆ‹ฉ้ซ˜ๆ–ฏๅ™ชๅฃฐ๏ผŒไปฅๅŠๅญฆไน ้€Ÿ็އ๏ผŒไป€ไนˆๆ—ถๅ€™ๅผ€ๅง‹่กฐๅ‡๏ผŒๅŠจ้‡้€‰ๆ‹ฉ็ญ‰็ญ‰่ถ…ๅ‚ๆ•ฐไธŠ๏ผŒ้œ€่ฆ่ท‘ๅคšๆฌกไผ˜ๅŒ–ๆ‰ๅฏไปฅใ€‚

t-SNE

ๅฐฝ็ฎกSNEๆไพ›ไบ†ๅพˆๅฅฝ็š„ๅฏ่ง†ๅŒ–ๆ–นๆณ•๏ผŒไฝ†ๆ˜ฏไป–ๅพˆ้šพไผ˜ๅŒ–๏ผŒ่€Œไธ”ๅญ˜ๅœจโ€crowding problemโ€(ๆ‹ฅๆŒค้—ฎ้ข˜)๏ผŒ t-SNEๅœจไฝŽ็ปด็ฉบ้—ดไธ‹ไฝฟ็”จๆ›ด้‡้•ฟๅฐพๅˆ†ๅธƒ็š„tๅˆ†ๅธƒๆฅ้ฟๅ…crowding้—ฎ้ข˜ๅ’Œไผ˜ๅŒ–้—ฎ้ข˜ใ€‚t-SNEไธŽSNEไธๅŒไธป่ฆๅฆ‚ไธ‹๏ผš

  1. 1ใ€ไฝฟ็”จๅฏน็งฐ็‰ˆ็š„ SNE๏ผŒ็ฎ€ๅŒ–ๆขฏๅบฆๅ…ฌๅผ

  2. 2ใ€ไฝŽ็ปด็ฉบ้—ดไธ‹๏ผŒไฝฟ็”จ tt ๅˆ†ๅธƒไปฃๆ›ฟ้ซ˜ๆ–ฏๅˆ†ๅธƒ่กจ่พพไธค็‚นไน‹้—ด็š„็›ธไผผๅบฆ

ๅฏน็งฐ็‰ˆSNEไฝฟ็”จ่”ๅˆๆฆ‚็އๅˆ†ๅธƒๆฅๆ›ฟๆขๆกไปถๆฆ‚็އๅˆ†ๅธƒ๏ผŒๅณ PP ๆ˜ฏ้ซ˜็ปด็ฉบ้—ด้‡Œๅ„ไธช็‚น็š„่”ๅˆๆฆ‚็އๅˆ†ๅธƒ๏ผŒ QQ ๆ˜ฏไฝŽ็ปด็ฉบ้—ดไธ‹็š„๏ผŒ็›ฎๆ ‡ๅ‡ฝๆ•ฐไธบ๏ผš

C=KL(PโˆฃโˆฃQ)=โˆ‘iโˆ‘jpi,jlogpijqijC=KL(P||Q)=\sum\limits_i\sum\limits_jp_{i,j}log\frac{p_{ij}}{q_{ij}}

่ฟ™้‡Œ็š„ piip_{ii} ๅ’Œ qiiq_{ii} ๆˆ‘ไปฌไพๆ—ง่ฎพ็ฝฎไธบ 00 ๏ผŒๆˆ‘ไปฌๅฐ†่ฟ™็งSNE็งฐไน‹ไธบๅฏน็งฐSNE๏ผŒๅ› ไธบๅ‡่ฎพไบ†ๅฏนไบŽไปปๆ„ ii ๏ผŒ pij=pjip_{ij}=p_{ji} ๏ผŒ qij=qjiq_{ij}=q_{ji} ๏ผŒๅ› ๆญคๆฆ‚็އๅˆ†ๅธƒๅฏไปฅๆ”นๅ†™ไธบ๏ผš

pij=exp(โˆ’โˆฃโˆฃxiโˆ’xjโˆฃโˆฃ2/(2ฯƒi2))โˆ‘kโ‰ lexp(โˆ’โˆฃโˆฃxkโˆ’xlโˆฃโˆฃ2/(2ฯƒi2))p_{ij} = \frac{exp(-||x_i-x_j||^2/(2\sigma_i^2))}{\sum_{k\neq l}exp(-||x_k-x_l||^2/(2\sigma_i^2))} qij=exp(โˆ’โˆฃโˆฃxiโˆ’xjโˆฃโˆฃ2)โˆ‘kโ‰ lexp(โˆ’โˆฃโˆฃxkโˆ’xlโˆฃโˆฃ2)q_{ij} = \frac{exp(-||x_i-x_j||^2)}{\sum_{k\neq l}exp(-||x_k-x_l||^2)}

่ฟ™็ง่กจ่พพๆ–นๅผไฝฟๅพ—ๆ•ดไฝ“็ฎ€ๆดไบ†ๅพˆๅคš๏ผŒไฝ†ๆ˜ฏไผšๆœ‰ๅผ•ๅ…ฅๅผ‚ๅธธๅ€ผ็š„้—ฎ้ข˜ใ€‚ๆฏ”ๅฆ‚ xix_i ๆ˜ฏๅผ‚ๅธธๅ€ผ๏ผŒ้‚ฃไนˆ โˆฃโˆฃxiโˆ’xjโˆฃโˆฃ2||x_i-x_j||^2 ๅพˆไผšๅคง๏ผŒๅฏนๅบ”็š„ๆ‰€ๆœ‰็š„ xjx_j ๏ผŒ pijp_{ij} ้ƒฝไผšๅพˆๅฐ๏ผŒๅฏผ่‡ดไฝŽ็ปดๆ˜ ๅฐ„ไธ‹็š„ yiy_i ๅฏนcostๅฝฑๅ“ๅพˆๅฐใ€‚ไธบไบ†่งฃๅ†ณ่ฟ™ไธช้—ฎ้ข˜๏ผŒๆˆ‘ไปฌๅฐ†่”ๅˆๅˆ†ๅธƒไฟฎๆญฃไธบ๏ผš pij=piโˆฃj+pjโˆฃi2p_{ij}=\frac{p_{i|j}+p_{j|i}}{2} ๏ผŒ่ฟ™ไฟ่ฏไบ† โˆ‘jpij>12n\sum_jp_{ij}>\frac{1}{2n} ๏ผŒไฝฟๅพ—ๆฏไธช็‚นๅฏนไบŽcost้ƒฝไผšๆœ‰ไธ€ๅฎš็š„่ดก็Œฎใ€‚ๅฏน็งฐSNE็š„ๆœ€ๅคงไผ˜็‚นๆ˜ฏๆขฏๅบฆ่ฎก็ฎ—ๅ˜ๅพ—็ฎ€ๅ•๏ผŒๅฆ‚ไธ‹๏ผš

ฮดCฮดyi=4โˆ‘j(pijโˆ’qij)(yiโˆ’yj)\frac{\delta C}{\delta y_i}=4\sum\limits_j(p_{ij}-q_{ij})(y_i-y_j)

ๆ‹ฅๆŒค้—ฎ้ข˜ๅฐฑๆ˜ฏ่ฏดๅ„ไธช็ฐ‡่š้›†ๅœจไธ€่ตท๏ผŒๆ— ๆณ•ๅŒบๅˆ†ใ€‚ๆฏ”ๅฆ‚ๆœ‰ไธ€็งๆƒ…ๅ†ต๏ผŒ้ซ˜็ปดๅบฆๆ•ฐๆฎๅœจ้™็ปดๅˆฐ10็ปดไธ‹๏ผŒๅฏไปฅๆœ‰ๅพˆๅฅฝ็š„่กจ่พพ๏ผŒไฝ†ๆ˜ฏ้™็ปดๅˆฐไธค็ปดๅŽๆ— ๆณ•ๅพ—ๅˆฐๅฏไฟกๆ˜ ๅฐ„๏ผŒๆฏ”ๅฆ‚้™็ปดๅฆ‚10็ปดไธญๆœ‰11ไธช็‚นไน‹้—ดไธคไธค็ญ‰่ท็ฆป็š„๏ผŒๅœจไบŒ็ปดไธ‹ๅฐฑๆ— ๆณ•ๅพ—ๅˆฐๅฏไฟก็š„ๆ˜ ๅฐ„็ป“ๆžœ(ๆœ€ๅคš3ไธช็‚น)ใ€‚ ่ฟ›ไธ€ๆญฅ็š„่ฏดๆ˜Ž๏ผŒๅ‡่ฎพไธ€ไธชไปฅๆ•ฐๆฎ็‚น xix_i ไธบไธญๅฟƒ๏ผŒๅŠๅพ„ไธบ rr ็š„ mm ็ปด็ƒ(ไธ‰็ปด็ฉบ้—ดๅฐฑๆ˜ฏ็ƒ)๏ผŒๅ…ถไฝ“็งฏๆ˜ฏๆŒ‰ rmr^m ๅขž้•ฟ็š„๏ผŒๅ‡่ฎพๆ•ฐๆฎ็‚นๆ˜ฏๅœจ mm ็ปด็ƒไธญๅ‡ๅŒ€ๅˆ†ๅธƒ็š„๏ผŒๆˆ‘ไปฌๆฅ็œ‹็œ‹ๅ…ถไป–ๆ•ฐๆฎ็‚นไธŽ xix_i ็š„่ท็ฆป้š็ปดๅบฆๅขžๅคง่€Œไบง็”Ÿ็š„ๅ˜ๅŒ–ใ€‚

ไปŽไธŠๅ›พๅฏไปฅ็œ‹ๅˆฐ๏ผŒ้š็€็ปดๅบฆ็š„ๅขžๅคง๏ผŒๅคง้ƒจๅˆ†ๆ•ฐๆฎ็‚น้ƒฝ่š้›†ๅœจ mm ็ปด็ƒ็š„่กจ้ข้™„่ฟ‘๏ผŒไธŽ็‚น xix_i ็š„่ท็ฆปๅˆ†ๅธƒๆžไธๅ‡่กกใ€‚ๅฆ‚ๆžœ็›ดๆŽฅๅฐ†่ฟ™็ง่ท็ฆปๅ…ณ็ณปไฟ็•™ๅˆฐไฝŽ็ปด๏ผŒๅฐฑไผšๅ‡บ็Žฐๆ‹ฅๆŒค้—ฎ้ข˜ใ€‚ไธบไบ†่งฃๅ†ณๆ‹ฅๆŒค้—ฎ้ข˜๏ผŒ Cook et al.(2007) ๆๅ‡บไธ€็งslight repulsion็š„ๆ–นๅผ๏ผŒๅœจๅŸบ็บฟๆฆ‚็އๅˆ†ๅธƒ(uniform background)ไธญๅผ•ๅ…ฅไธ€ไธช่พƒๅฐ็š„ๆททๅˆๅ› ๅญ ฯ\rho ๏ผŒ่ฟ™ๆ ท qijq_{ij} ๅฐฑๆฐธ่ฟœไธไผšๅฐไบŽ 2ฯn(nโˆ’1)\frac{2\rho}{n(n-1)} (ๅ› ไธบไธ€ๅ…ฑไบ† n(nโˆ’1)n(n-1) ไธชpairs)๏ผŒ่ฟ™ๆ ทๅœจ้ซ˜็ปด็ฉบ้—ดไธญๆฏ”่พƒ่ฟœ็š„ไธคไธช็‚นไน‹้—ด็š„ qijq_{ij} ๆ€ปๆ˜ฏไผšๆฏ” pijp_{ij} ๅคงไธ€็‚นใ€‚่ฟ™็ง็งฐไน‹ไธบUNI-SNE๏ผŒๆ•ˆๆžœ้€šๅธธๆฏ”ๆ ‡ๅ‡†็š„SNE่ฆๅฅฝใ€‚ไผ˜ๅŒ–UNI-SNE็š„ๆ–นๆณ•ๆ˜ฏๅ…ˆ่ฎฉ ฯ\rho ไธบ0๏ผŒไฝฟ็”จๆ ‡ๅ‡†็š„SNEไผ˜ๅŒ–๏ผŒไน‹ๅŽ็”จๆจกๆ‹Ÿ้€€็ซ็š„ๆ–นๆณ•็š„ๆ—ถๅ€™๏ผŒๅ†ๆ…ขๆ…ขๅขžๅŠ  ฯ\rho ใ€‚็›ดๆŽฅไผ˜ๅŒ–UNI-SNEๆ˜ฏไธ่กŒ็š„(ๅณไธ€ๅผ€ๅง‹ ฯ\rho ไธไธบ0)๏ผŒๅ› ไธบ่ท็ฆป่พƒ่ฟœ็š„ไธคไธช็‚นๅŸบๆœฌๆ˜ฏไธ€ๆ ท็š„ qijq_{ij} (็ญ‰ไบŽๅŸบ็บฟๅˆ†ๅธƒ), ๅณไฝฟ pijp_{ij} ๅพˆๅคง๏ผŒไธ€ไบ›่ท็ฆปๅ˜ๅŒ–ๅพˆ้šพๅœจ qijq_{ij} ไธญไบง็”Ÿไฝœ็”จใ€‚ไนŸๅฐฑๆ˜ฏ่ฏดไผ˜ๅŒ–ไธญๅˆšๅผ€ๅง‹่ท็ฆป่พƒ่ฟœ็š„ไธคไธช่š็ฑป็‚น๏ผŒๅŽ็ปญๅฐฑๆ— ๆณ•ๅ†ๆŠŠไป–ไปฌๆ‹‰่ฟ‘ไบ†ใ€‚

ๅฏน็งฐSNEๅฎž้™…ไธŠๅœจ้ซ˜็ปดๅบฆไธ‹ ๅฆๅค–ไธ€็งๅ‡่ฝปโ€ๆ‹ฅๆŒค้—ฎ้ข˜โ€็š„ๆ–นๆณ•๏ผšๅœจ้ซ˜็ปด็ฉบ้—ดไธ‹๏ผŒๅœจ้ซ˜็ปด็ฉบ้—ดไธ‹ๆˆ‘ไปฌไฝฟ็”จ้ซ˜ๆ–ฏๅˆ†ๅธƒๅฐ†่ท็ฆป่ฝฌๆขไธบๆฆ‚็އๅˆ†ๅธƒ๏ผŒๅœจไฝŽ็ปด็ฉบ้—ดไธ‹๏ผŒๆˆ‘ไปฌไฝฟ็”จๆ›ดๅŠ ๅ้‡้•ฟๅฐพๅˆ†ๅธƒ็š„ๆ–นๅผๆฅๅฐ†่ท็ฆป่ฝฌๆขไธบๆฆ‚็އๅˆ†ๅธƒ๏ผŒไฝฟๅพ—้ซ˜็ปดๅบฆไธ‹ไธญไฝŽ็ญ‰็š„่ท็ฆปๅœจๆ˜ ๅฐ„ๅŽ่ƒฝๅคŸๆœ‰ไธ€ไธช่พƒๅคง็š„่ท็ฆปใ€‚

ๆˆ‘ไปฌๅฏนๆฏ”ไธ€ไธ‹้ซ˜ๆ–ฏๅˆ†ๅธƒๅ’Œtๅˆ†ๅธƒ(ๅฆ‚ไธŠๅ›พ,code่งprobability/distribution.md), tๅˆ†ๅธƒๅ—ๅผ‚ๅธธๅ€ผๅฝฑๅ“ๆ›ดๅฐ๏ผŒๆ‹Ÿๅˆ็ป“ๆžœๆ›ดไธบๅˆ็†๏ผŒ่พƒๅฅฝ็š„ๆ•่Žทไบ†ๆ•ฐๆฎ็š„ๆ•ดไฝ“็‰นๅพใ€‚ ไฝฟ็”จไบ†tๅˆ†ๅธƒไน‹ๅŽ็š„qๅ˜ๅŒ–๏ผŒๅฆ‚ไธ‹๏ผš

qij=(1+โˆฃโˆฃyiโˆ’yjโˆฃโˆฃ2)โˆ’1โˆ‘kโ‰ l(1+โˆฃโˆฃyiโˆ’yjโˆฃโˆฃ2)โˆ’1q_{ij}=\frac{(1+||y_i-y_j||^2)^{-1}}{\sum_{k\neq l(1+||y_i-y_j||^2)^{-1}}}

ๆญคๅค–๏ผŒtๅˆ†ๅธƒๆ˜ฏๆ— ้™ๅคšไธช้ซ˜ๆ–ฏๅˆ†ๅธƒ็š„ๅ ๅŠ ๏ผŒ่ฎก็ฎ—ไธŠไธๆ˜ฏๆŒ‡ๆ•ฐ็š„๏ผŒไผšๆ–นไพฟๅพˆๅคšใ€‚ไผ˜ๅŒ–็š„ๆขฏๅบฆๅฆ‚ไธ‹๏ผš

ฮดCฮดyi=4โˆ‘j(pijโˆ’qij)(yiโˆ’yj)(1+โˆฃโˆฃyiโˆ’yjโˆฃโˆฃ2)โˆ’1\frac{\delta C}{\delta y_i}=4\sum\limits_j(p_{ij}-q_{ij})(y_i-y_j)(1+||y_i-y_j||^2)^{-1}

t-sne็š„ๆœ‰ๆ•ˆๆ€ง๏ผŒไนŸๅฏไปฅไปŽไธŠๅ›พไธญ็œ‹ๅˆฐ๏ผšๆจช่ฝด่กจ็คบ่ท็ฆป๏ผŒ็บต่ฝด่กจ็คบ็›ธไผผๅบฆ, ๅฏไปฅ็œ‹ๅˆฐ๏ผŒๅฏนไบŽ่พƒๅคง็›ธไผผๅบฆ็š„็‚น๏ผŒtๅˆ†ๅธƒๅœจไฝŽ็ปด็ฉบ้—ดไธญ็š„่ท็ฆป้œ€่ฆ็จๅฐไธ€็‚น๏ผ›่€ŒๅฏนไบŽไฝŽ็›ธไผผๅบฆ็š„็‚น๏ผŒtๅˆ†ๅธƒๅœจไฝŽ็ปด็ฉบ้—ดไธญ็š„่ท็ฆป้œ€่ฆๆ›ด่ฟœใ€‚่ฟ™ๆฐๅฅฝๆปก่ถณไบ†ๆˆ‘ไปฌ็š„้œ€ๆฑ‚๏ผŒๅณๅŒไธ€็ฐ‡ๅ†…็š„็‚น(่ท็ฆป่พƒ่ฟ‘)่šๅˆ็š„ๆ›ด็ดงๅฏ†๏ผŒไธๅŒ็ฐ‡ไน‹้—ด็š„็‚น(่ท็ฆป่พƒ่ฟœ)ๆ›ดๅŠ ็–่ฟœใ€‚ ๆ€ป็ป“ไธ€ไธ‹๏ผŒt-SNE็š„ๆขฏๅบฆๆ›ดๆ–ฐๆœ‰ไธคๅคงไผ˜ๅŠฟ๏ผš

  1. 1ใ€ๅฏนไบŽไธ็›ธไผผ็š„็‚น๏ผŒ็”จไธ€ไธช่พƒๅฐ็š„่ท็ฆปไผšไบง็”Ÿ่พƒๅคง็š„ๆขฏๅบฆๆฅ่ฎฉ่ฟ™ไบ›็‚นๆŽ’ๆ–ฅๅผ€ๆฅใ€‚

  2. 2ใ€่ฟ™็งๆŽ’ๆ–ฅๅˆไธไผšๆ— ้™ๅคง(ๆขฏๅบฆไธญๅˆ†ๆฏ)๏ผŒ้ฟๅ…ไธ็›ธไผผ็š„็‚น่ท็ฆปๅคช่ฟœใ€‚

็ฎ—ๆณ•่ฟ‡็จ‹

ไผ˜ๅŒ–่ฟ‡็จ‹ๅฆ‚ไธ‹

ไธป่ฆไธ่ถณ๏ผš

ไธป่ฆ็”จไบŽๅฏ่ง†ๅŒ–๏ผŒๅพˆ้šพ็”จไบŽๅ…ถไป–็›ฎ็š„ใ€‚ๆฏ”ๅฆ‚ๆต‹่ฏ•้›†ๅˆ้™็ปด๏ผŒๅ› ไธบไป–ๆฒกๆœ‰ๆ˜พๅผ็š„้ข„ไผฐ้ƒจๅˆ†๏ผŒไธ่ƒฝๅœจๆต‹่ฏ•้›†ๅˆ็›ดๆŽฅ้™็ปด๏ผ›ๆฏ”ๅฆ‚้™็ปดๅˆฐ10็ปด๏ผŒๅ› ไธบtๅˆ†ๅธƒๅ้‡้•ฟๅฐพ๏ผŒ1ไธช่‡ช็”ฑๅบฆ็š„tๅˆ†ๅธƒๅพˆ้šพไฟๅญ˜ๅฅฝๅฑ€้ƒจ็‰นๅพ๏ผŒๅฏ่ƒฝ้œ€่ฆ่ฎพ็ฝฎๆˆๆ›ด้ซ˜็š„่‡ช็”ฑๅบฆใ€‚

t-SNEๅ€พๅ‘ไบŽไฟๅญ˜ๅฑ€้ƒจ็‰นๅพ๏ผŒๅฏนไบŽๆœฌๅพ็ปดๆ•ฐ(intrinsic dimensionality)ๆœฌ่บซๅฐฑๅพˆ้ซ˜็š„ๆ•ฐๆฎ้›†๏ผŒๆ˜ฏไธๅฏ่ƒฝๅฎŒๆ•ด็š„ๆ˜ ๅฐ„ๅˆฐ2-3็ปด็š„็ฉบ้—ดใ€‚

t-SNEๆฒกๆœ‰ๅ”ฏไธ€ๆœ€ไผ˜่งฃ๏ผŒไธ”ๆฒกๆœ‰้ข„ไผฐ้ƒจๅˆ†ใ€‚ๅฆ‚ๆžœๆƒณ่ฆๅš้ข„ไผฐ๏ผŒๅฏไปฅ่€ƒ่™‘้™็ปดไน‹ๅŽ๏ผŒๅ†ๆž„ๅปบไธ€ไธชๅ›žๅฝ’ๆ–น็จ‹ไน‹็ฑป็š„ๆจกๅž‹ๅŽปๅšใ€‚ไฝ†ๆ˜ฏ่ฆๆณจๆ„๏ผŒt-sneไธญ่ท็ฆปๆœฌ่บซๆ˜ฏๆฒกๆœ‰ๆ„ไน‰๏ผŒ้ƒฝๆ˜ฏๆฆ‚็އๅˆ†ๅธƒ้—ฎ้ข˜ใ€‚

่ฎญ็ปƒๅคชๆ…ขใ€‚ๆœ‰ๅพˆๅคšๅŸบไบŽๆ ‘็š„็ฎ—ๆณ•ๅœจt-sneไธŠๅšไธ€ไบ›ๆ”น่ฟ›

Source

Last updated