ç¶²æ˜“é¦–é > ç¶²æ˜“è™Ÿ > æ£æ–‡ ç”³è«‹å…¥é§

AIä¸€æ¬¡æ€§ç”Ÿæˆ63ç§’ã€Šè²“å’Œè€é¼ ã€‹å‹•ç•«ç‰‡ï¼Œç„¡ç·¨è¼¯ç„¡æ‹¼æŽ¥åŠ‡æƒ…100%å…¨æ–°

2025-04-09 17:48:04ã€€ä¾†æº: DeepTechæ·±ç§‘æŠ€

åŒ—äº¬ èˆ‰å ±

åˆ†äº«è‡³

AI ä¹Ÿèƒ½ç”Ÿæˆé€¼çœŸçš„ã€Šè²“å’Œè€é¼ ã€‹å‹•ç•«ç‰‡äº†ï¼é•·åº¦å¯ä»¥é”åˆ° 63 ç§’ï¼ŒåŠ‡æƒ…ä¹Ÿå¯ä»¥é‡æ–°ç”Ÿæˆã€‚

ï¼ˆä¾†æºï¼šè³‡æ–™åœ–ï¼‰

ç•¶åœ°æ™‚é–“ 4 æœˆ 8 æ—¥ï¼Œä¾†è‡ªè‹±å‰é”ã€ç¾Žåœ‹æ–¯å¦ç¦å¤§å¸ã€åŠ å·žå¤§å¸åœ£åœ°äºžå“¥åˆ†æ ¡ã€åŠ å·žå¤§å¸ä¼¯å…‹åˆ©åˆ†æ ¡ã€å¾—å…‹è–©æ–¯å¤§å¸å¥§æ–¯æ±€åˆ†æ ¡çš„ç ”ç©¶äººå“¡ï¼ŒåŸºäºŽæ¸¬è©¦æ™‚è¨“ç·´ï¼ˆTTTï¼ŒTest-Time Trainingï¼‰ç”Ÿæˆäº†å¤šå€‹ã€Šè²“å’Œè€é¼ ã€‹çš„å‹•ç•«è¦–é »ã€‚

ä»–å€‘åœ¨é è¨“ç·´çš„ Transformer æ¨¡åž‹ä¸æ·»åŠ äº†æ¸¬è©¦æ™‚è¨“ç·´å±¤å¹¶å°å…¶é€²è¡Œå¾®èª¿ï¼Œå€Ÿæ¤ç”Ÿæˆäº†å…·æœ‰å¼·æ™‚é–“ä¸€è‡´æ€§çš„ã€Šè²“å’Œè€é¼ ã€‹ä¸€åˆ†é˜å‹•ç•«ç‰‡ã€‚

ç ”ç©¶äººå“¡è¡¨ç¤ºï¼Œæ¯å€‹è¦–é »éƒ½æ˜¯ç”±æ¨¡åž‹ä¸€æ¬¡æ€§ç›´æŽ¥ç”Ÿæˆçš„ï¼Œæ²’æœ‰ç¶“éŽç·¨è¼¯ã€æ‹¼æŽ¥æˆ–åŽè™•ç†ï¼Œæ¯å€‹æ•…äº‹ä¹Ÿéƒ½æ˜¯å…¨æ–°å‰µä½œçš„ã€‚

é‚£ä¹ˆï¼Œä¸Šè¿°è¦–é »åˆ°åº•æ˜¯æ€Žä¹ˆç”Ÿæˆçš„ï¼Ÿç ”ç©¶äººå“¡è¡¨ç¤ºï¼Œå¦‚ä»Šçš„ Transformer æ¨¡åž‹åœ¨ç”Ÿæˆä¸€åˆ†é˜è¦–é »æ–¹é¢ä»ç„¶é¢è‡¨æŒ‘æˆ°ï¼Œå› ç‚ºè‡ªæ³¨æ„åŠ›å±¤åœ¨è™•ç†é•·ä¸Šä¸‹æ–‡æ™‚æ•ˆçŽ‡ä½Žä¸‹ã€‚è«¸å¦‚ Mamba å±¤ä¹‹é¡žçš„æ›¿ä»£æ–¹æ¡ˆåœ¨è™•ç†å¾©é›œçš„å¤šå ´æ™¯æ•…äº‹æ™‚è¡¨ç¾ä¸ä½³ï¼Œå› ç‚ºå®ƒå€‘çš„éš±è—ç‹€æ…‹è¡¨ç¾åŠ›è¼ƒå¼±ã€‚

ç‚ºæ¤ï¼Œä»–å€‘ä½¿ç”¨äº†æ¸¬è©¦æ™‚è¨“ç·´å±¤ï¼Œå…¶éš±è—ç‹€æ…‹æœ¬èº«å¯ä»¥æ˜¯ç¥žç¶“ç¶²çµ¡ï¼Œå¾žè€Œå…·å‚™æ›´å¼·çš„è¡¨é”èƒ½åŠ›ã€‚ç•¶åœ¨é è¨“ç·´çš„ Transformer ä¸åŠ å…¥æ¸¬è©¦æ™‚è¨“ç·´å±¤ï¼Œä½¿å…¶èƒ½å¤ æ ¹æ“šæ–‡æœ¬åˆ†é¡è…³æœ¬ç”Ÿæˆä¸€åˆ†é˜çš„è¦–é »ã€‚

ç ”ç©¶ä¸ï¼Œä»–å€‘å¾žä¸€å€‹é è¨“ç·´çš„æ“´æ•£ Transformerï¼ˆCogVideo-X 5Bï¼‰é–‹å§‹ï¼ŒåŽŸæœ¬å…¶åªèƒ½ä»¥ 16 å¹€æ¯ç§’çš„é€Ÿåº¦ç”Ÿæˆ 3 ç§’çš„çŸç‰‡æ®µï¼Œæˆ–ä»¥ 8 å¹€æ¯ç§’çš„é€Ÿåº¦ç”Ÿæˆ 6 ç§’çš„çŸç‰‡æ®µã€‚

ä½†æ˜¯ï¼Œç ”ç©¶äººå“¡æ·»åŠ äº†å¾žé åˆå§‹åŒ–çš„æ¸¬è©¦æ™‚è¨“ç·´å±¤ï¼Œå¹¶å°è©²æ¨¡åž‹é€²è¡Œå¾®èª¿ï¼Œä»¥ä¾¿æ ¹æ“šæ–‡æœ¬åˆ†é¡è…³æœ¬ç”Ÿæˆä¸€åˆ†é˜çš„è¦–é »ã€‚

ä»–å€‘å°‡è‡ªæ³¨æ„åŠ›å±¤é™åˆ¶åœ¨ 3 ç§’çš„ç‰‡æ®µå…§ï¼Œä»¥ä¾¿å°‡ç ”ç©¶æˆæœ¬ä¿æŒåœ¨å¯æŽ§èŒƒåœå…§ã€‚æ•´å€‹è¨“ç·´éŽç¨‹é‹è¡Œåœ¨ 256 å€‹è‹±å‰é” H100 ä¸Šï¼Œç›¸ç•¶äºŽæ¶ˆè€—äº† 50 å°æ™‚çš„è¨“ç·´æ™‚é•·ã€‚

ç‚ºäº†å¿«é€Ÿé€²è¡Œè¿ä»£ï¼Œç ”ç©¶äººå“¡åŸºäºŽç´„ 7 å°æ™‚çš„ã€Šè²“å’Œè€é¼ ã€‹å‹•ç•«ç‰‡ï¼Œå¹¶è¼”ä»¥äººå·¥æ¨™æ³¨çš„åˆ†é¡è…³æœ¬ï¼Œæ•´ç†äº†ä¸€å€‹æ–‡æœ¬åˆ°è¦–é »çš„æ•¸æ“šé›†ã€‚

ä½œç‚ºæ¦‚å¿µé©—è‰ï¼Œæœ¬æ¬¡ç ”ç©¶ä¸çš„æ•¸æ“šé›†å´é‡äºŽå¾©é›œã€å¤šå ´æ™¯ã€é•·é¡é ä¸”å……æ»¿å‹•æ…‹å‹•ä½œçš„æ•˜äº‹ã€‚è€Œå°äºŽè¦–è¦ºå’Œç‰©ç†çœŸå¯¦æ„Ÿæ–¹é¢ï¼Œæ¤å‰äººå€‘å·²ç¶“å–å¾—é¡¯è‘—é€²å±•ï¼Œæ‰€ä»¥æœ¬æ¬¡ç ”ç©¶æœªä½œé‡é»žå¼·èª¿ã€‚

ï¼ˆä¾†æºï¼šè³‡æ–™åœ–ï¼‰

å¾žå®è§€å±¤é¢ä¾†çœ‹ï¼Œæœ¬æ¬¡æ–¹æ³•åªæ˜¯åœ¨é è¨“ç·´çš„æ“´æ•£ Transformerï¼ˆDiffusion Transformerï¼‰ä¸Šæ·»åŠ äº†æ¸¬è©¦æ™‚è¨“ç·´å±¤ï¼Œå¹¶åœ¨å¸¶æœ‰æ–‡æœ¬æ³¨é‡‹çš„é•·è¦–é »ä¸Šé€²è¡Œå¾®èª¿ã€‚

ä»–å€‘é‡‡ç”¨äº†é å…ˆæ·»åŠ æ¸¬è©¦æ™‚è¨“ç·´å±¤ã€ç„¶åŽå†é€²è¡Œå¾®èª¿çš„æ–¹æ³•ï¼Œé€™ç¨®æ–¹æ³•åŽŸå‰‡ä¸Šé©ç”¨äºŽä»»ä½•ä¸»å¹²æž¶æ§‹ã€‚

ç ”ç©¶ä¸ï¼Œä»–å€‘é¸æ“‡æ“´æ•£ Transformer ä½œç‚ºåˆæ¥æ¼”ç¤ºï¼Œå› ç‚ºå®ƒæ˜¯è¦–é »ç”Ÿæˆä¸æœ€æµè¡Œçš„æž¶æ§‹ã€‚ç”±äºŽåœ¨è¦–é »ä¸Šé è¨“ç·´æ“´æ•£ Transformer çš„æˆæœ¬éŽé«˜ï¼Œæ‰€ä»¥ç ”ç©¶äººå“¡å¾ž CogVideo-X 5B çš„é è¨“ç·´æª¢æŸ¥é»žé–‹å§‹ã€‚

ä»–å€‘å°‡è¦–é »è¨è¨ˆç‚ºåŒ…å«å¤šå€‹å ´æ™¯ï¼Œæ¯å€‹å ´æ™¯åŒ…å«ä¸€å€‹æˆ–å¤šå€‹ 3 ç§’çš„ç‰‡æ®µï¼Œå¹¶é‡‡ç”¨ 3 ç§’ç‰‡æ®µä½œç‚ºæ–‡æœ¬èˆ‡è¦–é »é…å°çš„æœ€å°å–®ä½ï¼Œä¹‹æ‰€ä»¥é€™æ¨£åšçš„åŽŸå› æœ‰ä¸‰å€‹ï¼š

ç¬¬ä¸€ï¼ŒåŽŸå§‹é è¨“ç·´çš„ CogVideo-X çš„æœ€å¤§ç”Ÿæˆé•·åº¦ç‚º 3 ç§’ã€‚ç¬¬äºŒï¼Œåœ¨ã€Šè²“å’Œè€é¼ ã€‹çš„åŠ‡é›†ä¸ï¼Œå¤§å¤šæ•¸å ´æ™¯çš„æ™‚é•·è‡³å°‘ç‚º 3 ç§’ã€‚ç¬¬ä¸‰ï¼Œä»¥ 3 ç§’ç‚ºä¸€æ®µæ§‹å»ºå¤šéšŽæ®µæ•¸æ“šé›†æœ€ç‚ºæ–¹ä¾¿ã€‚

åœ¨æŽ¨ç†éšŽæ®µï¼Œç ”ç©¶äººå“¡æŒ‰ç…§ä»¥ä¸‹ä¸‰ç¨®æ ¼å¼ä¸çš„ä»»ä½•ä¸€ç¨®ï¼Œä»¥è©³ç´°ç¨‹åº¦éžå¢žçš„é †åºä¾†ç·¨å¯«é•·è¦–é »çš„æ–‡æœ¬æç¤ºã€‚

? æ ¼å¼ 1ï¼šç”¨ 5-8 å¥è©±ç°¡çŸæ¦‚è¿°æƒ…ç¯€ã€‚

? æ ¼å¼ 2ï¼šç”¨å¤§ç´„ 20 å¥è©±è©³ç´°æè¿°æƒ…ç¯€ï¼Œæ¯å¥è©±å¤§è‡´å°æ‡‰ 3 ç§’çš„ç‰‡æ®µã€‚

? æ ¼å¼ 3ï¼šåˆ†é¡è…³æœ¬ã€‚æ¯ä¸€å€‹ 3 ç§’é˜çš„ç‰‡æ®µéƒ½ç”±ä¸€æ®µ 3 åˆ° 5 å¥è©±ä¾†æè¿°ï¼Œå…§å®¹åŒ…å«èƒŒæ™¯é¡è‰²å’Œé¡é ç§»å‹•ç‰ç´°ç¯€ã€‚ä¸€å€‹æˆ–å¤šå€‹æ®µè½çµ„æˆçš„è…³æœ¬çµ„ï¼Œæœƒè¢«åš´æ ¼åœ°ç•Œå®šç‚ºå±¬äºŽæŸäº›å ´æ™¯ï¼Œå¹¶ä¸”è¦ä½¿ç”¨é—œéµè©žâ€œ<å ´æ™¯é–‹å§‹>â€å’Œâ€œ< å ´æ™¯çµæŸ >â€ã€‚

åœ¨å¾®èª¿å’ŒæŽ¨ç†ä¸ï¼Œæ–‡æœ¬åˆ†è©žå™¨çš„å¯¦éš›è¼¸å…¥å§‹çµ‚é‡‡ç”¨æ ¼å¼ 3ï¼Œæ ¼å¼ä¹‹é–“çš„è½‰æ›ç”± Claude 3.7 Sonnet æŒ‰ 1â†’2â†’3 çš„é †åºåŸ·è¡Œã€‚

ç‚ºäº†ç”Ÿæˆæ™‚é–“è¼ƒé•·çš„è¦–é »ï¼Œç ”ç©¶äººå“¡é‡å°æ¯å€‹ 3 ç§’çš„ç‰‡æ®µéƒ½ç¨ç«‹ä½¿ç”¨ç›¸åŒçš„ç¨‹åºã€‚

å…·é«”è€Œè¨€ï¼Œçµ¦å®šä¸€å€‹åŒ…å« n æ®µè½çš„æ ¼å¼ 3 çš„åˆ†é¡è…³æœ¬ï¼Œé¦–å…ˆç”Ÿæˆ n å€‹åºåˆ—ç‰‡æ®µï¼Œæ¯å€‹ç‰‡æ®µéƒ½åŒ…å«å¾žç›¸æ‡‰æ®µè½æå–çš„æ–‡æœ¬æ¨™è¨˜ä»¥åŠåŽçºŒçš„è¦–é »æ¨™è¨˜ã€‚

ç„¶åŽï¼Œå°‡æ‰€æœ‰ n å€‹åºåˆ—ç‰‡æ®µé€£æŽ¥åœ¨ä¸€èµ·ï¼Œå¾žè€Œå½¢æˆè¼¸å…¥åºåˆ—ï¼Œé€™æ™‚åºåˆ—ä¸åŒ…å«äº¤éŒ¯æŽ’åˆ—çš„æ–‡æœ¬ tokens å’Œè¦–é » tokensã€‚

å°äºŽ CogVideo-X ä¾†èªªï¼Œå®ƒé‡‡ç”¨è‡ªæ³¨æ„åŠ›å±¤ä¾†é‡å°æ¯æ®µæœ€é•· 3 ç§’çš„è¦–é »é€²è¡Œå…¨å±€åºåˆ—è™•ç†ã€‚ä½†æ˜¯ï¼Œé¢å°é•·è¦–é »æ™‚ï¼Œå…¶æ‰€é‡‡ç”¨çš„å…¨å±€æ³¨æ„åŠ›æ©Ÿåˆ¶æœƒé¡¯è‘—é™ä½Žæ•ˆçŽ‡ã€‚

ç‚ºäº†é¿å…å¢žåŠ è‡ªæ³¨æ„åŠ›å±¤çš„ä¸Šä¸‹æ–‡é•·åº¦ï¼Œç ”ç©¶äººå“¡å°‡å…¶è™•ç†èŒƒåœé™å®šåœ¨æ¯å€‹ 3 ç§’ç‰‡æ®µå…§ï¼Œä½¿å„ n å€‹åºåˆ—ç‰‡æ®µèƒ½å¤ ç¨ç«‹é€²è¡Œæ³¨æ„åŠ›è¨ˆç®—ã€‚

ç”±äºŽæ¸¬è©¦æ™‚è¨“ç·´å±¤èƒ½å¤ é«˜æ•ˆåœ°è™•ç†é•·ä¸Šä¸‹æ–‡åºåˆ—ï¼Œå› æ¤ä»–å€‘é‡‡ç”¨å…¨å±€æ–¹å¼ä¾†è™•ç†æ•´å€‹è¼¸å…¥åºåˆ—ã€‚

éµå¾ªå¤§èªžè¨€æ¨¡åž‹çš„æ¨™æº–åšæ³•ï¼Œç ”ç©¶äººå“¡å°‡æ”¹é€²æž¶æ§‹çš„ä¸Šä¸‹æ–‡é•·åº¦åˆ†ç‚ºäº”å€‹éšŽæ®µï¼Œå¹¶å°‡å…¶æ“´å±•è‡³ä¸€åˆ†é˜ã€‚

å…·é«”ä¾†èªªï¼Œä»–å€‘å…ˆåœ¨ã€Šè²“å’Œè€é¼ ã€‹çš„ 3 ç§’ç‰‡æ®µä¸Šé‡å°æ•´å€‹é è¨“ç·´æ¨¡åž‹é€²è¡Œå¾®èª¿ã€‚

åœ¨æ¤éšŽæ®µï¼Œæ–°çš„åƒæ•¸ç‰¹åˆ¥æ˜¯æ¸¬è©¦æ™‚è¨“ç·´å±¤å’Œé–€æŽ§æ©Ÿåˆ¶ä¸çš„çš„åƒæ•¸ï¼Œæœƒè¢«è³¦äºˆæ›´é«˜çš„å¸ç¿’çŽ‡ã€‚

æŽ¥ä¸‹ä¾†ï¼Œç ”ç©¶äººå“¡åˆ†åˆ¥å° 9 ç§’ã€18 ç§’ã€30 ç§’ä»¥åŠæœ€çµ‚çš„ 63 ç§’çš„è¦–é »é€²è¡Œå¾®èª¿ã€‚

ç‚ºäº†é¿å…æ¨¡åž‹åœ¨é è¨“ç·´éŽç¨‹ä¸éºå¿˜éŽå¤šçš„ä¸–ç•ŒçŸ¥è˜ï¼Œç ”ç©¶äººå“¡åƒ…å°æ¸¬è©¦æ™‚è¨“ç·´å±¤ã€é–€æŽ§å±¤å’Œè‡ªæ³¨æ„åŠ›å±¤é€²è¡Œå¾®èª¿ï¼Œä¸”åœ¨é€™å››å€‹éšŽæ®µä¸ä½¿ç”¨è¼ƒä½Žçš„å¸ç¿’çŽ‡ã€‚

åœ¨åŽŸå§‹è¦–é »çš„é¸å–ä¸Šï¼Œä»–å€‘é¸æ“‡äº†å¾ž 1940 å¹´è‡³ 1948 å¹´é–“ç™¼è¡Œçš„ 81 é›†ã€Šè²“å’Œè€é¼ ã€‹ï¼Œæ¯é›†æ™‚é•·ç´„ 5 åˆ†é˜ï¼Œæ‰€æœ‰é›†æ•¸åŠ èµ·ä¾†æ™‚é•·ç´„ 7 å°æ™‚ã€‚

ç„¶åŽï¼Œç ”ç©¶äººå“¡åœ¨åŽŸå§‹è¦–é »ä¸Šé‹è¡Œä¸€å€‹è¦–é »è¶…åˆ†è¾¨çŽ‡æ¨¡åž‹ï¼Œå¾žè€Œç‚ºæ•¸æ“šé›†ç”Ÿæˆè¦–è¦ºæ•ˆæžœæ›´å¼·çš„è¦–é »ï¼Œé€™äº›è¦–é »çš„åˆ†è¾¨çŽ‡å‡ç‚º 720Ã—480ã€‚

æŽ¥è‘—ï¼Œä»–å€‘è®“äººå·¥æ¨™æ³¨å“¡å°‡æ¯å€‹ç‰‡æ®µåˆ†è§£ç‚ºå ´æ™¯ï¼Œç„¶åŽå¾žæ¯å€‹å ´æ™¯ä¸æå– 3 ç§’é•·çš„ç‰‡æ®µã€‚

æŽ¥ä¸‹ä¾†ï¼Œç ”ç©¶äººå“¡è®“äººå·¥æ¨™æ³¨å“¡ç‚ºæ¯å€‹ 3 ç§’çš„ç‰‡æ®µæ’°å¯«ä¸€æ®µè©³ç´°çš„æè¿°ï¼Œç„¶åŽç›´æŽ¥é‡å°é€™äº›ç‰‡æ®µé€²è¡Œå¾®èª¿ã€‚

ç‚ºäº†å‰µå»ºæ•¸æ“šï¼Œç ”ç©¶äººå“¡å°‡é€£çºŒçš„ 3 ç§’ç‰‡æ®µæ‹¼æŽ¥æˆ 9 ç§’ã€18 ç§’ã€30 ç§’å’Œ 63 ç§’çš„è¦–é »ï¼Œå¹¶é™„ä¸Šç›¸æ‡‰çš„æ–‡æœ¬æ³¨é‡‹ï¼Œæ‰€æœ‰è¨“ç·´è¦–é »çš„æ¨™æ³¨å‡é‡‡ç”¨ä¸Šæ–‡çš„æ ¼å¼ 3ã€‚

ï¼ˆä¾†æºï¼šè³‡æ–™åœ–ï¼‰

å°äºŽ GPU è€Œè¨€ï¼Œè¦æƒ³é«˜æ•ˆåœ°å¯¦ç¾æ¸¬è©¦è¨“ç·´å±¤-å¤šå±¤æ„ŸçŸ¥å™¨ï¼ˆTTT-MLPï¼ŒTest-Time Training-Multi-Layer Perceptronï¼‰ï¼Œå°±éœ€è¦é€²è¡Œç‰¹æ®Šè¨è¨ˆï¼Œä»¥ä¾¿åˆ©ç”¨å…¶å…§å˜å±¤æ¬¡çµæ§‹ã€‚

è‹±å‰é” GPU æž¶æ§‹ä¸çš„æ ¸å¿ƒè¨ˆç®—å–®å…ƒæ˜¯æµå¼å¤šè™•ç†å™¨ï¼ˆSMsï¼ŒStreaming Multiprocessorsï¼‰ï¼Œå…¶åŠŸèƒ½é¡žæ¯”äºŽ CPU ä¸çš„å–®å€‹æ ¸å¿ƒã€‚

GPU ä¸Šçš„æ‰€æœ‰æµå¼å¤šè™•ç†å™¨å…±äº«ä¸€å€‹ç›¸å°è¼ƒæ…¢ä½†å®¹é‡è¼ƒå¤§çš„å…¨å±€å…§å˜ï¼ˆå³ HBMï¼ŒHigh Bandwidth Memoryï¼‰ï¼Œç„¶åŽæ¯å€‹æµå¼å¤šè™•ç†å™¨éƒ½æœ‰ä¸€å€‹å¿«é€Ÿä½†å®¹é‡è¼ƒå°çš„ç‰‡ä¸Šå…§å˜ï¼ˆå³ SMEMï¼ŒShared Memoryï¼‰ã€‚

GPU ä¸Š SMEM èˆ‡ HBM ä¹‹é–“çš„é »ç¹æ•¸æ“šå‚³è¼¸æœƒé¡¯è‘—é™ä½Žæ•´é«”æ•ˆçŽ‡ã€‚è€Œ Mamba å’Œè‡ªæ³¨æ„åŠ›å±¤é€šéŽåˆ©ç”¨å…§æ ¸èžåˆæŠ€è¡“ï¼Œå¯ä»¥æ¸›å°‘é€™é¡žæ•¸æ“šçš„å‚³è¼¸ã€‚

å…¶æ ¸å¿ƒæ€æƒ³æ˜¯å°‡è¼¸å…¥å’Œåˆå§‹ç‹€æ…‹åŠ è¼‰åˆ°æ¯å€‹ SMEM ä¸ï¼Œå®Œå…¨åœ¨ç‰‡ä¸Šé€²è¡Œè¨ˆç®—ï¼Œå¹¶ä¸”åªå°‡æœ€çµ‚è¼¸å‡ºå¯«å›ž HBMã€‚

ç„¶è€Œï¼ŒTTT-MLP çš„éš±è—ç‹€æ…‹å³é›™å±¤ MLP å‡½æ•¸ f çš„æ¬Šé‡çŸ©é™£ W(1) å’Œ W(2)ï¼Œç”±äºŽé«”ç©éŽå¤§ç„¡æ³•å˜å„²äºŽå–®å€‹æµå¼å¤šè™•ç†å™¨çš„å…±äº«å…§å˜ä¸ã€‚

ç‚ºäº†æ¸›å°‘æ¯å€‹æµå¼å¤šè™•ç†å™¨æ‰€éœ€çš„å…§å˜ï¼Œç ”ç©¶äººå“¡ä½¿ç”¨å¼µé‡å¹¶è¡Œæ©Ÿåˆ¶ï¼Œå°‡ W(1) å’Œ W(2) åœ¨æµå¼å¤šè™•ç†å™¨ä¹‹é–“é€²è¡Œåˆ†ç‰‡ã€‚

ï¼ˆä¾†æºï¼šè³‡æ–™åœ–ï¼‰

ç”±äºŽå¤§åž‹å¤šå±¤æ„ŸçŸ¥å™¨å±¤å¯ä»¥è¢«åˆ†ç‰‡å¹¶è·¨å¤šå€‹ GPU çš„é«˜å¸¶å¯¬å˜å„²å™¨ä¸Šé€²è¡Œè¨“ç·´ï¼Œå› æ¤ç ”ç©¶äººå“¡å°‡åŒæ¨£çš„æ€è·¯ç”¨äºŽå¤šå€‹æµå¼å¤šè™•ç†å™¨çš„å…±äº«å…§å˜ä¸ï¼Œå°‡æ¯å€‹æµå¼å¤šè™•ç†å™¨è¦–ç‚ºä¸€å€‹ GPU çš„é¡žæ¯”ã€‚

ç ”ç©¶äººå“¡åˆ©ç”¨è‹±å‰é” Hopper GPU æž¶æ§‹çš„åˆ†å¸ƒå¼å…±äº«å…§å˜ç‰¹æ€§ï¼Œå¯¦ç¾äº†æµå¼å¤šè™•ç†å™¨é–“çš„å…¨å±€æ¸ç´„æ“ä½œï¼Œé€²è€Œé¡¯è‘—æå‡äº†æ•ˆçŽ‡ã€‚

ä½œç‚ºä¸€ç¨®é€šç”¨åŽŸå‰‡ï¼Œå¦‚æžœä¸€å€‹æ¨¡åž‹æž¶æ§‹ f å¯ä»¥é€šéŽæ¨™æº–å¼µé‡å¹¶è¡Œæ©Ÿåˆ¶åœ¨ GPU ä¹‹é–“é€²è¡Œåˆ†ç‰‡ï¼Œé‚£ä¹ˆç•¶ f ç”¨ä½œéš±è—ç‹€æ…‹æ™‚ï¼ŒåŒæ¨£çš„åˆ†ç‰‡ç–ç•¥ä¹Ÿå¯ä»¥ç”¨äºŽæµå¼å¤šè™•ç†å™¨ä¹‹é–“ã€‚

ï¼ˆä¾†æºï¼šè³‡æ–™åœ–ï¼‰

ä¸éŽï¼Œæœ¬æ¬¡ç ”ç©¶çš„ TTT-MLP å…§æ ¸å—é™äºŽå¯„å˜å™¨æº¢å‡ºå’Œç•°æ¥æŒ‡ä»¤çš„æ¬¡å„ªæŽ’åºã€‚æœªä¾†ï¼Œé€šéŽé™ä½Žå¯„å˜å™¨å£“åŠ›ä»¥åŠé–‹ç™¼ç·¨è¯å™¨æ„ŸçŸ¥æ›´å¼·çš„ç•°æ¥æ“ä½œæ–¹æ¡ˆï¼Œå…¶åŸ·è¡Œæ•ˆçŽ‡æˆ–èƒ½å¾—åˆ°é€²ä¸€æ¥æå‡ã€‚ç¸½çš„ä¾†èªªï¼Œæœ¬æ¬¡æ–¹æ³•æœ‰æœ›ç”¨äºŽç”Ÿæˆæ›´é•·ã€æ›´å¾©é›œè¦–é »ï¼Œä¹Ÿè¨±ä¸‹ä¸€ä»£å…’ç«¥å°‡èƒ½çœ‹ä¸Šç”± AI ç”Ÿæˆçš„å‹•ç•«é€£çºŒåŠ‡ï¼Ÿç›®å‰çœ‹ä¾†ï¼Œé€™ä¸€è¨æƒ³å¹¶éžæ²’æœ‰å¯¦ç¾çš„å¯èƒ½ã€‚

åƒè€ƒè³‡æ–™ï¼š

https://test-time-training.github.io/video-dit/

https://x.com/arankomatsuzaki/status/1909336661743550555

é‹ç‡Ÿ/æŽ’ç‰ˆï¼šä½•æ™¨é¾

ç‰¹åˆ¥è²æ˜Žï¼šä»¥ä¸Šå…§å®¹(å¦‚æœ‰åœ–ç‰‡æˆ–è¦–é »äº¦åŒ…æ‹¬åœ¨å…§)ç‚ºè‡ªåª’é«”å¹³è‡ºâ€œç¶²æ˜“è™Ÿâ€ç”¨æˆ¶ä¸Šå‚³å¹¶ç™¼å¸ƒï¼Œæœ¬å¹³è‡ºåƒ…æä¾›ä¿¡æ¯å˜å„²æœå‹™ã€‚

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.