±¸±Û µö¸¶Àε尡 ·Îº¿ Á¦¾î¸¦ À§ÇÑ »õ·Î¿î ÀΰøÁö´É(AI) ¸ðµ¨ÀÎ ‘·Îº¸Æ½½º Æ®·£½ºÆ÷¸Ó 2(RT-2)’¸¦ Áö³ 28ÀÏ °ø°³Çß´Ù. ½Ã°¢ Á¤º¸¿Í ¾ð¾î¸¦ ·Îº¿ÀÇ ÇൿÀ¸·Î º¯È¯ÇÒ ¼ö ÀÖ´Ù.
RT-2´Â ÀÎÅͳݿ¡¼ ¼öÁýµÈ µ¥ÀÌÅÍ¿Í ·Îº¿ÀÌ ¼öÁýÇÑ µ¥ÀÌÅ͸¦ ¹ÙÅÁÀ¸·Î ÇнÀÇÏ°í, ÀÌ·¯ÇÑ Áö½ÄÀ» ·Îº¿ Á¦¾î¸¦ À§ÇÑ ÀϹÝÈµÈ ¸í·É(Áöħ)À¸·Î º¯È¯ÇÒ ¼ö ÀÖ´Â ‘½Ã°¢-¾ð¾î-Çൿ(VLA·vision-language-action)’ÀÌ´Ù.
´ë¿ë·® VLM(vision-language models:ºñÀü¾ð¾î¸ðµ¨)Àº ÀÎÅͳÝ(À¥) µ¥ÀÌÅÍ ¼¼Æ®¸¦ ¹ÙÅÁÀ¸·Î ÈÆ·ÃÀ» ¼öÇàÇϴµ¥, ½Ã°¢Àû ¶Ç´Â ¾ð¾î ÆÐÅÏÀ» ÀνÄÇÏ´Â µ¥ ¶Ù¾î³ª¸ç, ¼·Î ´Ù¸¥ ¾ð¾î °£¿¡µµ ¿î¿µ °¡´ÉÇÏ´Ù. ·Îº¿ÀÌ ºñ½ÁÇÑ ¼öÁØÀÇ ´É·ÂÀ» ´Þ¼ºÇÏ·Á¸é ¸ðµç °´Ã¼, ȯ°æ, ÀÛ¾÷ ¹× »óȲ¿¡¼ ·Îº¿ µ¥ÀÌÅ͸¦ Á÷Á¢ ¼öÁýÇØ¾ß ÇÑ´Ù.
À̹ø ¿¬±¸´Â ÀÌ¹Ì ¹ßÇ¥µÈ RT-1(Robotic Transformer 1)ÀÇ Åä´ë ¶Ç´Â ¿¬Àå¼±»ó¿¡¼ ÀÌ·ïÁ³´Ù. RT-1Àº 'ÀÛ¾÷°ú ¹°Ã¼ÀÇ Á¶ÇÕ'À» ÇнÀÇÒ ¼ö ÀÖ´Â ´ÙÁß ÀÛ¾÷ ½Ã¿¬ °úÁ¤À» ÅëÇØ ÈƷõƴÙ. ¿¬±¸ÆÀÀº »ç¹«½Ç ÁÖ¹æ ȯ°æ¿¡¼ 17°³¿ù µ¿¾È 13´ëÀÇ ·Îº¿¸¦ ÀÌ¿ëÇØ ¼öÁýÇÑ RT-1 ·Îº¿ ½Ã¿¬ µ¥ÀÌÅ͸¦ »ç¿ëÇß´Ù.
À̹ø¿¡ °ø°³ÇÑ RT-2´Â ³ëÃâµÈ ·Îº¿ µ¥ÀÌÅ͸¦ ³Ñ¾î, º¸´Ù ÁøÀüµÈ ÀϹÝÈ ±â´É°ú Àǹ̷ÐÀû¤ý½Ã°¢Àû ÀÌÇØ ¼öÁØÀ» º¸¿©ÁØ´Ù. »õ·Î¿î ¸í·ÉÀ» Çؼ®ÇÏ°í, ¹°Ã¼ ¹üÁÖ¿¡ ´ëÇÑ Ãß·Ð ¶Ç´Â ³ôÀº ¼öÁØÀÇ ±â¼ú(description)°ú °°Àº ±âº»ÀûÀÎ Ãß·ÐÀ» ÅëÇØ »ç¿ëÀÚ ¸í·É¿¡ ÀÀ´äÇÑ´Ù. RT-2´Â ¶ÇÇÑ Çϳª ÀÌ»óÀÇ À̹ÌÁö¸¦ ÀÔ·ÂÀ¸·Î ¹Þ¾ÆµéÀÌ´Â VLMÀ» ±â¹ÝÀ¸·Î ±¸ÃàµÈ´Ù.
¿¬±¸ÆÀÀº »ç¹«½Ç ÁÖ¹æ ȯ°æ¿¡¼ RT-2¸¦ Å×½ºÆ®Çß´Ù. ½ÇÇè °úÁ¤¿¡¼ ·Îº¿Àº Áï¼®¿¡¼ ¸¸µç ¸ÁÄ¡(µ¹)¸¦ ½Äº°ÇÏ°í, ÁöÄ£ »ç¶÷¿¡°Ô Á¦°øÇÒ À½·á¼ö¸¦ ¼±ÅÃÇϵµ·Ï Áö½Ã¹Þ¾Ò´Ù. ¶ÇÇÑ ·Îº¿¿¡°Ô Äݶó ĵÀ» Å×ÀÏ·¯ ½ºÀ§ÇÁÆ®ÀÇ »çÁø ÂÊÀ¸·Î ¿Å±âµµ·Ï Áö½Ã¹Þ¾Ò´Ù.
±¸±ÛÀº ÀÎÅͳݰú ·Îº¿ µ¥ÀÌÅÍÀÇ Á¶ÇÕ, ±¸±ÛÀÇ ´ëÇü ¾ð¾î ¸ðµ¨ ¹Ùµå(Bard)¸¦ È°¿ëÇØ RT-2¸¦ ÈƷýÃÄ×´Ù. ½ÇÇè °á°ú ·Îº¿ Á¤º¸¿Í ¾ð¾î µ¥ÀÌÅ͸¦ À¶ÇÕÇÏ´Â °ÍÀº ¼º°øÀûÀÎ Á¢±Ù ¹æ½ÄÀ¸·Î Áõ¸íµÇ¾ú´Ù. ¶ÇÇÑ RT-2´Â ¿µ¾î ÀÌ¿ÜÀÇ ¾ð¾î·Î Á¦°øµÇ´Â ¸í·ÉÀ» ÀÌÇØÇÏ´Â µ¥µµ ´É¼÷ÇÔÀ» º¸¿©ÁÖ¾ú´Ù. ÀÌ´Â AI ±¸µ¿ ·Îº¿À» À§ÇÑ ±³Â÷ ¾ð¾î ±â´ÉÀÇ ÇöÀúÇÑ Áøº¸¸¦ º¸¿©ÁØ´Ù°í ±¸±Û µö¸¶Àεå ÃøÀº ¹àÇû´Ù.
RT-2¿Í °°Àº VLA ¸ðµ¨ÀÌ µîÀåÇϱâ Àü¿¡ ·Îº¿À» ÇнÀ½ÃÅ°´Â °ÍÀº ½Ã°£ÀÌ ¸¹ÀÌ °É¸®°í °íµÈ ÀÛ¾÷À̾ú´Ù. ƯÁ¤ ÀÛ¾÷º°·Î °³º° ÇÁ·Î±×·¡¹ÖÀ» ¿ä±¸Çß´Ù. ±×·¯³ª °í±Þ ÀΰøÁö´É ¸ðµ¨ÀÇ ÈûÀº ·Îº¿ÀÌ ¹æ´ëÇÑ Á¤º¸ÀÇ Ç®(pool)À» È°¿ëÇÔÀ¸·Î½á Á¤º¸¿¡ ÀÔ°¢ÇÑ Ã߷аú °áÁ¤À» Áï½Ã ³»¸± ¼ö ÀÖµµ·Ï ÇØÁØ´Ù.
¿¬±¸ÆÀÀº RT-2°¡ VLM »çÀü ÈÆ·ÃÀ» ·Îº¿ µ¥ÀÌÅÍ¿Í °áÇÕÇØ ·Îº¿À» Á÷Á¢ Á¦¾îÇÒ ¼ö ÀÖ´Â °·ÂÇÑ VLA(Vision-Language-Action) ¸ðµ¨·Î, ºñÀü ¾ð¾î ¸ðµ¨(VLM)À» º¯È¯ÇÒ ¼ö ÀÖÀ½À» º¸¿©ÁØ´Ù°í ¹àÇû´Ù. |