|
|
|
¡ã MIT CSAIL ¿¬±¸ÆÀÀÌ '¸®¾óÅõ'¸¦ È°¿ëÇØ ·Îº¿À» ÈƷýÃÅ°°í ÀÖ´Ù(»çÁø=MIT CSAIL) |
MIT ÄÄÇ»ÅÍ°úÇзÀΰøÁö´É¿¬±¸¼Ò(CSAIL) ¿¬±¸ÆÀÀÌ ½Ã¹Ä·¹ÀÌ¼Ç È¯°æ¿¡¼ ·Îº¿¿¡°Ô ¿©·¯ °¡Áö Áý¾È ÀÏÀ» °¡¸£Ä¥ ¼ö ÀÖ´Â »õ·Î¿î ÇнÀ ¹æ¹ýÀ» Á¦¾ÈÇß´Ù. ±âÁ¸ÀÇ ¸ð¹æÇнÀ°ú °ÈÇнÀÀ» °³¼±ÇÑ »õ·Î¿î Á¢±Ù ¹æ¹ýÀ̶õ ¼³¸íÀÌ´Ù.
¿¬±¸ÆÀÀº À̹ø ¿¬±¸ ¼º°ú¸¦ ÃâÆÇÀü ³í¹® °ø°³ »çÀÌÆ®ÀÎ ‘¾ÆÄ«À̺ê(arXiv)’¿¡ ¹ßÇ¥Çß´Ù. (³í¹® Á¦¸ñ:Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation)
¿¬±¸ÆÀ¿¡ µû¸£¸é, ¸¹Àº °³¹ßÀÚµéÀº ·Îº¿µéÀÌ ¾î¶² Á¶°Ç ¶Ç´Â ¾î¶² Àå¼Ò¿¡¼µµ ÀÛ¾÷À» ¼öÇàÇÒ ¼ö ÀÖµµ·Ï Çϵå¿þ¾î¿Í ¼ÒÇÁÆ®¿þ¾î¸¦ ¸¸µå´Â °Í¿¡ ¸ñÇ¥¸¦ µÎ°í ÀÖ´Ù. ÇÏÁö¸¸ ƯÁ¤ÇÑ Áý¿¡¼ ÀÛµ¿ÇÏ´Â ·Îº¿ÀÌ ÀÌ¿ôÀÇ ¸ðµç Áý¿¡¼ ÀÛµ¿ÇÏ´Â ¹æ¹ýÀ» ¾Ë ÇÊ¿ä´Â ¾ø´Ù. °¡Á¤¸¶´Ù Áý¾ÈÀÇ È¯°æÀÌ ´Ù¸£°í, ¼³·É ·Îº¿ÀÌ Áý¾ÈÀ» ¸ðµÎ ¸ÅÇÎÇÑ´Ù°í ÇÏ´õ¶óµµ Áý¾ÈÀÇ È¯°æÀº À¯µ¿ÀûÀ¸·Î º¯ÈÇϱ⠸¶·ÃÀÌ´Ù. µû¶ó¼ ´Ù¾çÇÑ ½ÇÁ¦ ȯ°æ¿¡¼ ·Îº¿µéÀÌ ÀÛ¾÷À» ¼öÇàÇϱâ À§Çؼ± ·Îº¿µé¿¡°Ô ÀϹݷÐÀû Á¤Ã¥µéÀ» ÇнÀ½Ãų ÇÊ¿ä°¡ ÀÖ´Ù.
¿¬±¸ÆÀ¿¡ µû¸£¸é, ‘¸ð¹æÇнÀ’Àº, ¹°Ã¼ÀÇ ÀÚ¼¼(object poses), ¹°¸®Àû ¹æÇØ ¹× ½Ã°¢Àû ¹æÇØ ¿ä¼ÒÀÇ º¯È¿¡µµ °°ÇÇÑ 'Á¤Ã¥'À» ÇнÀÇϱâ À§ÇØ »ó´çÇÑ ¼öÁØÀÇ Àΰ£ °¨µ¶ÀÌ ÇÊ¿äÇÏ´Ù. ¹Ý¸é '°ÈÇнÀ'Àº °°ÇÇÑ µ¿ÀÛÀ» ÇнÀÇϱâ À§ÇØ È¯°æÀ» ÀÚÀ²ÀûÀ¸·Î Ž»öÇÒ ¼ö´Â ÀÖÁö¸¸ ºñÇö½ÇÀûÀÎ ¾çÀÇ ¾ÈÀüÇÏÁö ¾ÊÀº ½ÇÁ¦ µ¥ÀÌÅÍ ¼öÁýÀÌ ÇÊ¿äÇÒ ¼ö ÀÖ´Ù.
¿¬±¸ÆÀÀº ¾ÈÀüÇÏÁö ¾ÊÀº ½ÇÁ¦ µ¥ÀÌÅÍ ¼öÁý ¶Ç´Â ±¤¹üÀ§ÇÑ Àΰ£ °¨µ¶ÀÇ ºÎ´ã ¾øÀÌ ¼º´ÉÀÌ ¶Ù¾î³ª°í °°ÇÇÑ Á¤Ã¥À» ÇнÀÇϱâ À§ÇØ ¼Ò·®ÀÇ ½ÇÁ¦ ¼¼°è(real world) µ¥ÀÌÅ͸¦ ÅëÇØ Áï½Ã ±¸ÃàµÈ ‘µðÁöÅÐ Æ®À©’ ȯ°æ¿¡¼, °ÈÇнÀÀ» ÅëÇØ ½ÇÁ¦ ¼¼°è ¸ð¹æ ÇнÀ Á¤Ã¥(real-world imitation learning policies)À» °°ÇÇÏ°Ô ¸¸µé¾îÁÖ´Â ½Ã½ºÅÛÀÎ ‘¸®¾óÅõ(RialTo)‘¸¦ Á¦¾ÈÇß´Ù. ¸®¾óÅõ´Â ½ÇÁ¦ ¼¼°è ȯ°æÀÇ µðÁöÅÐ Æ®À©À» ºü¸£°Ô ½ºÄµÇÏ°í, ±¸¼ºÇϱâ À§ÇÑ ½¬¿î ÀÎÅÍÆäÀ̽º¸¦ Á¦½ÃÇÑ´Ù.
MIT ¿¬±¸ÆÀÀº ‘¸®¾ó-Åõ-½É-Åõ-¸®¾ó ¸ðµ¨(Real-to-Sim-to-Real model)’ÀÌ °¡´ÉÇϵµ·Ï ƯÁ¤ÇÑ È¯°æ¿¡¼ ‘·Îº¿Á¤Ã¥(robot policies)’À» ½±°Ô ÈƷýÃÅ°´Â ¹æ¹ýÀÎ ‘¸®¾óÅõ(RialTo)’°¡ ¸ð¹æÇнÀ¿¡ ºñÇØ 67% ÀÌ»ó ‘Á¤Ã¥’À» Çâ»ó½ÃÄ×´Ù°í ¹àÇû´Ù.
¿¬±¸ÆÀÀº Å佺ÅÍ ¿±â, ¼±¹Ý¿¡ Ã¥ ³õ±â, ¼±¹Ý À§¿¡ Á¢½Ã ¿Ã·Á³õ±â, ¼±¹Ý À§¿¡ ¸Ó±×ÄÅ ¿Ã·Á³õ±â, ¼¶ø ¿±â, ijºñ´Ö ¿±â µî ÀÏ»óÀûÀÎ ÀÛ¾÷À» ·Îº¿ÀÌ ¼öÇàÇÒ ¼ö ÀÖµµ·Ï ½Ã½ºÅÛÀ» °¡¸£ÃÆ´Ù.
³í¹® ¼ö¼®ÀúÀÚÀÎ ¸¶¸£¼¿ Å丣³× ºô¶ó¼¼ºôÀº "¿ì¸®´Â ·Îº¿µéÀÌ È¥¶õ, ¹æÇØ, º¯ÈÇÏ´Â Á¶¸í Á¶°Ç, ¹°Ã¼ ÀÚ¼¼ÀÇ º¯È µî ȯ°æ¿¡¼µµ ÀÛ¾÷À» Àß ¼öÇàÇÏ´Â °ÍÀ» ¸ñÇ¥·Î Çß´Ù. ¿ì¸®´Â ÄÄÇ»ÅÍ ºñÀüÀÇ ÃֽŠ±â¼ú ¹ßÀüÀ» È°¿ëÇØ µðÁöÅÐ Æ®À©À» Áï¼®¿¡¼ ¸¸µé ¼ö ÀÖ´Â ¹æ¹ýÀ» Á¦¾ÈÇß´Ù. ÀÌ ¹æ¹ýÀº ÈÞ´ëÆùÀ¸·Î ´©±¸³ª ½ÇÁ¦ ¼¼°èÀÇ µðÁöÅÐ º¹Á¦Ç°À» ĸóÇÒ ¼ö ÀÖ°í GPU º´·ÄÈ ´öºÐ¿¡ ·Îº¿ÀÌ ½ÇÁ¦ ¼¼°èº¸´Ù ÈξÀ »¡¸® ½Ã¹Ä·¹ÀÌ¼Ç È¯°æ¿¡¼ ÈÆ·ÃÀ» ÇÒ ¼ö ÀÖµµ·Ï ÇØÁØ´Ù”°í °Á¶Çß´Ù.
¸ÕÀú »ç¿ëÀÚ´Â NeRFS½ºÆ©µð¿À, ARÄÚµå, Æú¸®Ä·(Polycam)°ú °°Àº µµ±¸¸¦ »ç¿ëÇØ ÈÞ´ëÆùÀ¸·Î ȯ°æÀ» ½ºÄµÇÑ´Ù. ÀÌ¾î »ç¿ëÀÚ´Â ¸®¾óÅõ(RialTo)ÀÇ ÀÎÅÍÆäÀ̽º¿¡ ¾÷·ÎµåÇÏ¿© ¼¼ºÎ»çÇ×À» Á¶Á¤ÇÏ°í ·Îº¿¿¡ ÇÊ¿äÇÑ °üÀýÀ» Ãß°¡ÇÏ´Â µî ÀÛ¾÷À» ¼öÇàÇÒ ¼ö ÀÖ´Ù. À̾î ÀçÁ¤ÀÇµÈ Àå¸éÀ» ½Ã¹Ä·¹ÀÌÅÍ·Î °¡Á®¿Â´Ù. ÀÌ´Â ½ÇÁ¦ Çൿ°ú °üÂûÀ» ±â¹ÝÀ¸·Î Á¤Ã¥À» ¸¸µå´Â µ¥ ÀÖ´Ù. ÀÌ·¯ÇÑ ½ÇÁ¦ ½Ã¿¬Àº ½Ã¹Ä·¹À̼ǿ¡¼ º¹Á¦µÇ¾î °ÈÇнÀ(RL)¿¡ À¯¿ëÇÑ µ¥ÀÌÅ͸¦ Á¦°øÇÑ´Ù.
¸¶¸£¼¿ Å丣³× ºô¶ó¼¼ºôÀº "ÀÌ ¹æ¹ýÀº ½Ã¹Ä·¹À̼ǰú ½ÇÁ¦ ¼¼°è ¸ðµÎ¿¡¼ Àß ÀÛµ¿ÇÏ´Â °°ÇÇÑ Á¤Ã¥À» ¸¸µå´Â µ¥ µµ¿òÀ» ÁØ´Ù. °ÈÇнÀÀ» »ç¿ëÇÏ´Â Çâ»óµÈ ¾Ë°í¸®ÁòÀ» ½Ã¹Ä·¹ÀÌÅÍ ¹Û¿¡¼ Àû¿ëÇÒ ¶§ Á¤Ã¥ÀÇ È¿°ú¼ºÀ» º¸ÁõÇÑ´Ù“°í ¸»Çß´Ù.
MIT CSAIL ¿¬±¸ÆÀÀº ”¸®¾óÅõ(RialTo)°¡ ÅëÁ¦µÈ ½ÇÇè½Ç ȯ°æÀ̳ª ¿¹ÃøÇÒ ¼ö ¾ø´Â ½ÇÁ¦ ȯ°æ¿¡¼ ´Ù¾çÇÑ ÀÛ¾÷À» À§ÇÑ °·ÂÇÑ Á¤Ã¥À» ¸¸µé ¼ö ÀÖÀ½À» ¹ß°ßÇß´Ù. ¸®¾óÅõ´Â »õ·Î¿î '¸®¾ó-Åõ-½É-Åõ-¸®¾ó ÆÄÀÌÇÁ¶óÀÎ(real-to-sim-to-real pipeline)'À¸·Î ½ÇÁ¦ ¼¼°è(¸®¾ó-¿ùµå) RL(°ÈÇнÀ)ÀÇ ¾ÈÀü¼º Á¦¾à°ú µ¥ÀÌÅÍ ±â¹Ý ÇнÀ ¹æ¹ýÀÇ È¿À²ÀûÀÎ µ¥ÀÌÅÍ Á¦¾àÀ» Á÷Á¢ÀûÀ¸·Î ÇØ°áÇÒ¼ö ÀÖ´Ù"°í ¸»Çß´Ù. ¶ÇÇÑ "¸®¾óÅõ´Â ·Îº¿ ÇнÀÀ» Å©°Ô È®ÀåÇÒ ¼ö ÀÖ´Â ÀáÀç·ÂÀ» °¡Áö°í ÀÖÀ¸¸ç, ·Îº¿ÀÌ º¹ÀâÇÑ ½ÇÁ¦ ½Ã³ª¸®¿À¿¡ ÈξÀ ´õ È¿°úÀûÀ¸·Î ÀûÀÀÇÒ ¼ö ÀÖµµ·Ï ÇØÁشٓ°í ¾ð±ÞÇß´Ù. ½ÇÁ¦ µ¥ÀÌÅÍ¿Í °áÇÕÇßÀ» ¶§, ÀÌ ½Ã½ºÅÛÀº ½Ã°¢Àû ÁÖÀǸ¦ »ê¸¸ÇÏ°Ô Çϰųª ¹°¸®Àû Àå¾Ö°¡ ¸¹Àº »óȲ¿¡¼ ÀüÅëÀûÀÎ ¸ð¹æÇнÀ ¹æ¹ýÀ» ´É°¡Çß´Ù°í ¿¬±¸ÆÀÀº ¼³¸íÇß´Ù.
|