|
|
|
¡ã MIT CSAIL ¿¬±¸ÆÀÀÌ ·Îº¿°ú Àΰ£ÀÌ È¿À²ÀûÀ¸·Î »óÈ£ÀÛ¿ëÀ» µ½´Â ÇÁ·¹ÀÓ ¿öÅ©ÀÎ ‘įÇ÷£(CommPlan)’À» °³¹ßÇß´Ù.(»çÁø=º¥ÃĺñÆ®) |
MIT ÄÄÇ»ÅÍ °úÇÐ ¹× ÀΰøÁö´É¿¬±¸¼Ò(Computer Science and Artificial Intelligence Lab・CSAIL)°¡ ·Îº¿°ú Àΰ£ÀÌ È¿À²ÀûÀ¸·Î »óÈ£ÀÛ¿ëÀ» µ½´Â ÇÁ·¹ÀÓ ¿öÅ©ÀÎ ‘įÇ÷£(CommPlan)’À» °³¹ßÇß´Ù°í ‘º¥Ã³ºñÆ®’°¡ Áö³ 31ÀÏ ¹àÇû´Ù.
įÇ÷£Àº Àΰ£°ú ÇÔ²² ÀÏÇÏ´Â ·Îº¿¿¡ ÀûÀýÇÑ ¿¹ÀÇ¿¡ °üÇÑ ¿øÄ¢µéÀ» Á¦°øÇϸç ÇØ´ç ·Îº¿ÀÌ ÀÇ»ç °áÁ¤À» ÅëÇØ È¿À²ÀûÀ¸·Î °ú¾÷À» ³¡³»µµ·Ï ÇØÁØ´Ù. ÀÌ ÇÁ·¹ÀÓ ¿öÅ©¸¦ Àû¿ëÇÏ¸é ·Îº¿Àº ƯÁ¤ »óȲ¿¡ ÀûÇÕÇÑ ¹æħ(context specific-policies)À̳ª °úÁ¦¸¦ µû¸£±âº¸´Ù´Â ‘ºñ¿ë ÆíÀÍ ºÐ¼®(cost-benefit analyses)’À» ÅëÇØ ÀÇ»ç°áÁ¤À» ³»¸®°Ô µÈ´Ù. ÀÌ´Â »ç¶÷ÀÌ Á÷Á¢ ¸¸µç ±ÔÄ¢º¸´Ù ¶Ù¾î³ Á¢±Ù¹ýÀ̶ó´Â°Ô ¿¬±¸ÆÀÀÇ ¼³¸íÀÌ´Ù.
įÇ÷£Àº °ú°Å ÇൿµéÀ» °í·ÁÇØ »ç¶÷ÀÌ ¹Ù»ÛÁö ¶Ç´Â »ç¶÷ÀÌ ¹ÝÀÀÇÒ °¡´É¼ºÀÌ ÀÖ´ÂÁö µîÀÇ ¿©·¯ ¿äÀεéÀ» Á¾ÇÕÇØ °è»êÇØ ³½´Ù. ÀÌÈÄ Àü¿ë ¸ðµâÀÎ ‘¿¡ÀÌÀüÆ® ¸¶ÄÚÇÁ ¸ðÇü(the Agent Markov Model)’À» È°¿ëÇØ »ç¶÷ÀÇ ¼øÂ÷ÀûÀÎ ÀÇ»ç °áÁ¤ Çൿ¿¡ ´ëÀÀÇÑ´Ù. ÀÌ¿Í ÇÔ²² »ç¾ç °úÁ¤ ¸ðµ¨(a model specification process)°ú ½ÇÇà½Ã°£ 'ºÎºÐ°üÂû ¸¶ÄÚÇÁ ÀÇ»ç°áÁ¤°úÁ¤(partially observable Markov decision process ·POMDP)' Ç÷¡³Ê¶ó´Â ±â¹ýµµ Àû¿ëµÆ´Ù. ÀÌ ±â¹ýÀ» È°¿ëÇÏ¸é ·Îº¿ÀÌ °ú¾÷°ú ¼ÒÅëÀ» µ¿½Ã¿¡ ¼öÇàÇÏ´Â°Ô °¡´ÉÇÏ´Ù´Â ¼³¸íÀÌ´Ù.
¿¬±¸ÆÀÀº ¿ì¼± įÇ÷£À» »ç¿ëÇØ µ¥ÀÌÅÍ, µµ¸ÞÀÎ Àü¹® Áö½Ä ¹× ÇнÀ ¾Ë°í¸®ÁòÀ» °®Ãá 5°¡Áö ¸ðµâ(ÀÛ¾÷ ¸ðµ¨, Åë½Å ±â´É, Åë½Å ºñ¿ë ¸ðµ¨, ÈÞ¸Õ ÀÀ´ä ¸ðµ¨ ¹× ÈÞ¸Õ ¾×¼Ç ¼±Åà °¡´É ¸ðµ¨)À» ÁöÁ¤ÇÑ´Ù. ¸ðµç ¸ðµâÀº ºÐ¼®ÀûÀ¸·Î °áÇյŠÀÇ»ç°áÁ¤ ¸ðµ¨¿¡ µµ´ÞÇϸç, ·Îº¿Àº ÀÛ¾÷ ½ÇÇà Áß¿¡ Çϵå¿þ¾î ¼¾¼, ÀÇ»ç°áÁ¤ ¸ðµ¨, POMDP ¼Ö¹ö(solver)¸¦ »ç¿ëÇØ Á¤Ã¥À» °è»êÇÑ´Ù. ÀÌ Á¤Ã¥Àº ·Îº¿ÀÇ ¾×Ãß¿¡ÀÌÅÍ ¹× ¼ÒÅë¹æ½ÄÀ» »ç¿ëÇØ ½ÇÇàµÈ´Ù.
À̷νá įÇ÷£Àº ´ÙÀ½°ú °°Àº ¹æ½ÄÀ¸·Î Àΰ£°ú ¼ÒÅëÇÑ´Ù. ¡ãÀÇ»ç °áÁ¤ »óÅ¿¡ ´ëÇØ »ç¶÷µé¿¡°Ô ¾Ë¸®°í ¹¯´Â´Ù. (¿¹: ·£µå¸¶Å©¿¡¼ ÇൿÀ» ÇÏ°Ú½À´Ï´Ù”) ¡ãÀΰ£¿¡°Ô ƯÁ¤ÇÑ Çൿ°ú °èȹÀ» ¼öÇàÇϵµ·Ï ¸í·ÉÇÑ´Ù (¿¹: “¾îµð¿¡ °¡½Ê´Ï±î?”) ¡ãÀΰ£ÀÇ Áú¹®¿¡ ´äÇÑ´Ù. (¿¹: "·£µå¸¶Å©¿¡¼ ´ÙÀ½ »÷µåÀ§Ä¡¸¦ ¸¸µå½Ê½Ã¿À”)
ÇÑÆí, ¿¬±¸ÆÀÀº įÇ÷£À» Å×½ºÆ®Çϱâ À§ÇØ Çùµ¿·Îº¿ÀÎ UR10À» ºñ·ÔÇØ ·Îº¸Æ½(Robotiq)»çÀÇ ±×¸®ÆÛ ¹× Àΰ£ Âü°¡ÀÚ 15¸í°ú ÇÔ²² ´ÙÀ½°ú °°Àº ½ÇÇèÀ» ÁغñÇß´Ù. ·Îº¿Àº ¿ì¼± °èȹ½Ã°£ÀÎ 0.3ÃÊ ³»¿¡ ³ÐÀº »óÅ°ø°£(state space)À» Ãß·ÐÇÑ´Ù. (1)ÀÌÈÄ ÄÅ 4°³ Áß ¾î´À °ÍÀ» ä¿ï °ÍÀÎÁö °áÁ¤ÇÏ°í, (2)¾ÈÀüÀ» À§ÇØ ±â´Ù¸± °ÍÀÎÁö ÀÛ¾÷À» ¿Ï·áÇϱâ À§ÇØ À̵¿ÇÒ °ÍÀÎÁö¸¦ ÆÇ´ÜÇÑ´Ù. ¿©±â¼ (3)À̵¿Çϱâ·Î ¼±ÅÃÇÑ °æ¿ì, ·Îº¿ ÆÈÀº ÄÅ¿¡ µµ´ÞÇÑ´Ù. À̾î (4)Åë½Å ¹æ½Ä »ç¿ëÇÒÁö¿Í (5)¾î¶² Åë½Å ¸Þ½ÃÁö¸¦ Àü´ÞÇÒÁö °áÁ¤ÇÑ´Ù.
½ÇÇè °á°ú ·Îº¿Àº »ç¶÷°ú ÇÔ²² Àç·á Á¶¸³, »÷µåÀ§Ä¡ Æ÷Àå, ÁÖ½º µû¸£±â µîÀÇ ÀÛ¾÷À» ¼º°øÀûÀ¸·Î ¼öÇàÇß´Ù. ÀÌ´Â »ç¶÷ÀÌ °í¾ÈÇÑ º£À̽º¶óÀÎ(baseline) ¹× ¼ÒÅëÀÌ ÇÊ¿ä¾ø´Â ¹æ¹ý¿¡ ºñÇØ ÈξÀ ¾ÈÀüÇÏ°í È¿À²ÀûÀ̾ú´Ù´Â ¼³¸íÀÌ´Ù.
À̹ø ¿¬±¸¿¡ Âü¿©ÇÑ MIT ´ëÇпø»ýÀÎ ‘¼¾¸®(Shen Li)’´Â “Àΰ£ÀÌ °í¾ÈÇÑ ¸¹Àº Á¤Ã¥µéÀº ¸¶Ä¡ ½½·¢(Slack·Ã¤Æà µµ±¸)¿¡¼ °è¼ÓÇؼ ´ç½ÅÀ» ±«·ÓÈ÷´Â µ¿·á°Å³ª ¶Ç´Â ÀÏÀÌ ¾î´ÀÁ¤µµ ÁøÇàµÆ´ÂÁö ¹Ýº¹Çؼ ¹°¾îº¸´Â ²Ä²ÄÇÑ »ó»ç¿Í °°´Ù”¸é¼ “¸¸ÀÏ ´ç½ÅÀÌ ±ä±ÞÇÑ »óȲ¿¡¼ ù ¹ø°·Î ÀÀ´äÇÏ´Â »ç¶÷À̶ó¸é µ¿·á¿ÍÀÇ °úµµÇÑ ÀÇ»ç ¼ÒÅë ¶§¹®¿¡ ÁÖ¿ä¾÷¹«¿¡ ÁýÁßÇÏÁö ¸øÇÒ Áöµµ ¸ð¸¥´Ù"¶ó°í ¼³¸íÇß´Ù.
¿¬±¸ÆÀÀº Áö±Ý²¯ À½¼º ¾ð¾î¿¡¸¸ įÇ÷£À» »ç¿ëÇßÁö¸¸ ½Ã°¢Àû Á¦½ºÃ³, Áõ°Çö½Ç(AR) ½Ã½ºÅÛ µî¿¡µµ Àû¿ë °¡´ÉÇÏ´Ù°í ¸»Çß´Ù. ¾ÕÀ¸·Î ÀÌ ÇÁ·¹ÀÓ ¿öÅ©¸¦ °Ç° °ü¸®, Ç×°ø ¿ìÁÖ, Á¦Á¶¾÷ µî°ú °°Àº ºÐ¾ßÀ¸·Î È®ÀåÇÑ´Ù´Â °èȹÀÌ´Ù. |