|
|
|
¡ã ¶óÀÌÄ«°í ·Îº¿ÀÌ ´Ù¾çÇÑ µ¿ÀÛÀ» ÇнÀÇÏ°í ÀÖ´Ù.(»çÁø=±¸±Û AI ºí·Î±×) |
½ÇÁ¦ °³ÀÇ ¹ÎøÇÑ µ¿ÀÛÀ» ÇнÀÇÒ ¼ö ÀÖ´Â 4Á· º¸Çà ·Îº¿¿ë ÀΰøÁö´É ½Ã½ºÅÛÀÌ °³¹ßµÆ´Ù.
‘±¸±Û AI ºí·Î±×’¿¡ µû¸£¸é ±¸±Û ¿¬±¸ÁøÀº 4Á· º¸Çà ·Îº¿(·Îº¿ °³)ÀÌ ½ÇÁ¦ °³ÀÇ °¢Á¾ µ¿ÀÛÀ» µû¶ó ¹è¿ï ¼ö ÀÖ´Â ÀΰøÁö´É ½Ã½ºÅÛÀ» °³¹ßÇß´Ù. ½ÇÁ¦ °³·ÎºÎÅÍ µ¿ÀÛÀ» ÇнÀÇÒ ¼ö ÀÖ´Â ÀΰøÁö´ÉÀÌ °³¹ßµÇ¸é 4Á· º¸Çà ·Îº¿ÀÇ µ¿ÀÛÀ» ÀÏÀÏÈ÷ ÇÁ·Î±×·¡¹ÖÇÒ ÇÊ¿ä°¡ ¾ø´Ù.
¿¬±¸ÁøÀº ÀÌ ÀΰøÁö´É ½Ã½ºÅÛÀ» ¹°·ùâ°í³ª °í°´¹è¼Û¼¾ÅÍ µî¿¡¼ ¹°Ç°À» ¿Å±æ ¼ö ÀÖ´Â ·Îº¿À» °³¹ßÇϴµ¥ Àû¿ëÇÒ ¼ö ÀÖÀ» °ÍÀ¸·Î º¸°í ÀÖ´Ù.
¿¬±¸ÆÀÀÌ °³¹ßÇÑ ÀΰøÁö´É ÇÁ·¹ÀÓ¿öÅ©´Â ½ÇÁ¦ °³ÀÇ µ¿ÀÛ¿¡ °üÇÑ À̹ÌÁö Ŭ¸³À» ÀÌ¿ëÇØ ÇнÀÇÑ´Ù. ÇнÀ ¹æ¹ýÀº º¸»óÀ» Á¦°øÇÏ´Â ¹æ½ÄÀ¸·Î ¸ñÇ¥ ÇൿÀ» À¯µµÇÏ´Â '°ÈÇнÀ(RL¤ýreinforcement learning)'ÀÌ´Ù. ¿¬±¸ÆÀÀº »óÀÌÇÑ ·¹ÆÛ·±½º µ¿ÀÛÀ» ÈÆ·ÃÇÏ´Â ¹æ¹ýÀ¸·Î Áß±¹ À¯´ÏÆ®¸®ÀÇ 4Á· º¸Çà ·Îº¿ÀÎ ‘¶óÀÌÄ«°í(Laikago)’¿¡°Ô ÇнÀÀ» ½ÃÄ×´Ù. ¶óÀÌÄ«°í´Â º¸Çà, ¼Óº¸, ȸÀü, ¿·°ÉÀ½Áú, Á¦ÀÚ¸® ¶Ù±â, µÞ°ÉÀ½Áú µî ¿©·¯ µ¿ÀÛÀ» ½Ã¹Ä·¹À̼ǰú ½ÇÁ¦ ȯ°æ¿¡¼ ÈÆ·ÃÇß´Ù.
À̹ø ¿¬±¸¸¦ À§ÇØ ¿¬±¸ÆÀÀº ¹ÎøÇÑ µ¿ÀÛÀ» ½ÇÇàÇÏ´Â ½ÇÁ¦ °³¿¡ °üÇÑ µ¥ÀÌÅͼÂÀ» ¼öÁýÇØ ÄÄÆÄÀÏÇÏ°í, 2¾ï°³¿¡ ´ÞÇÏ´Â »ùÇÃÀ» È°¿ëÇØ ½Ã¹Ä·¹ÀÌÅͻ󿡼 ·Îº¿ÀÌ ¸ð¹æ ÇнÀÀ» Çϵµ·Ï Çß´Ù. ±×·¯³ª ½Ã¹Ä·¹ÀÌÅͻ󿡼± ½ÇÁ¦ ¼¼°è¿¡ ±ÙÁ¢ÇÒ ¸¸ÇÑ µ¿ÀÛÀ» ±¸ÇöÇÏÁö´Â ¸øÇß´Ù. ÀÌ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ ¿¬±¸ÁøÀº 4Á· º¸Çà ·Îº¿ÀÇ Ã¼Àû(ºÎÇÇ), ¸¶Âû·Â µî¿¡ º¯È¸¦ ÁÖ¸é¼ '¿ªµ¿¼º'À» ·£´ýÈÇÏ´Â 'ÀûÀÀ ±â¼ú(adaptation technique)'À» äÅÃÇß´Ù.
¿¬±¸ÆÀÀº “º¸Çà ·Îº¿ÀÇ ´Ù¾çÇÑ µ¿ÀÛµéÀ» ±¸ÇöÇϱâ À§ÇØ ·¹ÆÛ·±½º ¸ð¼Ç µ¥ÀÌÅ͸¦ È°¿ëÇØ Á¦¾î±â¸¦ ÀÚµ¿À¸·Î »ý¼ºÇß´Ù”¸ç "½Ã¹Ä·¹ÀÌÅͻ󿡼 ÇнÀÇÑ ÀûÀÀÀûÀÎ Á¤Ã¥(adaptive policies)À» ½ÇÁ¦ ȯ°æ¿¡¼ ºü¸£°Ô Àû¿ëÇÒ ¼ö ÀÖ´Ù“°í ¸»Çß´Ù.
¿¬±¸ÆÀÀº ¾ÕÀ¸·Î Á¦¾î±âÀÇ °°Ç¼º(robustness)À» Á¦°íÇÏ°í ºñµð¿À Ŭ¸³ °°Àº ´Ù¸¥ ¸ð¼Ç µ¥ÀÌÅ͸¦ È°¿ëÇØ ÇнÀ½Ãų ¼ö ÀÖ´Â ÇÁ·¹ÀÓ¿öÅ©¸¦ °³¹ßÇÑ´Ù´Â °èȹÀÌ´Ù.
|