생각하면서 움직이는 로봇용 알고리즘

홈 > 뉴스 > 인공지능

생각하면서 움직이는 로봇용 알고리즘구글 브레인 등 총 3개 연구팀, 동시 심층강화학습 공동 개발

승인 2020.05.14 12:02:17

사람은 튀고 있는 공을 쫓을 때 이동할 것으로 예상되는 곳으로 움직인다. 예를 들어 움직이던 공이 다른 방향으로 튕겨나가면 사람은 이에 맞춰 실시간으로 적절한 경로를 수정한다. 반면 로봇은 이동하면서 생각하는 대신 계산한 다음에야 행동을 실행에 옮기는 경향이 있다. 사람처럼 실시간으로 경로를 변경하는 데 어려움을 겪을 수 있다는 말이다.

이러한 가운데 구글 브레인(Google Brain)을 비롯해 UC 버클리(UC Berkeley), 엑스 랩(X Lab)으로 구성된 연구팀이 ‘동시 심층강화학습(concurrent Deep Reinforcement Learning)’이라는 알고리즘을 공동 개발했다고 인공지능 및 산업 전문 매체인 '싱크드'가 보도했다. 이 알고리즘은 로봇이 작업이나 동작을 보다 넓고 장기적으로 생각하도록 해주며, 특히 현 작업을 마무리하기 전에 다음 작업을 결정하는 것을 가능케 한다.

심층강화학습은 제로섬 게임(zero-sum game) 및 로봇 파지(robotic grasping) 등과 같은 시나리오에서 엄청난 성공을 거뒀다. 물론 이 같은 성과는 주로 ‘블록킹 환경(blocking environment)’에서 나타났다. 이 경우에 해당 모델은 '관찰중인 상태'와 '실행중인 작업' 사이의 시간에 '상태 변화'가 없다고 가정한다.

반면 실제 ‘동시 환경(concurrent environment)’에서는 환경 상태가 실시간으로 변할 수 있다. 게다가 에이전트가 초기에 작업을 계산한 후에 환경이 변경되면 순차적인 블록킹 방식으로 실행된 작업이 실패할 수도 있다.


▲ (a): '블록킹' 환경에서 상태 캡처 및 정책 유추는 즉각적인 것으로 가정된다. (b): '동시' 환경에서 상태 캡처 및 정책 유추는 작업 실행으로 동시에 진행하는 것으로 가정된다.

이를 해결하기 위해선 로봇이 동시 제어로 작동하도록 해야 한다. 이 경우는 정책에서 작업을 샘플링하는 것이 시간 진화와 동시에 수행돼야 한다.


▲ (a): '블록킹' MDP에서 에이전트가 현재 상태를 기록하고 작업을 선택하는 동안 환경 상태는 변경되지 않는다. (b): '동시' MDP에서 상태 및 동작 역학은 연속적인 시간 확률적 프로세스 s (t) 및 a_i (t)다.

연구팀은 이산 시간(discrete-time) 및 연속 시간(continuous-time) 설정에서 표준 RL 방법을 사용했다. 이어 마르코브 의사결정 프로세스(Markov Decision Processes·MDP)를 동시 동작에 적용했다. 이 경우에 동시 동작 환경은 이전 동작이 여전히 실행되고 있는 동안에도 현재 상태를 캡처한다. 연구팀은 MDP 수정이 동시 작업을 나타내는 데 충분하다고 결론을 내렸다.


▲ 시뮬레이션과 실제 로봇 파지 작업 사진(사진=싱크드)


▲ 대규모 시뮬레이션 로봇 파지 결과표


▲ 실제 로봇 파지 결과표

연구팀은 동시 환경에 대처가 가능한 가치 기반(value-based) DRL 알고리즘을 도입해 ‘대규모 로봇 파지 작업 시뮬레이션’과 ‘실제 로봇 파지 작업’ 테스트를 진행했다. 테스트 결과 시뮬레이션 작업에선 이번에 개발한 동시 모델이 ‘블록킹 실행 기준 모델(the blocking execution baseline model)’ 보다 31.3%나 빠르게 작동했다. 또 실제 파지 작업에선 동시 모델이 49%나 빠른 보다 부드러운 트래직터리(trajectory)를 학습했다는 설명이다.

조상협 robot3@irobotnews.com

이 기사에 대한 댓글 이야기 (0)

자동등록방지용 코드를 입력하세요!

확인

- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]

이 기사에 대한 댓글 이야기 (0)

조상협의 다른기사 보기

인기기사

1
로보티즈, LG전자와 본격 협력

2
아마존, 유럽 물류 자동화에 1조원 이상 투자

3
中 전기차 기업 니오, '휴머노이드 로봇' 개발 전담팀 구성

4
국내 최고의 서비스 로봇 활용 병원 '한림대학교성심병원'

5
보스턴 다이나믹스, 전기 구동 신형 휴머노이드 '아틀라스' 공개

6
로보락, 2024년 플래그십 모델 ‘S8 맥스V 울트라’ 출시

7
미 스탠포드대, '거미' 모방 우주 탐사 로봇 '리치봇' 개발

8
스위스 취리히 연방공대, 우주 탐사용 로봇 '스페이스호퍼' 개발

9
나우로보틱스, 중기부 인천시 지역특화프로젝트 레전드50+ 선정

10
'젊은 로봇 공학자' (68) ETRI 윤영우 책임연구원

1로보티즈, LG전자와 본격 협력

2아마존, 유럽 물류 자동화에 1조원 이상 투자

3中 전기차 기업 니오, '휴머노이드 로봇' 개발 전담팀 구성

4국내 최고의 서비스 로봇 활용 병원 '한림대학교성심병원'

5보스턴 다이나믹스, 전기 구동 신형 휴머노이드 '아틀라스' 공개

6로보락, 2024년 플래그십 모델 ‘S8 맥스V 울트라’ 출시

7미 스탠포드대, '거미' 모방 우주 탐사 로봇 '리치봇' 개발

8스위스 취리히 연방공대, 우주 탐사용 로봇 '스페이스호퍼' 개발

9나우로보틱스, 중기부 인천시 지역특화프로젝트 레전드50+ 선정

10'젊은 로봇 공학자' (68) ETRI 윤영우 책임연구원