로봇신문사
> 기획·테크 > 미래기술
슈퍼브에이아이, 한글 OCR 인공지능 학습용 데이터 공개문자 인식 OCR, 자율주행 등 분야 활용 가능
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2020.01.30  10:47:58
트위터 페이스북 구글+ 밴드

슈퍼브에이아이(대표 김현수)가 한글 OCR 인공지능 학습용 데이터 780만 글자 구축에 성공, AI 허브에 공개했다고 30일 밝혔다.

슈퍼브에이아이는 한국정보화진흥원(NIA)이 주관하는 2019년 한국어 글자체 이미지 AI데이터 구축 사업에 참여 △간판, 도로 표지 등의 이미지 내 텍스트 인 더 와일드(Text in the Wild) 130만 글자 △인쇄체 280만 글자 △손글씨체 370만 글자 등 총 780만 글자 이미지 데이터를 성공적으로 제작했다. 한국어의 고유한 특성을 살린 OCR 인공지능 학습용 데이터 세트로서 한글 자모 조합 총 1만1172자를 포함한다.

이번에 공개된 데이터 세트는 AI 허브 플랫폼(http://aihub.or.kr/aidata/133)에서 다운로드 가능하다. 이를 통해 누구나 대량의 한글 OCR 학습 데이터를 내려 받아 한글 인식 및 이미지 기반 검색 등의 AI 모델 및 서비스 개발에 활용할 수 있다.

현재 구글 등이 제공하는 OCR 활용 인지 서비스에 한국어로 된 글자체 이미지 데이터 세트가 없어 기관, 기업의 연구개발에 차질이 있었다. 전세계적으로 전통적인 알고리즘이 아닌 딥러닝 기반 OCR 기술을 사용하는 추세라 한글 글자체에 대한 공개된 학습용 데이터 세트가 필요하다는 게 회사 측 설명이다.

또한 슈퍼브에이아이는 데이터 가공, 관리 및 분석이 가능한 슈퍼브에이아이 스위트(Superb AI Suite)를 도입해 인공지능 개발에 즉시 사용 가능한 양질의 데이터 세트를 구축했다.

김현수 슈퍼브에이아이 대표는 “인공지능 분야에서의 AI 학습 데이터는 대부분 해외에서 제작된 오픈소스 데이터 세트에 의존하고 있어, 국내 시장에 맞는 데이터 세트는 여전히 가뭄 상태”라면서 앞으로 슈퍼브에이아이가 소프트웨어 혁신을 통해 한국의 AI 산업 발전을 이끌겠다고 말했다.

박경일  robot@irobotnews.com
박경일의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 구글+ 밴드 뒤로가기 위로가기
인기기사
1
재활기기ㆍ인공지능 분야 규제 샌드박스 3건 추가 승인
2
'스카이디오2' 자율비행 드론 런칭
3
MIT, 물류창고 소독용 자외선 이동로봇 개발
4
"아마존, '죽스' 인수로 자율주행 경쟁에 유리한 고지"
5
부천산업진흥원, 부천시 중동에 주차로봇 테스트 베드 구축
6
NASA, 내년 2월 화성서 활약할 자율 드론 공개
7
울산시, 인공지능 기반 드론 상용화 서비스 추진
8
슈나이더 일렉트릭 코리아,익산 스마트 팩토리 공개
9
한 권으로 끝내는 AI 비즈니스 모델
10
中 쑤저우강에 수면 자율주행 청소 로봇 등장
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
로봇신문 소개기사제보광고문의불편신고개인정보취급방침이메일무단수집거부청소년보호정책    *국제표준간행물번호 ISSN 2636-0381 *본지는 인터넷신문위원회 자율심의 준수 서약사입니다
08298) 서울 구로구 공원로 41(구로동, 현대파크빌 427호)  |  대표전화 : 02)867-6200  |  팩스 : 02)867-6203
등록번호 : 서울 아 02659  |  등록일자 : 2013.5.21  |  발행인·편집인 : 조규남  |  청소년보호책임자 : 박경일
Copyright © 2013 로봇신문사. All rights reserved. mail to editor@irobotnews.com