로봇신문사
> 기획·테크 > 미래기술
슈퍼브에이아이, 한글 OCR 인공지능 학습용 데이터 공개문자 인식 OCR, 자율주행 등 분야 활용 가능
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2020.01.30  10:47:58
트위터 페이스북 구글+ 밴드

슈퍼브에이아이(대표 김현수)가 한글 OCR 인공지능 학습용 데이터 780만 글자 구축에 성공, AI 허브에 공개했다고 30일 밝혔다.

슈퍼브에이아이는 한국정보화진흥원(NIA)이 주관하는 2019년 한국어 글자체 이미지 AI데이터 구축 사업에 참여 △간판, 도로 표지 등의 이미지 내 텍스트 인 더 와일드(Text in the Wild) 130만 글자 △인쇄체 280만 글자 △손글씨체 370만 글자 등 총 780만 글자 이미지 데이터를 성공적으로 제작했다. 한국어의 고유한 특성을 살린 OCR 인공지능 학습용 데이터 세트로서 한글 자모 조합 총 1만1172자를 포함한다.

이번에 공개된 데이터 세트는 AI 허브 플랫폼(http://aihub.or.kr/aidata/133)에서 다운로드 가능하다. 이를 통해 누구나 대량의 한글 OCR 학습 데이터를 내려 받아 한글 인식 및 이미지 기반 검색 등의 AI 모델 및 서비스 개발에 활용할 수 있다.

현재 구글 등이 제공하는 OCR 활용 인지 서비스에 한국어로 된 글자체 이미지 데이터 세트가 없어 기관, 기업의 연구개발에 차질이 있었다. 전세계적으로 전통적인 알고리즘이 아닌 딥러닝 기반 OCR 기술을 사용하는 추세라 한글 글자체에 대한 공개된 학습용 데이터 세트가 필요하다는 게 회사 측 설명이다.

또한 슈퍼브에이아이는 데이터 가공, 관리 및 분석이 가능한 슈퍼브에이아이 스위트(Superb AI Suite)를 도입해 인공지능 개발에 즉시 사용 가능한 양질의 데이터 세트를 구축했다.

김현수 슈퍼브에이아이 대표는 “인공지능 분야에서의 AI 학습 데이터는 대부분 해외에서 제작된 오픈소스 데이터 세트에 의존하고 있어, 국내 시장에 맞는 데이터 세트는 여전히 가뭄 상태”라면서 앞으로 슈퍼브에이아이가 소프트웨어 혁신을 통해 한국의 AI 산업 발전을 이끌겠다고 말했다.

박경일  robot@irobotnews.com
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
박경일의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 구글+ 밴드 뒤로가기 위로가기
인기기사
1
㈜엑사로보틱스(Exa Robotics)
2
메타버스 새로운 기회
3
"로봇 전문인력 양성 통해 선진국 도약할 전진기지 만들겠다"
4
‘2021 코리아 로봇 데모데이’, 오는 14일 열린다
5
美 자율트럭업체 ‘플러스’, 스팩 합병으로 뉴욕증시 입성 추진
6
일본 산업용 로봇업계, 2분기 연속 수출 호조세
7
MIT-하버드, 헝클러진 머리 손질하는 로봇 개발
8
경남로봇랜드재단, 로봇콘텐츠 개발과제로 로봇랜드 활성화 추진
9
엔젤로보틱스, 뇌졸중 환자위한 착용형 보조기기 '엔젤앵클' 개발
10
마이로봇솔루션, 스마트산단 공유플랫폼 프리미엄 공급기업에 선정돼
로봇신문 소개기사제보광고문의불편신고개인정보취급방침이메일무단수집거부청소년보호정책    *국제표준간행물번호 ISSN 2636-0381 *본지는 인터넷신문위원회 자율심의 준수 서약사입니다
08298) 서울 구로구 공원로 41(구로동, 현대파크빌 427호)  |  대표전화 : 02)867-6200  |  팩스 : 02)867-6203
등록번호 : 서울 아 02659  |  등록일자 : 2013.5.21  |  발행인·편집인 : 조규남  |  청소년보호책임자 : 박경일
Copyright © 2013 로봇신문사. All rights reserved. mail to editor@irobotnews.com