로봇신문사
> 기획·테크 > 미래기술
슈퍼브에이아이, 한글 OCR 인공지능 학습용 데이터 공개문자 인식 OCR, 자율주행 등 분야 활용 가능
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2020.01.30  10:47:58
트위터 페이스북 구글+ 밴드

슈퍼브에이아이(대표 김현수)가 한글 OCR 인공지능 학습용 데이터 780만 글자 구축에 성공, AI 허브에 공개했다고 30일 밝혔다.

슈퍼브에이아이는 한국정보화진흥원(NIA)이 주관하는 2019년 한국어 글자체 이미지 AI데이터 구축 사업에 참여 △간판, 도로 표지 등의 이미지 내 텍스트 인 더 와일드(Text in the Wild) 130만 글자 △인쇄체 280만 글자 △손글씨체 370만 글자 등 총 780만 글자 이미지 데이터를 성공적으로 제작했다. 한국어의 고유한 특성을 살린 OCR 인공지능 학습용 데이터 세트로서 한글 자모 조합 총 1만1172자를 포함한다.

이번에 공개된 데이터 세트는 AI 허브 플랫폼(http://aihub.or.kr/aidata/133)에서 다운로드 가능하다. 이를 통해 누구나 대량의 한글 OCR 학습 데이터를 내려 받아 한글 인식 및 이미지 기반 검색 등의 AI 모델 및 서비스 개발에 활용할 수 있다.

현재 구글 등이 제공하는 OCR 활용 인지 서비스에 한국어로 된 글자체 이미지 데이터 세트가 없어 기관, 기업의 연구개발에 차질이 있었다. 전세계적으로 전통적인 알고리즘이 아닌 딥러닝 기반 OCR 기술을 사용하는 추세라 한글 글자체에 대한 공개된 학습용 데이터 세트가 필요하다는 게 회사 측 설명이다.

또한 슈퍼브에이아이는 데이터 가공, 관리 및 분석이 가능한 슈퍼브에이아이 스위트(Superb AI Suite)를 도입해 인공지능 개발에 즉시 사용 가능한 양질의 데이터 세트를 구축했다.

김현수 슈퍼브에이아이 대표는 “인공지능 분야에서의 AI 학습 데이터는 대부분 해외에서 제작된 오픈소스 데이터 세트에 의존하고 있어, 국내 시장에 맞는 데이터 세트는 여전히 가뭄 상태”라면서 앞으로 슈퍼브에이아이가 소프트웨어 혁신을 통해 한국의 AI 산업 발전을 이끌겠다고 말했다.

박경일  robot@irobotnews.com
박경일의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 구글+ 밴드 뒤로가기 위로가기
인기기사
1
[특집]로봇기업 신년 계획 ① ㈜유진로봇
2
바이브컴퍼니, 세종시 AI·빅데이터 기반 자율주행 관제 사업 참여
3
홍 부총리 “자율주행 4단계 핵심기술 개발에 1조1000억 투입”
4
디즈니·픽사 애니메이션 ‘소울’ 개봉 첫 주 예매 1위
5
벨로다인 라이다-트렁크테크놀러지, 전략적 파트너십 체결
6
국토교통부
7
MS-GM '크루즈', 자율주행 자동차 개발 협력한다
8
최근 주목받은 푸드테크 로봇들 어떤 것이 있나
9
[기획]뿌리산업, 제조로봇 보급 선도한다①
10
덴소, 美 에이바와 FMCW 라이다 분야 협력
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
로봇신문 소개기사제보광고문의불편신고개인정보취급방침이메일무단수집거부청소년보호정책    *국제표준간행물번호 ISSN 2636-0381 *본지는 인터넷신문위원회 자율심의 준수 서약사입니다
08298) 서울 구로구 공원로 41(구로동, 현대파크빌 427호)  |  대표전화 : 02)867-6200  |  팩스 : 02)867-6203
등록번호 : 서울 아 02659  |  등록일자 : 2013.5.21  |  발행인·편집인 : 조규남  |  청소년보호책임자 : 박경일
Copyright © 2013 로봇신문사. All rights reserved. mail to editor@irobotnews.com