‘10초에 5개 문장 생성’ 캡셔닝 AI 첫 공개…LG, AI ‘해외총력전’

뉴스1

입력 2023-06-19 14:19 수정 2023-06-19 14:20

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
캡셔닝 AI (LG 제공)

LG AI연구원이 18일(현지시간) 캐나다 밴쿠버에서 진행 중인 세계 최대 컴퓨터 비전 학회 ‘CVPR 2023’에서 생성형 AI(인공지능) 상용화 서비스인 ‘캡셔닝 AI’를 첫 공개한다고 19일 밝혔다.

이미지 검색에 활용할 수 있는 정보인 문장, 키워드 등 메타 데이터를 만들어 내는 캡셔닝 AI는 평균적으로 5개 문장과 10개의 키워드를 10초 내에 생성한다. 이틀 내에 1만장의 분량의 이미지 작업도 끝낼 수 있어 맞춤형 이미지 검색·관리 시스템 구축이 가능하다.

LG(003550)는 AI가 인간처럼 처음 보는 물체나 장면도 이해하고 설명할 수 있도록 ‘제로샷 이미지 캡셔닝’ 기술을 적용했다. ‘제로샷 이미지 캡셔닝’은 AI가 기존에 학습한 이미지와 텍스트 데이터를 통해 배경, 인물, 행동 등 이미지 상의 다양한 특징을 인식하고 설명할 수 있게 하는 기술이다.

LG A연구원은 이미지 캡셔닝에 관한 방대한 노하우를 가지고 있는 이미지 플랫폼 기업 셔터스톡과 데이터 학습, 서비스 개발 등을 협력했다. LG AI연구원 관계자는 “학습 데이터의 편향성·선정성 등 AI 윤리 검증을 진행하고 저작권 투명성도 확보했다”고 말했다.

LG AI연구원은 또 학회 기간 LG전자(066570), LG이노텍(011070), LG에너지솔루션(373220), LG유플러스(032640) 등 LG의 주요 계열사와 함께 글로벌 AI 우수 인재 확보에 나선다. 이날엔 학회에 참가한 석·박사 학생들을 대상으로 네트워킹 행사인 ‘LG AI Day’를 진행한다. 20일부터 사흘간 LG 각 계열사의 AI 연구 인력과 채용 담당자들이 LG 통합 부스에서 각 사의 AI 기술 시연과 채용 상담도 한다.

LG전자는 비전 검사 기술 기반으로 운전자의 얼굴 및 시선을 인식해 졸음 및 부주의를 감지하는 기술인 ‘운전자 모니터링 시스템’, 냉장고 내 식품의 신선도 변화나 조리 과정에 따라 오븐 내 음식의 상태 변화 등을 시각적으로 구현하는 AI 기술 등을 소개한다.

LG이노텍은 실제 제품을 양산하기 전 디지털 공간에서 미리 테스트 해볼 수 있는 디지털 트윈 기술, LG에너지솔루션은 하루에 수십만 개씩 생산되는 배터리 셀의 불량을 잡아내는 이상 탐지 기술을 선보인다.

LG유플러스(032640)는 고객들이 미디어 콘텐츠에서 원하는 장면을 손쉽게 찾을 수 있도록 영상 장면의 인물, 행동, 장소, 상황, 문자 등 각종 정보를 통해 데이터를 추출하는 AI 기술을 보여줄 계획이다.

(서울=뉴스1)


라이프



모바일 버전 보기