일상/뉴스 공부

[뉴스 공부] 대화형 인공지능 개발 - 24개 언어 인식 가능 한국전자통신연구원에서 개발(ETRI)

Solation 2022. 11. 3.

221103 뉴스 공부 ETRI 언어인식 인공지능 기술 개발
221103 뉴스 공부 ETRI 언어인식 인공지능 기술 개발

뉴스 공부 소재 찾기

 오늘 뉴스 기사들은 거의 비슷한 내용들을 말하고 있어서 소재 찾기가 조금 어려웠다.

이태원 사고의 잘잘못에 대한 내용, 봉화 광산 매몰 사고 등의 내용이 많았다.

그러다가 내 전공인 컴퓨터 공학과 쪽 뉴스를 살펴보자 하는 생각에 인공지능 관련 뉴스를 가지고 왔다.

기사 제목이 좀 별로인데 내용은 좋다. 

 

한국전자통신연구원

 ETRI에서 한국어 포함 세계 주요 언어 24개를 인식할 수 있는 음성인식 인공지능(AI)를 개발했다고 한다.

기술 수준은 구글 등의 글로벌 기업과 비교해 한국어 부분은 우세하고, 다른 언어는 대등한 수준이라고 한다.

 

ETRI는 평창 동계올림픽 때 자동통역 핵심 기술 서비스에 원천기술을 지원했다고 한다.기존의 학습형 모델인 종단형(End-to-End) 음성인식 기술은 학습속도가 느리고 특정 분야에 적용하기 어려운 점이 있었다고 한다.

그래서 연구팀은 자기지도학습과 의사  레이블, 대용량 다국어 사전 학습 모델, 음성 데이터의 오디오 데이터 생성(TTS) 증강기술 등을 통해 해결했다고 한다. 

 

와 하나같이 못알아 듣는 기술들을 이용했다. 

각각 간단하게 찾아봤는데 이것도 못 알아듣기는 매한가지다.

대략 이런 거구나 정도만 알아듣고 넘어가면 될 듯하다. 


용어 참고 링크들

 이해가 안 되는 용어 몇 가지를 찾아서 살펴보았고, 도움을 받은 링크를 남긴다.

근데 하나같이 이해 안 가는 내용들이 많아 겉핣기 정도로만 이해하고 넘어갔다.


자기지도학습

 데이터를 모으는 게 어려워서 시도한 방법이라는 것 정도만 이해했다. 

 

 

Self-supervised learning (자기지도 학습) 이란?

요즘 Deep learning에서 주목받고 있는 학습법인 Self-supervised learning을 소개할까 합니다. 이번 글에서는 Self-supervised learning에 대한 간단한 소개 이후 왜 이 학습법이 주목받는지, Self-supervised learning

lifeisenjoyable.tistory.com


의사 레이블

저만 못 알아듣겠는 거 아니죠??

 

 

[논문 읽기] Pseudo Label(2013), The Simple and Efficient Semi-Supervised Learning

안녕하세요! 이번에 읽어볼 논문은 Pseudo Label, The Simple and Efficeint Semi-Supervised Learning 입니다. 현재 Image classification 분야에서 EfficientNet에 Meta Pseudo Lable을 적용한 모델이 SOTA를 차지하고 있습니다. P

deep-learning-study.tistory.com


오디오 데이터 생성 TTS

 TTS는 많이 들어본 편인데, 방송에서 목소리를 내주는 게 TTS라고 했던 기억이 있다.

이 기술을 이용한 모양이다. 

 

 

딥 러닝 음성 인식에 필요한 훈련 데이터를 직접 만들어보자

2022-LINE-engineering-site

engineering.linecorp.com

 


출처, 참고 링크

제목이 좀... 

컴퓨터를 천재라고 하는 건 너무 어그로성이... 

24개 언어 이해하는 '천재' 있다? 그 주인공 정체는 바로…
김인한 기자 - 머니투데이

 

 

종단형(End-to-End) 음성인식 기술에 대한 설명이  되어있는 블로그 링크

 

[AI 기술] 구글도 주목하는 음성인식 기술 : E2E 음성인식 기술

음성인식 기술의 새로운 챕터, E2E(End-to-End) 최근까지 대부분의 음성인식 시스템은 음향 모델, 언어...

blog.naver.com

 

댓글

💲 추천 광고