카테고리 없음 / / 2021. 7. 28. 03:26

인공지능 성우 서비스, 타입캐스트

반응형

인공지능을 활용한 목소리 서비스를 일상생활에서 사용하기 시작한 지는 오래 되었죠. 

 

실제 성우들의 목소리를 녹음해, 데이터 수집하고 패턴을 분석해 인공지능이 자연스러운 사람의 목소리로 얘기하는 게 가능해졌어요. 

 

요즘 집에 한 두 개씩 있는 AI 스피커도 그렇고, 차량용 네비, 핸드폰에 달려있는 인공지능 등 주변에 있는 기계가 내는 목소리가 다 이런 종류의 하나라고 생각해요. 

 

예전에는 매우 부자연스러운 말투로 그저 글을 읽고 있는 느낌에 불과했다면, 요즘에는 실제 사람이 말하는 듯한 자연스러운 발음과 띄어쓰기, 감정까지 섞인 말투로 기계들이 목소리를 내고 있습니다. 

 

AI를 위한 목소리 데이터를 수집하는 일을 저도 알바 개념으로 해 본 적이 있는데, 다른 사람들의 말투. 억양을 듣고 판단하는 일, 플러스 제 목소리로 녹음하는 일이었어요. 

 

시간이 지날수록 AI의 말투가 흠잡을 데 없이 자연스러워지는 걸 보고 굉장히 놀라기도 했습니다. 

 

이제는 인공지능이 성우자리까지 대체할 수 있을 것 같은데요. 

인공지능 성우 서비스 타입캐스트 

네오사피엔스라는 스타트업 회사에서 타입캐스트라는 서비스를 내놨고, 이건 누구나 대본을 입력. 간단한 편집으로 성우가 녹음한 듯한 음성을 다운로드 받을 수 있다는 특징이 있어요. 

 

2019년부터 나왔으니까 서비스가 시작된 지는 그리 오래되지는 않았습니다. 

 

타입캐스트 기술이 화제가 된 건, MBC에서 방영한 VR 휴먼다큐 <너를 만났다>부터 같아요. 

MBC VR 휴먼다큐 

당시 세상을 떠난 아이의 목소리를 그대로 구현해 낸게 방송을 타면서 관심을 끌게 됐고, 이 뿐만 아니라 트럼프나 김정은, 이병헌 등 유명인의 목소리를 AI가 그대로 만들어내는 영상이 SNS에 퍼지면서 더 입소문을 타게 됐습니다. 

 

이러한 음성 합성 기술과 특수 영상, 딥 러닝이 만나 다신 볼 수 없을 거라 생각했던 사람을 만들어내거나 목소리를 듣게 한다는 점에서는 확실히 의미가 크다고 봅니다. 

 

이런 긍정적인 면도 있지만, 인공지능 음성이 발달할 수록 뭐가 진짜인지 가짜인지 더 알기 어려워지는 시대가 왔다는 건 좀 혼란스럽기도 합니다. 

얼마 전 다큐멘터리 속에서, 사망한 쉐프의 목소리를 AI로 만들어 넣은 게 논란이 되기도 했고요. 

 

역시나 중요한 건 이런 기술을 누가, 어떻게 사용하느냐에 따른 거겠죠. 

 

네오사피엔스는 눈높이로 유명한 대교와 손 잡고, 세계 최초 AI 오디오북을 만들었는데요. 

까칠한 아이 오디오북

'까칠한 아이'라는 책으로, 약 20여 배역의 인공지능 성우의 음성을 사용해 만들어진 오디오북입니다. 

 

'타입캐스트' 프로그램을 사용하면, 누군든지 이런 오디오북을 만드는 게 가능해집니다. 

 

저도 한 번 사용해 봤어요. 

 

https://typecast.ai/

 

typecast

인공지능 성우를 활용해서 다양하고 개성 있는 음성 콘텐츠를 제작하는 서비스입니다.

typecast.ai

이 사이트입니다. 

 

이메일로 간단하게 가입이 가능하고, 무료부터 프리미엄까지 다양한 멤버쉽이 있습니다. 

타입캐스트 멤버쉽

개인으로 쓰냐, 그룹으로 쓰냐에 따라 나눠지고, 짧은 컨텐츠를 이용하시 분들은 그냥 무료 버젼 써도 될 것 같아요. 

 

타입캐스트 프로젝트 생성 

무료버젼으로 해도 프로젝트 생성은 무한정으로 생성할 수 있다고 하니까요. 

 

여기에서 프로젝트 생성 버튼을 누르면 원하는 대본을 쓸 수 있는 화면으로 넘어갑니다. 

타입캐스트 편집 대본 쓰기 

저는 네오사피엔스에 관한 세 줄을 적어보았고, 한 줄 당 원하는 캐릭터의 목소리로 설정할 수가 있어요. 

 

물론 하나의 캐릭터로 전부 읽게 하는 것도 괜찮고요. 

타입 캐스트 성우 선정 

한글뿐만 아니아 영어 버젼의 캐릭터 설정도 가능하고, 성별, 감정, 톤, 연령층, 컨텐츠, 분위기, 스폐셜 항목으로 원하는 캐릭터를 찾을 수 있습니다. 

 

연령층은 아동 목소리부터 장년 목소리까지 있고, 컨텐츠도 다큐용이나, 팟캐스트나 유튜브 용이냐, 광고용이냐, 교육용이냐 등 다양한 목적을 고를 수 있어요. 

 

분위기도 밝은건지, 슬픈건지, 차가운건지, 귀여운건지에 따라 11개 정도 항목이 있고, 스폐셜은 유명인의 목소리를 고르거나 커스텀으로 만들 수 있는 것 같아요. 

 

제가 놀란 건, 북한 사투리, 강원도 사투리 같은 지역 특유의 말투까지 인공지능 성우로 구현해냈다는 거에요. 

 

참 대단합니다. 

성우 목소리 세부 설정

캐릭터 설정 후에도, 그 캐릭터가 현재 문장을 어떤 감정으로 읽어줄 지, 어떤 속도, 어떻게 끊어읽을지, 피치는 어떻게 할 지도 설정가능해요. 

 

말 그대로 내가 원하는 맞춤용 성우를 이렇게 간단히 고를 수 있게 된 거에요. 

재생 및 다운로드 

설정이 끝난 후에는 화면 하단에 있는 재생 버튼을 눌러 실제 어떤 느낌으로 읽는지 들어보고 녹음해서 다운로드 할 수 있어요. 

 

재생 속도도 설정해서 다운로드 가능하고요. 

 

멤버쉽에 따라 이 다운로드 가능한 분량이 달라집니다. 

 

원하면 배경음악까지 동시에 깔 수 있으니, 성우가 필요한 컨텐츠를 만드시는 분들 입장에서는 편리하게 이용할 수 밖에 없는 많은 여건을 갖춰놨어요. 

 

나중에는 영상에 직접 AI 성우 목소리를 입히게 될 수 있을 것 같고, 더 나아가서 다양한 유명인들을 참여 시켜, 그들의 목소리를 사서 컨텐츠를 만들 수도 있을 것 같은데, 이쯤 됐을 때는 악용 사례가 더 많아질 수도 있겠네요. 

 

AI 목소리로 장난 전화를 걸거나 범죄에 악용해 수사에 혼란을 줄 것 같기도 하고. 

 

성우들 입장에서는 AI한테 벌써 일자리를 빼앗기게 된 느낌일 것 같아요. 

 

일자리 문제나 범죄에 관해서는 어떻게 대응할 지 대비책도 미리 마련되면 좋겠다는 생각이 들어요. 

 

무튼 이런 대단한 기술을 한국 회사에서 만들어 넓혀나간다는 게 자랑스럽고 부디 긍정적인 효과를 더 많이 거둘 수 있길 바랍니다. 

 

 

반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유