Por Hyunsu Yim
SEUL (Reuters) – Em um estúdio de gravação mal iluminado em Seul, os produtores da gravadora de K-pop que trouxe o grupo masculino de sucesso BTS estão usando inteligência artificial para fundir a voz de um cantor sul-coreano com a de falantes nativos em cinco outros idiomas.
Anúncio
A tecnologia permitiu que a HYBE, maior gravadora da Coreia do Sul, lançasse uma faixa do cantor MIDNATT em seis idiomas – coreano, inglês, espanhol, chinês, japonês e vietnamita em maio.
Alguns cantores de K-pop lançaram músicas em inglês e japonês, além de seu coreano nativo, mas aplicar a nova tecnologia para um lançamento simultâneo em seis idiomas é uma novidade global, de acordo com a HYBE, e pode abrir caminho para que seja usado por artistas mais populares.
“Primeiro ouviríamos a reação, a voz dos fãs, e então decidiríamos quais deveriam ser nossos próximos passos”, disse Chung Wooyong, chefe do braço de mídia interativa da HYBE em uma entrevista no estúdio da empresa.
Lee Hyun, 40, conhecido como MIDNATT, que fala apenas inglês e chinês limitado, além do coreano, gravou a música “Masquerade” em cada idioma.
Os falantes nativos leram as letras e, posteriormente, os dois foram combinados perfeitamente com a ajuda da tecnologia de música AI interna da HYBE, disse Chung.
A música é o mais recente sinal da crescente influência da IA na indústria da música em um momento em que o Grammy Awards introduziu novas regras para o uso da tecnologia e misturas de músicas geradas por IA estão inundando as mídias sociais.
“Dividimos um pedaço de som em diferentes componentes – pronúncia, timbre, tom e volume”, disse Chung. “Observamos a pronúncia associada ao movimento da língua e usamos nossa imaginação para ver que tipo de resultado poderíamos obter usando nossa tecnologia.”
Em uma comparação antes e depois mostrada à Reuters, um som de vogal alongado foi adicionado à palavra “twisted” nas letras em inglês, por exemplo, para soar mais natural enquanto nenhuma mudança detectável foi feita na voz do cantor.
O uso de aprendizado profundo desenvolvido pela estrutura de Análise e Síntese Neural (NANSY) desenvolvida pela Supertone torna a música mais natural do que o uso de software não-IA, disse o diretor de operações da Supertone, Choi Hee-doo.
A HYBE anunciou a aquisição da Supertone por 45 bilhões de won (US$ 36 milhões) em janeiro. A HYBE disse que planeja tornar parte da tecnologia de IA usada na música do MIDNATT acessível aos criadores e ao público, mas não especificou se cobraria taxas.
‘EXPERIÊNCIA IMERSIVA’
MIDNATT disse que o uso de IA permitiu a ele um “espectro mais amplo de expressões artísticas”.
“Sinto que a barreira do idioma foi levantada e é muito mais fácil para os fãs globais terem uma experiência imersiva com minha música”, disse ele em um comunicado.
Embora a tecnologia não seja nova, é uma forma inovadora de usar IA na música, disse Valerio Velardo, diretor do The Sound of AI, um serviço de consultoria com sede na Espanha para música e áudio de IA.
Não apenas músicos profissionais, mas também uma população mais ampla se beneficiarão da tecnologia musical de IA a longo prazo, disse Velardo.
“Vai diminuir a barreira da criação musical. É um pouco como o Instagram para fotos, mas no caso da música.”
Por enquanto, a tecnologia de correção de pronúncia do HYBE leva “semanas ou meses” para fazer seu trabalho, mas quando o processo acelera, pode servir a uma gama mais ampla de propósitos, como interpretação em videoconferências, disse Choi Jin-woo, o produtor de “Masquerade” do MIDNATT, que atende pelo nome de Hitchhiker.
(Reportagem de Hyunsu Yim; Reportagem adicional de Daewoung Kim e Hyun Young Yi; Edição de Josh Smith e Jamie Freed)
Por Hyunsu Yim
SEUL (Reuters) – Em um estúdio de gravação mal iluminado em Seul, os produtores da gravadora de K-pop que trouxe o grupo masculino de sucesso BTS estão usando inteligência artificial para fundir a voz de um cantor sul-coreano com a de falantes nativos em cinco outros idiomas.
Anúncio
A tecnologia permitiu que a HYBE, maior gravadora da Coreia do Sul, lançasse uma faixa do cantor MIDNATT em seis idiomas – coreano, inglês, espanhol, chinês, japonês e vietnamita em maio.
Alguns cantores de K-pop lançaram músicas em inglês e japonês, além de seu coreano nativo, mas aplicar a nova tecnologia para um lançamento simultâneo em seis idiomas é uma novidade global, de acordo com a HYBE, e pode abrir caminho para que seja usado por artistas mais populares.
“Primeiro ouviríamos a reação, a voz dos fãs, e então decidiríamos quais deveriam ser nossos próximos passos”, disse Chung Wooyong, chefe do braço de mídia interativa da HYBE em uma entrevista no estúdio da empresa.
Lee Hyun, 40, conhecido como MIDNATT, que fala apenas inglês e chinês limitado, além do coreano, gravou a música “Masquerade” em cada idioma.
Os falantes nativos leram as letras e, posteriormente, os dois foram combinados perfeitamente com a ajuda da tecnologia de música AI interna da HYBE, disse Chung.
A música é o mais recente sinal da crescente influência da IA na indústria da música em um momento em que o Grammy Awards introduziu novas regras para o uso da tecnologia e misturas de músicas geradas por IA estão inundando as mídias sociais.
“Dividimos um pedaço de som em diferentes componentes – pronúncia, timbre, tom e volume”, disse Chung. “Observamos a pronúncia associada ao movimento da língua e usamos nossa imaginação para ver que tipo de resultado poderíamos obter usando nossa tecnologia.”
Em uma comparação antes e depois mostrada à Reuters, um som de vogal alongado foi adicionado à palavra “twisted” nas letras em inglês, por exemplo, para soar mais natural enquanto nenhuma mudança detectável foi feita na voz do cantor.
O uso de aprendizado profundo desenvolvido pela estrutura de Análise e Síntese Neural (NANSY) desenvolvida pela Supertone torna a música mais natural do que o uso de software não-IA, disse o diretor de operações da Supertone, Choi Hee-doo.
A HYBE anunciou a aquisição da Supertone por 45 bilhões de won (US$ 36 milhões) em janeiro. A HYBE disse que planeja tornar parte da tecnologia de IA usada na música do MIDNATT acessível aos criadores e ao público, mas não especificou se cobraria taxas.
‘EXPERIÊNCIA IMERSIVA’
MIDNATT disse que o uso de IA permitiu a ele um “espectro mais amplo de expressões artísticas”.
“Sinto que a barreira do idioma foi levantada e é muito mais fácil para os fãs globais terem uma experiência imersiva com minha música”, disse ele em um comunicado.
Embora a tecnologia não seja nova, é uma forma inovadora de usar IA na música, disse Valerio Velardo, diretor do The Sound of AI, um serviço de consultoria com sede na Espanha para música e áudio de IA.
Não apenas músicos profissionais, mas também uma população mais ampla se beneficiarão da tecnologia musical de IA a longo prazo, disse Velardo.
“Vai diminuir a barreira da criação musical. É um pouco como o Instagram para fotos, mas no caso da música.”
Por enquanto, a tecnologia de correção de pronúncia do HYBE leva “semanas ou meses” para fazer seu trabalho, mas quando o processo acelera, pode servir a uma gama mais ampla de propósitos, como interpretação em videoconferências, disse Choi Jin-woo, o produtor de “Masquerade” do MIDNATT, que atende pelo nome de Hitchhiker.
(Reportagem de Hyunsu Yim; Reportagem adicional de Daewoung Kim e Hyun Young Yi; Edição de Josh Smith e Jamie Freed)
Discussão sobre isso post