Spotify planeja “ouvir suas conversas” com nova patente

A última invenção do Spotify monitora sua fala, determina seu estado emocional … E sugere música com base nisso. Você já se encontrou lutando para encontrar novas músicas?

Além de amigos e família, os algoritmos da lista de reprodução são um sucesso ou um fracasso na busca por algo novo. De acordo com novos relatórios, o Spotify está trabalhando em uma nova maneira de encontrar músicas para você, tudo ouvindo suas conversas. O relatório da Music Business Worldwide afirma que a nova patente do Spotify reuniria “entonação, ênfase, ritmo e unidades de discurso semelhantes” dos usuários.

À primeira vista, a ideia é uma abordagem totalmente diferente da que estamos acostumados. Idealmente, o programa seria capaz de prever se você esta feliz, animado ou triste, tudo dependendo da fala da pessoa. A partir daí, novas músicas e playlists seriam selecionadas para você. A patente foi depositada pela primeira vez em fevereiro de 2018 e finalmente aprovada em 12 de janeiro deste ano. Veja a patente completa (original em inglês) aqui.

A opinião pública imediatamente vê sinais de alerta ao pensar em conversas privadas sendo gravadas. Alguém poderia facilmente sentir-se desconfortável com a ideia de um programa gravando-os em sua casa. Além disso, seria necessário construir a confiança de que as conversas gravadas não seriam acessíveis a mais ninguém. A privacidade pessoal provavelmente será uma grande preocupação para o Spotify.

Spotify explica que “é comum para um aplicativo de streaming de mídia incluir recursos que fornecem recomendações de mídia personalizadas para um usuário”.

Uma abordagem existente para identificar que tipo de conteúdo um usuário deve ser recomendado, observa o arquivamento, é pedir a ele que forneça “informações básicas como sexo ou idade”.

Uma abordagem mais básica pode simplesmente categorizar a emoção [de um usuário] em feliz, zangado, com medo, triste ou neutro … Informações prosaicas (por exemplo, entonação, ênfase, ritmo e outras unidades de fala) podem ser combinadas e integradas com informações acústicas dentro uma arquitetura de modelo de markov oculta, que permite fazer observações a uma taxa apropriada para os fenômenos a serem modelados.

PATENTE SPOTIFY

Continua o arquivamento: “O usuário é então solicitado a fornecer informações adicionais para reduzir ainda mais o número. Em um exemplo, o usuário é empurrado para uma árvore de decisão incluindo, por exemplo, artistas ou programas que o usuário gosta e preenche ou seleciona opções para ajustar ainda mais a identificação do sistema de seus gostos ”.

Este método não é eficiente o suficiente, argumenta o Spotify, porque exige que os usuários “insiram tediosamente respostas a várias consultas para que o sistema identifique os gostos do usuário”.

A solução do Spotify? Colete “atributos de gosto de um usuário”, usando tecnologia de reconhecimento de voz.

Em um ponto, a patente sugere que a obtenção de “entonação, ênfase, ritmo e unidades de fala” poderia ser combinada com “informações acústicas dentro de uma arquitetura de modelo Markov oculta” para que o aplicativo do Spotify pudesse categorizar o humor do usuário como “feliz zangado, triste ou neutro ”.


Como o Spotify pretende fazer isso, de acordo com a patente, é recuperando metadados de conteúdo da voz de um usuário e/ou de ruído de fundo.

Além de determinar atributos como idade, sexo e sotaque, esses metadados de conteúdo podem indicar “um estado emocional de um falante que está dando a voz”.

Os metadados ambientais podem indicar ruídos de fundo específicos, como “sons de veículos em uma rua, outras pessoas falando, pássaros cantando, impressoras imprimindo e assim por diante”

Em um comunicado enviado à Pitchfork, um porta-voz do Spotify deixou um comentário sobre a nova patente. Leia abaixo:

“O Spotify já entrou com pedidos de patentes para centenas de invenções e regularmente apresentamos novos pedidos. Algumas dessas patentes se tornarão parte de produtos futuros, enquanto outras não. Nossa ambição é criar a melhor experiência de áudio que existe, mas não temos novidades para compartilhar no momento.”

Com informações: MBW, Pitchfork.