Descubra o modelo de detecção de áudio de ponta da Resemble AI, o Detect-2B, que alcança 94% de precisão na análise de inteligência artificial.

Empresa de Clonagem de Voz Resemble AI Lança Modelo Avançado de Detecção de Deepfake

A Resemble AI apresentou o Detect-2B, a próxima geração de seu modelo de detecção de deepfake, com uma impressionante taxa de precisão de aproximadamente 94%.

Arquitetura Inovadora do Modelo

O Detect-2B utiliza uma série de sub-modelos pré-treinados, aprimorados por meio de ajustamentos, para analisar clipes de áudio e identificar se foram gerados por IA. "Construindo sobre a sólida base do nosso modelo original Detect, o DETECT-2B representa um avanço significativo em arquitetura de modelo, dados de treinamento e desempenho geral. O resultado é uma ferramenta altamente confiável de detecção de deepfake, oferecendo uma precisão excepcional em um vasto conjunto de dados de áudios reais e fabricados," afirmou a empresa em um post de blog.

Foco em Artefatos de Áudio

De acordo com a Resemble, o Detect-2B incorpora um modelo de representação de áudio congelado com um módulo de adaptação estrategicamente posicionado em suas camadas principais. Este módulo direciona a atenção do modelo para artefatos—sons sutis que diferenciam áudio real de artificial. Frequentemente, o áudio gerado por IA parece "demasiado limpo", mas o Detect-2B consegue estimar a proporção de um clipe que é produzido por IA sem precisar de novo treinamento para cada entrada. Os sub-modelos foram treinados em extensos conjuntos de dados para garantir maior confiabilidade.

Processo de Previsão Simplificado

O Detect-2B agrega pontuações de previsão e as compara a um "limite cuidadosamente ajustado" para determinar a autenticidade das gravações. A Resemble destaca que os pesquisadores projetaram o Detect-2B para um treinamento eficiente, exigindo menos poder computacional.

Arquitetura de Modelo Aleatória

A arquitetura do modelo utiliza Mamba-SSM ou modelos de estado-espacial, que não dependem de dados estáticos ou padrões repetitivos. Em vez disso, emprega um modelo estocástico, permitindo uma adaptação eficaz a várias condições de áudio. Essa estrutura se destaca em capturar dinâmicas de áudio, funcionando de forma confiável mesmo em gravações de baixa qualidade.

Desempenho Multilíngue Robusto

Para avaliar suas capacidades, a Resemble submeteu o Detect-2B a um conjunto de testes diversificado, incluindo locutores não vistos, áudio deepfake e múltiplas línguas. O modelo identificou com precisão o áudio deepfake em seis idiomas, alcançando pelo menos 93% de precisão.

Integração e Acessibilidade

O Detect-2B estará disponível através de uma API, permitindo uma integração perfeita em várias aplicações. Este lançamento segue o lançamento da plataforma de voz de IA da Resemble, Rapid Voice Cloning, em abril.

Importância da Detecção de Deepfake no Contexto Atual

Com a aproximação das Eleições Presidenciais dos EUA de 2024, a necessidade de identificar vozes e vídeos gerados por IA torna-se cada vez mais crítica. O potencial das vozes geradas por IA de enganar eleitores e disseminar desinformação levanta sérias preocupações, especialmente em relação a deepfakes de figuras públicas. A desinformação na mídia tem corroído a confiança do consumidor, tornando ferramentas como o Detect-2B essenciais para a verificação de conteúdo antes de alcançar o público.

Pesquisa e Desenvolvimento Contínuos

A Resemble reconhece que a jornada na tecnologia de detecção apenas começou. "À medida que as capacidades da IA generativa avançam, nossas tecnologias de detecção também devem progredir. Temos várias direções de pesquisa empolgantes planejadas para aprimorar o DETECT-2B, com foco em aprendizado de representação, arquiteturas de modelo avançadas e expansão de dados," observou a empresa.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles